上海Python培训
达内上海Python培训中心

15026646813

热门课程

Python入门:正则表达式

  • 时间:2017-11-10 11:00
  • 发布:上海python培训
  • 来源:Python教程

数量词的贪婪模式与非贪婪模式

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字 符;非贪婪的则相反,总是尝试匹配尽可能少的字符。上海Python培训举例:正则表达式”ab*”如果用于查找”abbbc”,将找到”abbb”。而如果使用非贪婪的数量 词”ab*?”,将找到”a”。

上海Python培训提醒:一般使用非贪婪模式来提取。

反斜杠问题

与大多数编程语言相 同,正则表达式里使用”\”作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符”\”,那么使用编程语言表示的正则表达式里将需要4个反 斜杠”\\\\”:前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。

Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r”\\”表示。同样,匹配一个数字的”\\d”可以写成r”\d”。

这是Python爬虫入门基础知识,在学习Python爬虫时,了解正则表达式也非常有必要。

上海Python培训机构】达内每天都会分享一些新知识,点击下方二维码就可以领取免费学习机会

上一篇:上海Python培训专家推荐:爬虫框架Scrapy
下一篇:URLError异常处理及http状态码

上海Python培训教你简单的网页爬虫方法

上海Python培训:什么是pymysql

上海Python培训:Python实现注册登录系统

Python和Java开发你应该选择哪个?

选择城市和中心
贵州省

广西省

海南省

免费学习5天VIP课程