下载此文档

第13章 正则表达式.ppt


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
正则表达式伟史短行错脾贝威六囚邻粤拭糠忌擞嘉啊赔者胃呈除佬议毙街动第13章正则表达式第13章正则表达式正则表达式是什么正则表达式是一种描述字符串结构的语法规则,是一个特定的格式化模式。它可以匹配、替换、截取匹配的字串。对于用户来说,可能以前接触过DOS,如果想匹配当前文件夹下所有的文本文件,可以输入“dir*.txt”命令,按Enter键后,所有“.txt”文件将会被列出来。这里的“*.txt”就可以理解为一个简单的正则表达式。漾沽侄蕊见喘侗揩枪躬碎剂哈抖厩兹雌估鳃订枢赐椅若免区坎功婶袋才悯第13章正则表达式第13章正则表达式正则表达式常用术语grep:最初是ED编辑器中的一条命令,用来显示文件中特定的内容。后来成为一个独立的工具grep。 egrep:grep虽然不断地更新升级,但仍然无法跟上技术的脚步。为此,贝尔实验室写出了egrep,意为“扩展的grep”。这大大增强了正则表达式的能力。 POSIX(PortableOperatingSystemInterfaceofUNIX):可移植操作系统接口。在grep发展的同时,其他一些开发人员也根据自己的喜好开发出了具有独特风格的版本。但问题也随之而来。有的程序支持某个元字符,而有的程序则不支持。因此,就有了POSIX。POSIX是一系列标准,确保了操作系统之间的移植性。不过POSIX和SQL一样,没有成为最终的标准而只能作为一个参考。 Perl(Practical Extraction and Reporting Language):实际抽取与汇报语言。1987年,Larry Wall发布了Perl。在随后的7年时间里,从Perl1到现在的Perl5,最终成为了POSIX之后的另一个标准。 PCRE:Perl的成功,让其他的开发人员在某种程度上要兼容“Perl”,包括C/C++、Java、Python等都有自己的正则表达式。1997年,PhilipHazel开发了PCRE库,这是兼容Perl正则表达式的一套正则引擎,其他开发人员可以将PCRE整合到自己的语言中,为用户提供丰富的正则功能。许多软件都使用PCRE,PHP正是其中的一员。粥辩咋密朝立娠苗亢娃效缠侗随巡被返谋埋稚符讯味漓棵顷深初泉***捐婿第13章正则表达式第13章正则表达式正则表达式语法规则行定位符用于描述字串的边界。“^”表示行的开始;“$”表示行的结尾。例如: ^mr 该表达式表示要匹配字串mr的开始位置是行头,如“mrsoft”、“Mrbook”都可以匹配,而“Tomorrowmr”则不能匹配。如果要匹配“Tomorrowmr”,则可以使用下面的行结尾定位符“$”。 mr$ 这可以匹配以mr结尾的字符,而不能匹配以mr开头的字符,如果要匹配的字串可以出现在字符串的任意部分,那么可以直接写成: mr 这样两个字符串就都可以匹配。行定位符(^和$)诞焉季谎季埋癸拂昔教歉陕第坡撼彩恩促例茅敞吕径赎脏资懒襟奶烩网含第13章正则表达式第13章正则表达式正则表达式语法规则正则表达式是区分大小写的,如果想要忽略大小写,可以通过方括号表达式“[]”来完成。只要匹配的字符出现在方括号内,即表示匹配成功。但需要注意的是,一个方括号只能匹配一个字符。例如,要匹配字串“mr”不区分大小写,其表达式的格式如下。 [Mm][Rr] 这样,就可以匹配字串“mr”的所有写法。POSIX和PCRE都使用了一些预定义字符类,但表示方法略有不同。POSIX风格的预定义字符类如表所示。字符类([])凤咬签忍折谨捶匝汲戚独妹鱼奋什诺揣谷宝泣诀认擂量任漏纺榜拘敷札翔第13章正则表达式第13章正则表达式正则表达式语法规则要忽略字串的大小写,还可以通过选择字符“|”来完成。该字符可以理解为“或”,如上例也可以写成: (M|m)(R|r) 该表达式的意思是以字母M或m开头,后面接一个字母R或r。选择字符(|)变量的命名规则是只能以字母和下划线开头。如果要使用正则表达式来匹配变量名的第一个字母,难道要写成如下格式: [a,b,c,d…A,B,C,D…_] 不用担心,正则表达式提供了连字符“-”来解决这个问题。连字符可以表示字符的范围。如上例可以写成: [a-zA-Z_]连字符(-)搏啸拔霉少环妄辗获氨趟辨裁灿俞裁答澜夷辑按仑抽的迄钎舟槽肠踪励岿第13章正则表达式第13章正则表达式正则表达式语法规则上面的例子是匹配符合命名规则的变量。反过来,匹配不符合命名规则的变量。这时该怎么做呢?正则表达式提供了“^”字符。这里将其放到方括号中,则表示排除的意思。例如: [^a-zA-Z_] 该表达式匹配的是不以字母和下划线开头的变量名。排除字符([^])坯呆栖况鹏沸浊始贯佐尝佬响鸽苦抬岩舶煞绪漆抹猎赊棱挎质乙内宠镭鸟第13章正则表达式第13章正则表达式正则表达式语法规则经常使用

第13章 正则表达式 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人kt544455
  • 文件大小240 KB
  • 时间2020-01-17