返回

第十六章《正则表达式》第4节:Matcher类

发布时间:2023-05-07 09:06:32 229
# java# java# 数据

​16.3小节所介绍的Pattern类代表了正则表达式,它的功能不是很强,如果程序员想用正则表达式完成替换等更复杂的操作,必须使Matcher类。Matcher类也位于java.util.regex包下,使用这个类时需要用import关键字进行引入。

Java语言的官方文档把Matcher类解释为执行匹配操作的引擎,但这个解释过于抽象,不好理解。为方便读者理解,可以把Matcher类比喻成一个智能机器人,这个机器人手里拿着一个正则表达式,脚下是一个字符串。它拿着正则表达式,在脚下字符串上来回的移动,寻找能够与表达式相匹配的目标字符串。当机器人找到了目标字符串以后,可以做很多操作,例如替换操作等。需要说明:智能机器人手中拿着的正则表达式实际上就是一个Pattern类的对象,而它脚下是字符串既可以是String类对象,也可以是StringBuffer类和StringBuilder类对象。本小节将详细讲解Matcher类的使用。​

16.4.1 Matcher类的匹配方法

Matcher类的构造方法不是公开的,所以程序员不能直接通过new关键字创建它的对象。创建Matcher类对象需要调用Pattern对象的matcher()方法来完成,例如:​

String str = "1a";
Pattern p = Pattern.compile("\\d\\w");
Matcher m = p.matcher(str);

从以上代码可以看到:matcher()方法的参数是一个字符串,这个字符串就是智能机器人脚下的那个字符串,所创建出的Mather类对象就会从这个字符串中完成搜索,而Pattern对象p就是智能机器人手中拿着的那个正则表达式。​

Matcher类中提供了一些用于匹配目标字符串的方法,如表16-6所示。​

表16-6 Matcher类的匹配方法​

方法

功能

boolean matches()

测试字符串整体能否与正则表达式相匹配

boolean lookingAt()

测试字符串是不是以正则表达式所定义的结构开头

boolean find()

搜索下一个目标字符串,如能找到返回true,否则返回false

public boolean find(int start)

索引为start的位置开始搜索目标字符串

public String group()

获得当前匹配项整体,必须在已经找到目标字符串的情况下执行此方法才有意义,否则会抛出异常

String group(int group)

获得当前匹配项中编号为group的组中的内容,必须在已经找到目标字符串的情况下执行此方法才有意义,否则会抛出异常

String start()

获得当前匹配项内容在整体字符串中的起始位置

String start(int group)

获得当前匹配项中第group组的内容在整体字符串中的起始位置

String end()

获得当前匹配项的内容最后一个字符在整体字符串中的位置+1

String end(int group)

获得当前匹配项中第group组的内容在整体字符串中的位置+1

int groupCount()

获得正则表达式中分组的个数

在表16-6所列出的这些方法中,最核心的就是find()方法。如果字符串中存在能够与正则表达式匹配的目标字符串,那么find()方法能够让智能机器人移动到这个目标字符串上,只有移动到目标字符串上,才能调用group()、start()、end()这些方法来获得这个目标字符串以及它的各项数据。而如果希望智能机器人回到初始位置,只要调用Matcher类的reset()方法就能完成。​

下面的【例16_16】展示了Matcher类匹配方法的使用。​

【例16_16 Matcher类的匹配方法】

Exam16_16.java​

import java.util.regex.*;
public class Exam16_16 {
public static void main(String[] args) {
String str = "abbaqwecddc";//str就是机器人脚下的字符串
String reg = "(.)(.)\\2\\1";//表示4个字符且左右对称的结构
Pattern p = Pattern.compile(reg);//p就是机器人手里的正则表达式
Matcher m = p.matcher(str);//m就是智能机器人
System.out.println("正则表达式中分组的个数:"+m.groupCount());
System.out.println("str整体是否匹配正则表达:"+m.matches());
int i=1;
while (m.find()){//搜索能够匹配的目标字符串
System.out.println("找到了第"+i+"个目标字符串!");
System.out.println("目标字符串是:"+m.group());
System.out.println("目标字符串中第一组的内容是:"+m.group(1));
System.out.println("目标字符串在str中的位置:"+m.start());
System.out.println("目标字符串最后一个字符在str中的位置"+(m.end()-1));
i++;
}
}
}

【例16_16】的运行结果如图16-16所示。​

第十六章《正则表达式》第4节:Matcher类_Matcher

图16-16【例16_16】运行结果​

从图16-16可以看出:只有find()方法找到了符合匹配条件的目标字符串,才能调用group()、start()、end()这些方法来获得这个目标字符串以及它的各项数据。​

16.4.2 Matcher类的替换方法

Matcher类不仅仅能够在字符串中找到匹配项,还能够把这些匹配项替换成某个字符串,完成替换操作需要用到Matcher类的替换方法,这些替换方法如表16-7所示。​

表16-7 Matcher类的替换方法​

方法

功能

String replaceFirst(String rep)

把字符串中第一个匹配项替换为rep并返回替换后的字符串

String replaceAll (String rep)

把字符串中所有匹配项替换为rep,并返回替换后的字符串

Matcher appendReplacement

(StringBuffer sb, String rep)

把当前匹配项替换为rep,之后把当前匹配项替换rep,并且把rep及其前面的内容统统添加到sb的末尾,之前添加过的内容不会重复添加

StringBuffer appendTail(StringBuffer sb)

把最后一次被替换目标字符串后面的部分添加到sb中。

Matcher类的这些替换方法中,appendReplacement()方法也需要先调用find()方法找到一个匹配项,然后才能执行。下面的【例16_17】展示了replaceFirst()和replaceAll ()方法的作用和效果。​

【例16_17 Matcher类的替换方法1】

Exam16_17.java​

import java.util.regex.*;
public class Exam16_17 {
public static void main(String[] args) {
String str = "xyzabbauvwcddc";
String reg = "(.)(.)\\2\\1";//正则表达式定义了4字符对称结构
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(str);
//替换第一个对称字符串
String replace1 = m.replaceFirst("*");
System.out.println(replace1);
//替换所有的对称字符串
String replace2 = m.replaceAll("*");
System.out.println(replace2);
}
}

【例16_17】的运行结果如图16-17所示。​

第十六章《正则表达式》第4节:Matcher类_Matcher_02

图16-17【例16_17】运行结果​

replaceAll ()方法只能把满足匹配条件的目标字符串全部进行替换,如果希望把第1、3、5、7...等奇数号的目标字符串进行替换,就必须使用appendReplacement()和appendTail()方法实现,下面的【例16_18】展示了appendReplacement()和appendTail()方法的作用和效果。​

【例16_18 Matcher类的替换方法2】

Exam16_18.java​

import java.util.regex.*;
public class Exam16_18 {
public static void main(String[] args) {
String str = "123456789xyz";
String reg = "\\d";
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(str);
int i=0;
StringBuffer sb = new StringBuffer();
while (m.find()){//持续搜索目标字符串
if(++i%2==1){//仅有奇数号的目标字符串被替换
//替换后把前面的部分加入sb末尾
m.appendReplacement(sb,"*");
}
}
//把最后一次被替换的目标字符串后面的部分添加到sb中
m.appendTail(sb);
System.out.println(sb);
}
}

【例16_18】的运行结果如图16-18所示。​

第十六章《正则表达式》第4节:Matcher类_Pattern_03

图16-18【例16_18】运行结果​

从图16-18可以看出:只有奇数号的目标字符串被替换为*。​

16.4.3设置Matcher搜索范围

Matcher的find()方法能够从整个字符串中进行搜索,如果希望对find()方法设置一个搜索范围,可以调用Matcher类的region()方法实现。region()方法的原型如下:​

Matcher region(int start, int end)

region()方法的有两个参数,分别是start和end,它们表示要在下标为[start,end)的范围内进行搜索。需要注意:region()方法所设置的搜索范围仅能影响到find()方法,不会影响到replaceAll()方法的执行效果。下面的【例16_19】展示了region()方法的作用和效果。​

【例16_19 设置搜索范围】

Exam16_19.java​

import java.util.regex.*;
public class Exam16_19 {
public static void main(String[] args) {
String str = "0123456789";
Pattern p = Pattern.compile("\\d");//目标字符串是数字
Matcher m = p.matcher(str);
m.region(2,6);
System.out.print("find()方法找到的所有目标字符:");
while (m.find()){//持续搜索目标字符串
System.out.print(m.group());//打印搜索到的目标字符串
}
System.out.println();//换行
String replace = m.replaceAll("*");
System.out.println("把str中所有数字替换为*:"+replace);
}
}

【例16_19】的运行结果如图16-19所示。​

第十六章《正则表达式》第4节:Matcher类_Java_04

图16-19【例16_19】运行结果​

从图16-19可以看出:虽然设置了搜索范围,但并不影响replaceAll()方法把全部数字替换为“*”。​

本文字版教程还配有更详细的视频讲解,小伙伴们可以​​点击这里​​观看。

特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(0)
按点赞数排序
用户头像
精选文章
thumb 中国研究员首次曝光美国国安局顶级后门—“方程式组织”
thumb 俄乌线上战争,网络攻击弥漫着数字硝烟
thumb 从网络安全角度了解俄罗斯入侵乌克兰的相关事件时间线