Perl正则表达式中如何匹配开头和结尾

发布时间：2025-12-12 01:21:07 阅读：142 次

行首和行尾的锚点符号

在处理文本时，经常需要判断某一行是不是以特定内容开始或结束。比如检查日志文件里是否有错误信息以「ERROR」开头，或者确认每行配置是否以分号结尾。这时候 Perl 正则里的开头和结尾锚点就派上用场了。

Perl 正则中，^ 表示匹配行的开始位置，$ 表示匹配行的结束位置。它们不匹配具体字符，而是匹配位置。例如，^Hello 会匹配所有以 Hello 开头的行，而 world$ 则匹配以 world 结尾的行。

if ($line =~ /^ERROR/) {
    print "发现错误行：" . $line;
}

上面这段代码会判断变量 $line 是否以 ERROR 开头，常用于日志分析脚本中。

假设你正在写一个脚本清理用户提交的数据，要求每一行必须是一个完整的 URL，且不能有前后空格。这时候可以用 ^ 和 $ 确保整个字符串完全匹配模式。

if ($url =~ /^https?:\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,}/) {
    print "有效URL";
} else {
    print "无效格式";
}

这里虽然没有显式写 $，但在实际使用中如果想确保后面没有多余字符，比如换行或空格，应该加上 $ 来严格匹配结尾。

当处理包含多行的字符串时，^ 和 $ 默认只匹配整个字符串的开头和结尾。但如果加上 m 修饰符，它们就会变成每行的行首和行尾都进行匹配。

$text = "apple\norange\nbanana\n";
if ($text =~ /^orange$/m) {
    print "找到了单独的一行 orange";
}

这个例子中，因为用了 /m 修饰符，^orange$ 能成功匹配第二行，否则无法命中。

如果你只想匹配整个文本的最开始或最后结束，可以使用 \A 和 \Z。\A 只匹配字符串最开头，\Z 匹配字符串末尾（允许末尾有换行），它们不受多行模式影响。

$data = "start\none\ntwo\nend\n";
if ($data =~ /\Astart/) {
    print "数据确实从start开始";
}

这种写法比 ^ 更严格，适合做格式校验类的任务。