正则表达式不仅可以匹配文本,还可以提取信息以进行进一步处理。这是通过定义字符组并使用特殊的括号(和)元字符捕获它们来完成的。一对括号内的任何子模式都将被 捕获为一个组。在实践中,这可用于从各种数据中提取电话号码或电子邮件等信息。
例如,假设您有一个命令行工具来列出您在云中拥有的所有图像文件。然后,您可以使用^(IMG\d+\.png)$之类的模式来捕获和提取完整的文件名,但如果您只想捕获不带扩展名的文件名,则可以使用模式^(IMG\d+) \.png$仅捕获句点之前的部分。
继续尝试使用它来编写一个仅匹配下面 PDF 文件的文件名(不包括扩展名)的正则表达式。