当前位置: 首页 > ds >正文

正则表达式,字符串的搜索与替换

对于常规的print("\\\\")输出只会进行一次转义,即输出结果就是 \\
因为一个\\代表 \
但对于re.search()。其输入的参数会被转化为正则表达式,
re.search(“\\\\”,)其中的参数被看作“\”正则表达式
re的第一个参数是正则表达式,第二个参数是字符串。

下面给一个为什么要第一个参数是正则表达式,而不是想搜索的字符串

 

你问为什么 re.search 的第一个参数必须被当作正则表达式来处理,而不是和第二个参数一样被当作普通字符串。

原因在于:re.search 的设计目的就是为了实现“正则表达式”这个功能。

1. 函数的“约定”

每个函数都有它自己的“约定”或“合同”。当程序员调用一个函数时,他们需要遵循这个约定,并传入符合要求的参数。

re.search(pattern, string) 的约定是:

  • pattern (第一个参数): 我(re.search)会把这个参数当成正则表达式模式来处理。

  • string (第二个参数): 我会把这个参数当成普通字符串数据来处理。

如果你不遵循这个约定,函数就无法正常工作。

2. 为什么不能都当作普通字符串?

如果你将两个参数都当作普通字符串,那么 re.search 就失去了它作为“正则表达式引擎”的意义,它就退化成了一个简单的字符串查找函数,和 Python 内置的 string.find()string.index() 一样。

比如,你想用 re.search 找到一个数字 \d。如果它把 \d 当作普通字符串,它就只会去寻找字面量 \d,而永远找不到数字。

3. 命名约定

这也是为什么 re.search 的参数名是 patternstring

  • pattern 这个词本身就暗示它是一个模式。

  • string 则表示它是一个普通的数据字符串。


例子:string.find() vs. re.search()

为了更好地理解这一点,我们来比较一下 Python 内置的两种查找方法:

text = "The quick brown fox jumped over 123 dogs."# 使用普通的字符串查找方法
print(text.find("fox"))  # 输出: 16 (找到'fox'的索引)
print(text.find("\d"))  # 输出: -1 (因为找不到字面量"\d")# 使用正则表达式查找方法
import re
print(re.search(r"fox", text).group())  # 输出: 'fox'
print(re.search(r"\d", text).group())   # 输出: '1' (找到第一个数字)

在这个例子中,text.find() 只能进行字面量匹配,因为它将两个参数都视为普通字符串。

re.search() 知道它的第一个参数是模式,所以它能理解 \d 的特殊含义,并找到数字。

所以,第一个参数被当作正则表达式来解析,是因为这就是 re.search 函数的全部意义所在。

http://www.xdnf.cn/news/20151.html

相关文章:

  • 【面试题】介绍一下BERT和GPT的训练方式区别?
  • Ansible 项目管理核心要点总结
  • 进程与线程详解, IPC通信与RPC通信对比,Linux前台与后台作业
  • Android入门到实战(八):从发现页到详情页——跳转、传值与RecyclerView多类型布局
  • 深度学习——ResNet 卷积神经网络
  • Python快速入门专业版(二):print 函数深度解析:不止于打印字符串(含10+实用案例)
  • Docker多阶段构建Maven项目
  • K8s资源管理:高效管控CPU与内存
  • React学习之路永无止境:下一步,去向何方?
  • Jmeter基础教程详解
  • STM32H750 RTC介绍及应用
  • 国产GEO工具哪家强?巨推集团、SEO研究协会网、业界科技三强对比
  • 用C++实现日期类
  • upload-labs通关笔记-第17关文件上传关卡之二次渲染jpg格式
  • 关于如何在PostgreSQL中调整数据库参数和配置的综合指南
  • Vue基础知识-脚手架开发-子传父(props回调函数实现和自定义事件实现)
  • Win11 解决访问网站525 问题 .
  • 【RK3576】【Android14】如何在Android kernel-6.1 的版本中添加一个ko驱动并编译出来?
  • Django 常用功能完全指南:从核心基础到高级实战
  • [光学原理与应用-401]:设计 - 深紫外皮秒脉冲激光器 - 元件 - 布拉格衍射在深紫外皮秒声光调制器(AOM)中的核心作用与系统实现
  • 小程序:12亿用户的入口,企业数字化的先锋军
  • Linux编程——网络编程(UDP)
  • 计算机网络模型入门指南:分层原理与各层作用
  • 对接旅游行业安全需求:旅游安全急救实训室的功能构建与育人目标
  • 网络安全初级-渗透测试
  • 用AI做TikTok影视解说,全流程全自动成片,不懂外语也能做全球矩阵!
  • 办公任务分发项目 laravel vue mysql 第一章:核心功能构建 API
  • 系统越拆越乱?你可能误解了微服务的本质!
  • 【Linux系统】线程同步
  • 正则表达式与转义符的区别。注意输入的东西经过了一次转义,一次正则表达式。\\转义是单斜杠\\在正则表达式也是单斜杠所以\\\\经过两道门才是字符单斜杠