当前位置: 首页 > news >正文

一个前端正则校验引发的问题

最近在一个项目上线的时候遇到一个奇葩的问题,用户登录使用邮箱登录,邮箱前端有合法正则校验,快要发布上线时,测试提到一个bug,在暴力测试邮箱输入框内快速输入字符,前端校验提示报错,到了一定长度导致页面卡死。期初怀疑是因为快速输入导致双向绑定卡顿,但是又一想不可能呀,这中双向绑定在vue下早就实现了,怎么可能又这个问题。

尝试取消双向绑定,然后使用@input事件配合debounce去实现,但是发现快速输入依然卡顿。

接着尝试去掉校验,没有问题,加上校验就有问题,所以就开始排查正则校验规则,结果还真实正则校验的问题。

1 正则校验的问题

在表单校验时,不可使用过度消耗配置的正则表达式,由于正则校验消耗,导致页面卡顿。

来看我们原来的校验规则:

/^(\w+[-|\.]?)+\w@(\w+(-\w+)*\.)+[a-zA-Z]{2,}$/

我们来看这个正则的问题。

1.1 回溯问题

用户名部分​ (\w+[-|\.]?)+
内层 \w+ 和外层 + 形成嵌套量词结构,如 (a+)+
当输入结尾字符不匹配时,如 user-@domain.com,引擎会尝试所有可能的 \w+ 和分隔符组合,回溯路径呈指数增长

域名部分​ (\w+(-\w+)*\.)+
双重嵌套 (\w+ (-\w+)* )+ 导致回溯爆炸,尤其当域名含多个连字符时(如 @sub--domain.com)

1.2 冗余捕获组与歧义语法

捕获组 (...) 会存储匹配内容,而此处无需捕获子匹配,造成额外开销。
字符类 [-|\.]? 中的 | 被误解为字面竖线(实际应为 [.-]),增加匹配复杂度

1.3 回溯攻击敏感结构

对无效输入(如 a@b.c 或 name@-invalid.com)的匹配尝试会触发悲观回溯,引擎需穷举所有失败路径才能返回 false

1.4 性能影响示例

假设输入邮箱: ​**"ab@x"**​(故意缩短域名部分)
引擎执行过程:

  1. 用户名部分尝试 (\w+[-|\.]?)+ 的所有分割组合:
    "a""a-""a.""ab""ab-"...(指数级尝试)
  2. 域名部分因 [a-zA-Z]{2,} 要求至少2个字母,但 "x" 长度不足,再次触发回溯。
    结果​:单次验证可能产生 ​**>10,000 次回溯**,阻塞 JS 主线程

看到这个示例,是不是感觉这可能就是一个“惨案”呢。

2 正确的正则

写一个正确的正则,提高效率,减少在用户快速输入过程中程序消耗。

2.1 消除回溯

// 优化后正则(零回溯,性能提升5倍+)

/^\w+(?:[.-]\w+)*@(?:\w+-)*\w+\.[a-zA-Z]{2,}$/;

2.1.1 重构嵌套量词

\w+(?:[.-]\w+)* 替代 (\w+[-|\.]?)+
非捕获组 (?:) 消除存储开销,明确分隔符逻辑:[.-] 匹配 . 或 -(无歧义)

(?:\w+-)*\w+\. 替代 (\w+(-\w+)*\.)+

合并相邻 \w+,避免空子匹配(如 @-domain.com 直接失败)

/^[\w.+-]+@(?:\w+(?:-\w+)*\.)+[a-zA-Z]{2,}$/

2.1.2 锚点精准控制​

保留 ^ 和 $ 确保快速失败,避免部分匹配尝试

2.1.3 域名简化匹配​

\.[a-zA-Z]{2,}$ 精确匹配顶级域名,减少冗余检查

3 优化后的正则

/^\w+(?:[.-]\w+)*@(?:\w+-)*\w+\.[a-zA-Z]{2,}$/

优化后性能对比

由以上解释,明白了这其中正则配置不合理导致的性能消耗和最后页面卡顿的罪魁祸首。当然为了提高前端正则校验的效率可能会放弃某些严格场合,所以还要配合后端,在整体提交时,后端再做一次校验。

 

http://www.xdnf.cn/news/1037089.html

相关文章:

  • 马上行计划管理后端架构
  • 深度分析Javascript中的Promise
  • 动态多目标进化算法:基于迁移学习的动态多目标遗传算法Tr-NSGA-II求解CEC2015,提供完整MATLAB代码
  • python基础与数据类型
  • C# 枚 举(枚举)
  • Python Day51
  • pyspark非安装使用graphframes
  • PHP+mysql雪里开轻量级报修系统 V1.0Beta
  • Laravel 从版本 5 到 12 每个版本都引入了一些新的特性、改进和弃用的功能
  • rt-thread的定时器驱动(裸机版本)记录.
  • Flutter JSON解析全攻略:使用json_serializable实现高效序列化
  • java设计模式[1]之设计模式概览
  • 免费电子印章生成工具,可在线设计印章
  • TLSF 内存分配器
  • 通达信跟老庄追涨停指标公式
  • 【大模型分布式训练】多卡解决单卡训练内存不足的问题
  • Python学习笔记面向对象编程
  • Python 中的 `lru_cache` 详解
  • 固件签名技术深度解析:HSM模块如何守护设备安全,CAS系统如何赋能产业升级
  • pytest的装饰器`pytest.mark.parametrize` 和 `@pytest.mark.smoke`区别
  • 中国电信天翼物联学习总结笔记:线上生成模型
  • 未来行业发展趋向
  • JavaScript 事件循环
  • 19 - SAFM模块
  • 27 - ASPP模块
  • 【redis——缓存雪崩(Cache Avalanche)】
  • 专注于PLC数据采集MES交互解决方案
  • 位运算详解之异或运算的奇妙操作
  • docker安装mysql数据库及简单使用
  • 鸿蒙NEXT-Data类型数据通过AppStore获取后找原本一样的数据(值一样)但是比较结果却为false