V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
faketemp
V2EX  ›  问与答

正则表达式 关于“非”的问题请教

  •  
  •   faketemp · 2019-11-06 16:44:14 +08:00 · 1153 次点击
    这是一个创建于 1630 天前的主题,其中的信息可能已经有所发展或是发生改变。

    测试文本:helloItsmeaabbhereddeeend

    使用正则“(\w)\1(\w)\2”可以轻易提取“aabb、ddee”这种指定类型的叠词出来

    问题:
    想删除除了“(\w)\1(\w)\2”匹配值以外的任意字符(包括换行符等),正则应如何修改?

    注意: 以上只是举例子,目的不是要提取叠字,只是想学习一下“非 xxx”的正则表达

    6 条回复    2019-11-09 10:47:52 +08:00
    mainjzb
        1
    mainjzb  
       2019-11-06 17:26:11 +08:00
    (?!(\w)\1(\w)\2)(\w\w\w\w)
    ClericPy
        2
    ClericPy  
       2019-11-06 17:30:58 +08:00   ❤️ 1
    想学习就看看零宽断言吧
    前后缀都有 非 的用法

    以前回答过, 直接复制过来看看效果, python


    import re

    # 都存在
    print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如中文不'))
    print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如不'))
    print(re.search(r'^(?=.*中文)(?=.*英语).*$', '不如不'))
    # <re.Match object; span=(0, 7), match='英语不如中文不'>
    # None
    # None
    # 都不存在
    print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如中文不'))
    print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如不'))
    print(re.search(r'^(?!.*中文)(?!.*英语).*$', '不如不'))
    # None
    # None
    # <re.Match object; span=(0, 3), match='不如不'>
    faketemp
        3
    faketemp  
    OP
       2019-11-07 08:56:02 +08:00
    @mainjzb 这样表达是不正确的哦
    (?!(\w)\1(\w)\2)(\w\w\w\w)会得出六组匹配结果
    hell、oIts、meaa、bbhe、redd、eeen

    可以看到既没有跳过 aabb、ddee 叠字,又没有匹配到最后一个字母 d
    faketemp
        4
    faketemp  
    OP
       2019-11-07 08:58:46 +08:00
    @ClericPy 零宽断言基本用法我会
    你写的两断代码 分别为“包含”、“不包含”也能懂

    但是就还是想不出上面那个问题 怎么描述和表达
    烦请指教
    faketemp
        5
    faketemp  
    OP
       2019-11-07 09:02:20 +08:00
    @ClericPy

    这个练习的要求就是
    测试文本:helloItsmeaabbhereddeeend
    结果:aabbddee

    要求不是用正则直接提取 aabbddee,而是要用正则去删除除了四字叠词以外的其他所有字符
    faketemp
        6
    faketemp  
    OP
       2019-11-09 10:47:52 +08:00
    是否有 V 友关注指教下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5437 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 09:01 · PVG 17:01 · LAX 02:01 · JFK 05:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.