V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ghy459
V2EX  ›  正则表达式

请教一个用正则匹配 URL 的问题

  •  
  •   ghy459 · 2015-02-12 22:20:58 +08:00 · 1664 次点击
    这是一个创建于 3357 天前的主题,其中的信息可能已经有所发展或是发生改变。
    手上有一批网站的访问记录,一行一个URL,如:

    http://www.abc.com/add/?c=1&token=aaaa
    http://www.abc.com/del/?c=1&token=aaaa
    http://www.abc.com/edit/?c=1&token=aaaa
    http://www.abc.com/move/?c=1&token=aaaa

    请问如何通过正则匹配出 包含token,且token前面不包含edit和move 的URL?
    想过用 ^http.*(?<!edit|move).*token.*$ ,但貌似达不到想要的效果。
    各路大牛请指点一下,thanks~
    3 条回复    2015-02-12 23:16:41 +08:00
    wusuopuBUPT
        1
    wusuopuBUPT  
       2015-02-12 22:44:22 +08:00
    cat test.txt | grep -vE 'edit|move' | grep "&token"
    spance
        2
    spance  
       2015-02-12 22:58:37 +08:00
    (?=token=)([^&\s]+)
    正则group 1提取
    zyxfsky
        3
    zyxfsky  
       2015-02-12 23:16:41 +08:00
    ```
    http:\/\/[^\/]*\/([^\/]*(?<!(edit|move)))\/\?.*token=.*
    ```
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4720 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 10:04 · PVG 18:04 · LAX 03:04 · JFK 06:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.