求一个正则表达式，获取不是标准的 url 的字段...

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1812 天前的主题，其中的信息可能已经有所发展或是发生改变。

如:

'<img align="absmiddle" src="/cache/images/img/67728.jpg"/>'
'<img align="absmiddle" src="/cache/images/img/clound.png"/>'
'<img align="absmiddle" src="/cache/images/img/sky.gif"/>'

获取 67728,clound,sky 字段，
网上找到的例子都是根据标准的 http://开头的，一开始自己拿改来改去 work 得不正常...
后来自己写了个逐层剥离找出字段的，能 work，但是量大就略显速度上不来，想看看正则的姿势看看效率怎么样的...

5 条回复 • 2020-01-31 19:12:21 +08:00

ysc3839

2020-01-31 16:58:27 +08:00 via Android

如果数据都是这样工整的话
\/([^\/]+?)\..+"

否则还是建议解析 xml 然后文本搜索。

sneezry

2020-01-31 17:13:58 +08:00 via iPhone

/src=".*?\/(.*?)\.[^\.]+"/ 试一下这个

xycool

2020-01-31 17:23:43 +08:00

src\s*=\s*"(.+?)"

2wex

2020-01-31 17:24:15 +08:00

如果 img 是固定的，对 img 反向肯定预查可以吗

(?<=img\/)[\w\.]+"

autoxbc

2020-01-31 19:12:21 +08:00

有现成的轮子(DOMParser & URI.js)可以解析，自己写正则是埋 bug