# Python 3.7
body = '<img src="https://tvax2.xximg.cn/crop.0.0.1242.1242.50/?????.jpg?KID=imgbed" alt="头像" class="por" /><img src="https://h5.xximg.cn/upload/2016/05/26/319/5547.gif" alt="达人" />'
re_icon = re.compile(r'src="(.*?)" alt="(?:V|达人)"')
v_icon = re_icon.search(body)
[print(i) for i in v_icon.groups()]
- 请问为什么这么取的时候,返回的是从第一个 src 开始的呢?
- 忽然短路,求点醒。
关于 xpath 和正则
- etree.HTML 这个步骤很费时。
- etree.HTML,re.compile 都不计时,也还是 re 快很多。
- 想把有些能转正则的,用正则处理了。