目前我是看网页源码找几个最近的标签试出来唯一性的,当然如果标签一些属性唯一还好说,不然就得多试几个,或者叠加搜索。
chrome 倒是带了复制元素选择器 /XPath ,但是 bs 好像还不支持直接使用,有谁有啥好的解决办法么?
chrome 倒是带了复制元素选择器 /XPath ,但是 bs 好像还不支持直接使用,有谁有啥好的解决办法么?
1
ty89 Dec 29, 2016 lxml 支持 xpath ,解析的效率也比 BS 高不少。
|
2
geew Dec 29, 2016 pyquery
|
3
enenaaa Dec 29, 2016 select('body > div > div > ul > li > span[class="cls1"]') 这样?
|
5
Lonely Dec 29, 2016 生成 BS 对象时选择 lxml ,不要用默认的
|
6
cyrbuzz Dec 29, 2016 bs 支持 css 语法吧,在 firefox 里复制唯一选择器(大部分情况下比 chrome 获取的短一些)。
把这个直接用 select 方法就可以获取到了。 用 html.parser 解析就可以。 |
8
zhangsen1992 Dec 30, 2016
xpath lxml 最快
|