1
cubelate 2017-10-11 11:57:35 +08:00
有意思,可能是通过判断位置,z-index,大小之类吧。把自己当做浏览器,分析最前面最大块的内容。
|
3
ygger 2017-10-11 20:08:21 +08:00
这是我的一个正文提取器: http://kandouban.top/extractor
|
4
ygger 2017-10-11 20:15:03 +08:00
|