cai72738 最近的时间轴更新
cai72738

cai72738

V2EX 第 160669 号会员,加入于 2016-02-26 13:50:23 +08:00
根据 cai72738 的设置,主题列表只有在你登录之后才可查看
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
cai72738 最近回复了
@Eoss 蟹蟹,那我就继续投,
@lxlgod 上次去智联投,智联把我信息给泄漏了,有阴影
@CodeDoge 加油
@ke1e 多谢鼓励
2016 年 8 月 19 日
回复了 cai72738 创建的主题 Python 自动提取网页内容
@tianshiyeben 大概看了你写的,标题,您好像直接取得 mata 里的 title ,在我这儿行不通。谢谢分享!
2016 年 8 月 19 日
回复了 cai72738 创建的主题 Python 自动提取网页内容
@ambw 那个只有标题和正文,我看源码,看能不能提取出其他信息
2016 年 8 月 19 日
回复了 cai72738 创建的主题 Python 自动提取网页内容
@xhsmile 上千的源,不大可能一个一个写正则。所以就想有没有能自动生成网页对应的正则的库
2016 年 8 月 19 日
回复了 cai72738 创建的主题 Python 自动提取网页内容
@MarcoQin 标准信息源很少,大部分都是不标准的
2016 年 8 月 19 日
回复了 cai72738 创建的主题 Python 自动提取网页内容
@polythene 除了大段正文的提取,那新闻来源和发布时间,也是需要精确匹配出来的。还有最难搞的新闻 URL
@tumb8r 还就真的不一样,而且我现在也就在对每个源写规则,恼死了。
深度马
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2901 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 07:01 · PVG 15:01 · LAX 23:01 · JFK 02:01
♥ Do have faith in what you're doing.