背景: 我们公司是做跨境电商亚马逊的,五个账号,每个账号都在德法意西四个站点开了店铺,有很多产品。我的工作是要搜集各个店铺里合适的产品,把相关信息做成表格,然后发给不同的国家的测评中介。之前都是手动复制粘贴,都是机械劳动。我会使用 Python 和 selenium,所以有个想法,问问大家能不能行。
想法: 用脚本通过店铺的链接进入店铺产品列表页面,点击第一个产品进入详情页,然后从页面获取到标题、价格、asin 等信息,存在 Excel 或者 MySQL 里面。
疑虑: 1.听说亚马逊反爬虫机制很厉害,这个算是爬虫吗?对脚本运行效率没有要求,可以每一步之间强制停一秒。 2.如果能实现的话,只要亚马逊不更改页面布局,后面就不用再维护了吧。
1
127000 2020-04-02 16:33:40 +08:00
|
2
glp664186796 OP @127000 我今天试了试,自动点下一页的时候,浏览器提示“firefox 正在防御社交网站对您的追踪”。看了下记录,之前的追踪数是 0,只有今天有追踪。这是不是亚马逊的防御机制,可能会封我的 ip ?
|
3
127000 2020-04-03 18:57:47 +08:00
52by.com/article/29407#五级风险真实 IP 泄漏之 WebRTC/
|