V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Ewig
V2EX  ›  Python

今日头条的_signature 是不是又修改了 JS 问题 搞不清楚原因 求帮忙

  •  
  •   Ewig · 2019-01-23 00:54:11 +08:00 · 2962 次点击
    这是一个创建于 2157 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在整理爬虫项目的时候发现

    我按照源码穿进去的参数有时候能返回数据,有时候不能返回数据, execjs.compile(_js).call('TAC.sign', "6347006294" +''+ "0") 我这样穿的参数

    返回的有时候是这样

    {"message": "success", "has_more": false, "data": []},

    有时候却能返回正确数据 这到底为啥呢?

    我按照源码 js: 传的三个参数 window.TAC && (t = TAC.sign(userInfo.id + "" + d.params.max_behot_time))

    d.params.max_behot_time = e.next && e.next.max_behot_time || 0))

    这是源码的三个参数,但是 d.params.max_behot_time 这里有这个 next 不知道啥意思,求 解这 max_behot_time 传的是 0 吗?我感觉每次都变化吧????

    网址:

    https://www.toutiao.com/c/user/6347006294/#mid=6350075797

    11 条回复    2019-01-24 16:23:28 +08:00
    Loooom
        1
    Loooom  
       2019-01-23 07:24:21 +08:00
    max_behot_time 是上一次请求返回的,翻页用。 刚刚试了下 10 次请求有一半是不返回正常数据 = =
    Ewig
        2
    Ewig  
    OP
       2019-01-23 10:48:10 +08:00
    @Loooom 这是为啥?
    Ewig
        3
    Ewig  
    OP
       2019-01-23 10:49:44 +08:00
    @Loooom 每次穿的 max_behot_time 到底是不是 0 ?
    Ewig
        4
    Ewig  
    OP
       2019-01-23 11:36:20 +08:00
    @Loooom 我在控制台返回的参数 是每次都可以请求到数据的,为啥这个不行
    Loooom
        5
    Loooom  
       2019-01-23 14:56:43 +08:00
    @Ewig 第一次传 0 默认刷新最新的页面,请求回来 max_behot_time 给第二次请求用就等于翻页了,你试试。返回空我也不知道为什么,是做了什么限制啥的
    xiao38245
        6
    xiao38245  
       2019-01-23 15:53:01 +08:00
    老哥匿名了吗, 上一个没 匿名爬头条的还没出来呢
    Ewig
        7
    Ewig  
    OP
       2019-01-23 15:53:47 +08:00
    @xiao38245 匿名啥意思?
    vaidi
        8
    vaidi  
       2019-01-23 17:25:20 +08:00
    算法改了,这个应该是返回的是第 X 页,填个 10 以内的数字看一下
    Ewig
        9
    Ewig  
    OP
       2019-01-23 18:07:37 +08:00
    @vaidi 这个数字不是随便写吧
    Ewig
        10
    Ewig  
    OP
       2019-01-24 16:21:17 +08:00
    @vaidi 不行,换其他的,不反数据
    Ewig
        11
    Ewig  
    OP
       2019-01-24 16:23:28 +08:00
    看来这个头条破解是无解了啊
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3066 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 13:50 · PVG 21:50 · LAX 05:50 · JFK 08:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.