V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
1878098612
V2EX  ›  程序员

新手爬虫 遇到不知道的编码.。

  •  
  •   1878098612 · 2020-04-04 09:06:55 +08:00 · 5387 次点击
    这是一个创建于 1690 天前的主题,其中的信息可能已经有所发展或是发生改变。
    请问各位大佬这大概是什么编码?

    {"string":"U2FsdGVkX187tAj1GclNrzm469ylx4yA0hBNQR7aWzrIk9cII1HvsNMyoyRp9kfFVhweZervXCBFINGIF9z6miwIXlB5qlx1jSdhmNMStOJRh7TaDRVIEGWiJQazmFrWlH3zIlmiljdDSdmcHBiDkml53DZV+NNE3mRVLpLWUeh935dbhjDIA26+9d9Knk2FOzrmmWkcO4SqcFUDwFcc4o5gAoa0B70gygCcQhFFZkWaGcKtf14QI42shTVyFFhXhG723+BsRcxS4enanouwRqqt7EM/FTOXDesHUiHD14WJqcuk01s/qNUpse9QOAKSBr+oNTtSXf4jJiBgalccMHPvdlA72bZP5AREVuNeUNfWhn1ymX6MMAkv2itQTPSpO4D7PAYz/nxNKw1NNBhsW1kwiLeaLMVvxtlgjyWxVZhvYtPcDAGZg9qUj+IdI2Isibr9mwfoSwXmSRIHpXskw4C5dEQa/YwViFEZXCkmn6J9uCmyl5q/G1uTj3oDvbhFjHWH7kinio/lUiRJKDBsKDqjoeJu0aaESDCPsOYeb0t6RHIyBE5AjFjC/5Kve5Yn+HeeJ+y7AJrwel5ZuZHDrRyrq3lLlsG/3UUtUYn9nGJHPv6I73WW75vQljddrjEjRl1Dhg/oOWIKY0wlxzLZjSROwYUkTedSqnlBmPrZEVNnKzbGBna//fpakK6Pl6oZ1uSm66jDAoMkKoVpi7QwPhhQiVQBuiz0YKVheNVo/7+sAWPuOKM1hF/BjogJ4qWwFZ4Q4qseKWlYZiblMsBnECkowHNRUU+G7QH2pQdv/K6sNgbOJ5TvhlTorzrfApG3jOJPtaralE+Q/+WUO/7SDhSOMHecNyaoQAwRqYNf3fgQtm578K7qdhZmY7gkVY2EjNbS6X6qubcpgfneVjCw3wHIVLmR26ALxJg9X7v51aJjrOt7e8VvB13vLmYNzEijTvFL+gz0m617XtGSHn17nS2F0Pxvml5MZOi9E4/s33mDzJy9bOmMRPaHebBd7UaB7KntYS3cQkUB0xCR/0nZJhvxe/qjOElp4X87aY6Ivl2H/Q9Ivdk+dZcF3qf5sSQGuk5U/0+TOwqPv7Qw8j+mnZwrK/Bu5TYUFAVhlu0UBk+VEMIxXI6VIUT5tnfq4m+k8GDgeizWleM9dlpW2HoLulKiXHEN6IbOUNrUyjlBSFOmNIFcy0YYfB6Ja2bzxeThcRE+y+8WaKkAEow3CKZIYuZ5wb53GvDC3IKzIol49EkmJw8Puxr3oZmFE1UrsZZ64+LwaXgQna+ns/1qYH4MNtTaqqbpFUxqk8pcIjGtrp6cc8XcWa4KNThEwQEwv6UCaPwkMz2D+AHibVcpUFeYKfMuPIq488tbzQL7PYsiGS5dK5AvmhqL5JNMo4FYodYho1gRlC6a1AUyxHLZHgo02UY+7slsyBJf2wSaPIpsVAIZ0YJ8Qmxjxl6ZRCSNl6uQtuoGlVnB0Ybn74ovmC6F+mWUHN8rSCK+07+nYKW7zIUqtHivQmXy1oxFaA4wrOvWiv3HRjGt9ncHARBE+CPRprstYv........
    31 条回复    2020-04-05 13:47:26 +08:00
    renmu
        2
    renmu  
       2020-04-04 09:32:11 +08:00 via Android
    debug 打断点找加密方式
    yukiloh
        3
    yukiloh  
       2020-04-04 09:52:29 +08:00 via Android
    @renmu 你好骚啊,js 怎么断的,我是主后端 java 的,前段遇到比如 vue 的问题都不会打断点
    jazzychai
        4
    jazzychai  
       2020-04-04 10:06:28 +08:00
    @yukiloh debugger;
    tlday
        5
    tlday  
       2020-04-04 10:06:30 +08:00
    看起来是 base64 或者 base64 的变种
    tlday
        6
    tlday  
       2020-04-04 10:23:05 +08:00
    用 base64 解码出来前 8 个字符是"Salted__",后面是乱码,看域名这是别人 app 的接口,你应该也没办法打断点什么的。技术上我觉得你尝试反编译 app 代码方便些。实操上我不提供任何实质建议。毕竟爬虫写得好,xxxxx 。
    also24
        7
    also24  
       2020-04-04 10:26:01 +08:00
    input2output
        8
    input2output  
       2020-04-04 10:29:25 +08:00
    @tlday #6
    这个和 AES 加盐后的结果差不多
    justin2018
        9
    justin2018  
       2020-04-04 10:33:53 +08:00
    对 app 进行逆向 😅
    gargar
        10
    gargar  
       2020-04-04 11:35:37 +08:00
    好人一生平安
    yanwen
        11
    yanwen  
       2020-04-04 11:40:27 +08:00
    这个数据好像是异步加载进来的。

    https://i.loli.net/2020/04/04/fW86425jSXQrCHb.png
    Hconk
        12
    Hconk  
       2020-04-04 12:29:00 +08:00 via iPhone   ❤️ 3
    这是什么奇奇怪怪的网站,我反正什么都没看到。
    tlday
        13
    tlday  
       2020-04-04 12:38:17 +08:00
    @justin2018 之前只打域名,等了半天没打开,还以为是个没有网站的 app 后台,楼上发了图才发现是有实际网站的。那就看 js 呗。
    craiiz
        14
    craiiz  
       2020-04-04 12:49:52 +08:00
    好人一生平安
    awen233333
        15
    awen233333  
       2020-04-04 14:09:08 +08:00 via iPhone
    这个网站有点奇怪啊!我闭上了眼睛👀!我什么都没看到!
    samuel
        16
    samuel  
       2020-04-04 14:22:16 +08:00
    好奇怪的网站,不敢多看
    wslsq
        17
    wslsq  
       2020-04-04 14:23:02 +08:00
    AES,在 js 里找密钥。。。我居然爬过这个网站
    kasper4649
        18
    kasper4649  
       2020-04-04 14:24:33 +08:00
    这网站优秀....。
    kile
        19
    kile  
       2020-04-04 14:36:32 +08:00
    @yanwen 这是啥工具?能看到异步加载的东西?
    cmdOptionKana
        20
    cmdOptionKana  
       2020-04-04 15:22:30 +08:00
    楼主,下次有疑问记得一定要来发贴!
    yanwen
        21
    yanwen  
       2020-04-04 16:01:34 +08:00
    @yanwen 浏览器 F12 就可以
    crab
        22
    crab  
       2020-04-04 16:27:05 +08:00
    e = U2FsdGVkX187tAj1GclNrzm469ylx4y
    CryptoJS.AES.decrypt(e, "gefdzfdef")
    raycool
        23
    raycool  
       2020-04-04 16:31:54 +08:00
    这是来问问题的还是来开车的?
    locoz
        24
    locoz  
       2020-04-04 17:57:29 +08:00   ❤️ 11
    好快的车速...

    新手的话,浏览器开发者工具了解一下?只用一分钟就可以搞定这种简单的措施了。步骤如下:
    1 、XHR 断点设置为接口地址 https://yinjaixxx.epio.app/api/articles
    2 、刷新页面等待断点断下来,断的位置会是发起请求前
    3 、单步运行往下跟,就能看到返回 response 后处理的部分了
    4 、再往下跟你应该就会看到格式化 https://yinjaixxx.epio.app/index.js 的代码后,里面 3846 行左右的 AES 解密部分 CryptoJS.AES.decrypt(e, "gefdzfdef")
    5 、从代码上可以看出参数中的 e 是 response 的 body 部分,另外一个显然是个密钥,直接照抄一份就可以了


    下次有疑问记得一定要来发贴!
    woncode
        25
    woncode  
       2020-04-04 18:06:41 +08:00 via Android
    @locoz 之前只会在 source 面板里打断点,原来还可以为 xhr 打断点,实在 network 面板里操作吗
    CoCoCorina
        26
    CoCoCorina  
       2020-04-04 18:10:53 +08:00
    好人一生平安。。。。。。。。。。
    locoz
        27
    locoz  
       2020-04-04 18:23:15 +08:00
    @woncode #25 搜“浏览器开发者工具”可以搜到很多相关文档,直接看文档就好了,还有很多别的有用的功能
    1878098612
        28
    1878098612  
    OP
       2020-04-04 18:31:01 +08:00
    @locoz 谢谢,好的
    zsdroid
        29
    zsdroid  
       2020-04-04 18:53:17 +08:00
    FINDNOMORE
        30
    FINDNOMORE  
       2020-04-05 09:13:40 +08:00
    @locoz 设置断点,刷新还是直接返回文本。试了一下其他网站,倒是可以停在断点处,很迷
    locoz
        31
    locoz  
       2020-04-05 13:47:26 +08:00
    @FINDNOMORE #30 你断点没设对吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5384 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 07:18 · PVG 15:18 · LAX 23:18 · JFK 02:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.