最近爬了一些视频链接练手,爬下来之后,发现部分链接是无效的(无法播放),于是打算筛选一遍,保留有效链接。 在筛选时,发现通过响应码或者 html 内容都无法准确判断某条链接是否有效,请问该从哪里下手进行鉴别呢?
视频链接示例: http://abc.cdn.baidu.net/upic/2017/07/28/00/BMjAxNzA3MjgwMcxNDM4MzlfMl8z.mp4
1
nnnToTnnn 2020 年 1 月 7 日
|
2
kernelpanic 2020 年 1 月 7 日
curl -o - -H 'Range: bytes=0-16' -sI '***.mp4' |grep 'Content-Type'|cut -d ' ' -f2
|
3
106npo 2020 年 1 月 7 日 via Android
ffmpeg 也行(
|
4
airdrop 2020 年 1 月 7 日 via iPhone
请求视频的 range bytes=0-1,检查 response 里的 content length
|
5
xiaoz 2020 年 1 月 7 日 via Android
curl 只请求 header 部分,根据返回状态吗来判断。
|
6
airdge 2020 年 1 月 7 日
requests.head(url).status_code
|