V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
abusizhishen
V2EX  ›  问与答

用 Python 写一个爬虫,爬取视频资源并保存,视频按分类存放在硬盘上,目录创建失败致无法保存

  •  
  •   abusizhishen · 2017-12-23 13:11:32 +08:00 · 2837 次点击
    这是一个创建于 2529 天前的主题,其中的信息可能已经有所发展或是发生改变。

    部分分类名称含有特殊字符、导致创建目录出错。有什么好用的模块或方法能检测并修正目录吗?

    11 条回复    2017-12-24 14:16:40 +08:00
    lishunan246
        1
    lishunan246  
       2017-12-23 13:13:11 +08:00   ❤️ 1
    slugify
    abusizhishen
        2
    abusizhishen  
    OP
       2017-12-23 13:14:51 +08:00
    创建目录之前检测一遍,有特殊字符就替换或者去掉,再去创建目录
    Kilerd
        3
    Kilerd  
       2017-12-23 13:44:36 +08:00
    md5(name) 满分答案
    Kilerd
        4
    Kilerd  
       2017-12-23 13:45:11 +08:00
    然后用一个 sqlite 数据库记住 名字 => md5 目录的对应关系
    abusizhishen
        5
    abusizhishen  
    OP
       2017-12-23 13:59:52 +08:00 via Android
    @lishunan246 一会看下
    abusizhishen
        6
    abusizhishen  
    OP
       2017-12-23 14:03:01 +08:00 via Android
    @Kilerd 复杂了,我保存在本地,直接浏览的
    lniwn
        7
    lniwn  
       2017-12-23 14:15:45 +08:00 via iPhone
    @abusizhishen 先创建目录,如果失败了再检测并替换非法字符。
    manzhiyong
        8
    manzhiyong  
       2017-12-23 14:47:04 +08:00
    一般我的目录名都是数字,是附件数据库 id 除以某个数(目录下存放文件数)的值。
    frank611
        9
    frank611  
       2017-12-23 14:58:10 +08:00 via Android
    ???
    Arnie97
        10
    Arnie97  
       2017-12-24 02:20:27 +08:00 via Android
    直接正则替换掉特殊字符不能满足需求?
    abusizhishen
        11
    abusizhishen  
    OP
       2017-12-24 14:16:40 +08:00 via Android
    @Arnie97 如果有模块能提供这个功能更好
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3361 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 12:34 · PVG 20:34 · LAX 04:34 · JFK 07:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.