V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
dingyaguang117
V2EX  ›  问与答

如何编写一个通用的视频搜索引擎?

  •  
  •   dingyaguang117 · 2013-06-24 11:23:50 +08:00 · 2410 次点击
    这是一个创建于 4205 天前的主题,其中的信息可能已经有所发展或是发生改变。
    所谓“通用”就是可以抽取不同网站,不同结构页面的视频信息(标题,截图,描述,剧集播放页列表)。

    我想知道百度视频搜索是怎么做到的?难道是针对各大视频网站的不同页面的结构编写不同的抽取程序吗?不然是怎么做到精准的信息抽取的。
    3 条回复    1970-01-01 08:00:00 +08:00
    luikore
        1
    luikore  
       2013-06-24 11:32:44 +08:00
    在人力资源丰富的国度, 思路就是这样:
    招 100 个程序员, 针对数据量前 100 的视频网站写不同的抽取
    招 1000 个运营, 手工录入 100 以后的视频网站上的信息
    dingyaguang117
        2
    dingyaguang117  
    OP
       2013-06-24 11:43:30 +08:00
    @luikore = =那百度视频,快手看片等等 都是这么做的吗?
    jjplay
        3
    jjplay  
       2013-06-24 12:12:50 +08:00
    百度视频 都是第一索引自己的站 爱奇异 -> 百度影音 -> 奇热 ,优酷 土豆 ..... 前面自己站数据调用,后面大站肯定都是战略合作,毕竟谁都想和百度合作 引流巨大 不就是钱么,最后面应该是自己的算法识别 和一定的人工,差不多这样吧,百度视频 soku.com 都有递交视频的规范 当然收录几率几无
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2848 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 06:17 · PVG 14:17 · LAX 22:17 · JFK 01:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.