• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
bytedance
V2EX  ›  酷工作

[今日头条] 招数据抓取实习生

  •  
  •   bytedance · Nov 30, 2015 · 1901 views
    This topic created in 3826 days ago, the information mentioned may be changed or developed.
    工作地点:北京市海淀区知春路(离地铁站 5 分钟)
    简历标注 “姓名+抓取实习+每周可实习天数+最早入职时间+可实习期限”
    发送至 [email protected]
    实习薪资:日薪 200~300 元 /天
    实习时间: 3~4 天 /周,≥6 个月

    职位描述:

    今日头条的目标是给用户推荐他所感兴趣的各种信息(不只是新闻),因此数据是今日头条的核心。抓取的目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等.
    实习生职位的主要工作集中在爬虫和抽取环节。 由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战,你的加入,可以帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。

    职位要求:

    1.对技术有热情, 既有高远目标,也能脚踏实地
    2.有扎实的数据结构和算法功底, 强悍的编码能力
    3.熟悉 linux 开发环境,熟悉 C++和 python 语言的优先
    4.理解 http ,熟悉 html,DOM,xpath 优先

    需要提交的材料:
    1.简历
    2.SNS 账号(或链接),如微博、豆瓣等
    3.你经常上的 3 个技术网站
    4.你阅读过的 3 本值得推荐的技术类书籍
    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3210 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 03:17 · PVG 11:17 · LAX 20:17 · JFK 23:17
    ♥ Do have faith in what you're doing.