V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
wenfeixiang
V2EX  ›  酷工作

[北京] IT 桔子正在找寻数据抓取、挖掘、知识图谱处理等领域的大数据工程师

  •  
  •   wenfeixiang · 2016-04-24 15:53:59 +08:00 · 3405 次点击
    这是一个创建于 3163 天前的主题,其中的信息可能已经有所发展或是发生改变。
    IT 桔子( itjuzi.com )是一家互联网(延伸至 TMT 、泛科技领域)领域的创业投资数据提供商,然而我们要尴尬承认的是,在对比我们数据来源渠道: UGC 、 PGC 、数据抓取与挖掘 三大渠道中,数据技术的占比不断下滑。。。

    我们遇到了比较大的数据挑战—— 包括 抓取更多的数据并程序化清洗、匹配、入库;对多个数据渠道进行交叉验证、整合;数据的结构化、可视化处理,以便成为有价值的知识图谱。

    这些挑战除了会逼迫公司成员持续学习、解决之外,更加要求我们能在更广阔的范围内找寻人才。是的,就是大数据的人才。这是当前很火热抢手的人才,不敢说 IT 桔子相比其他巨头、独角兽们会有多大的吸引力,但是我们十分确认并确信的是—— IT 桔子是可以让一个人有成就感的(如果能感觉到 归属感、成就感就好了~)

    开头说了这些之后,直入正题:

    IT 桔子正在找寻 2-3 位的大数据工程师,包括数据抓取、挖掘和算法、知识图谱 三大领域:

    1 、要做的事情:

    1 )数据的抓取及系统搭建,包括新闻、微博微信、 app 等;
    2 )数据的提取、清洗、入库、结构化、存储等;
    3 )大数据的挖掘,包括交叉验证、统计分析、标签 tag 处理等;
    4 )大数据的可视化与知识图谱搭建

    2 、期待你拥有的:

    1 )扎实的编程技能,能熟练使用 Python 等程序设计语言
    2 )熟悉常见的数据结构、算法,具备良好的数理、逻辑处理能力,数据化
    3 )对机器学习、自然语言处理、知识图谱等有兴趣、经验,并愿意持续投入研究

    3 、 IT 桔子给能到的:

    1 )薪酬: 20K-40K 的月薪(公司预算是每个月 10 万,用于这个数据挖掘小组 2-3 人的薪酬开销)
    2 )福利:餐补、交通补贴、定期团建、年度 2 次国内国外旅游、图书与培训 …… 持续增加中
    3 )期权:这是个长期激励,我们愿意与优秀的人分享公司的长期可持续发展的收益
    4 )挑战与成就感:现实是当前的 IT 桔子在数据处理正面临着挑战,为此必然会带给你挑战、压力,当然解决问题之后,必然会有成就感与满足感,这是个升级打怪的过程

    最后,我们想说两点:
    1 )数据与人才是 IT 桔子最重要的资产,做数据的人才~你知道的,对我们意味着什么
    2 )我们的人才观是: 1 个人 拿 2 个人的工资 干 3 个人的活~期待你的认同

    如果你对大数据、数据处理有兴趣、激情,欢迎与我们联系, 我是 IT 桔子的创始人 文飞翔, 我的邮箱是 [email protected]

    期待有兴趣的你与我们联系交流。 O(∩_∩)O 谢谢
    8 条回复    2016-04-28 11:57:59 +08:00
    bigbearme
        1
    bigbearme  
       2016-04-24 16:14:11 +08:00 via iPhone
    爬过 IT 桔子的网站数据...想去但觉得能力不够...
    ViYun
        2
    ViYun  
       2016-04-24 16:47:30 +08:00
    记得几年前 IT 桔子收录过我的网站,所以很有印象。
    just4fan
        3
    just4fan  
       2016-04-24 18:32:27 +08:00 via Android
    对编程有啥要求比如 nunpy ? sckitlearn ?还是 spark 。 hadoop ?
    对算法有啥要求 比如经典 ml 算法还是 dl ?
    rubytek
        4
    rubytek  
       2016-04-24 19:13:34 +08:00 via Android
    你确定你们想做知识图谱?哪个领域的,只做影视综艺娱乐方向还是所有的都做?小公司做这个短时间内看不到回报的。
    rubytek
        5
    rubytek  
       2016-04-24 19:17:46 +08:00 via Android
    啊,你们做的是科技投资领域的。。那估计是新闻 NLP 抽取建库了。。
    wenfeixiang
        6
    wenfeixiang  
    OP
       2016-04-25 23:43:24 +08:00
    @bigbearme O(∩_∩)O~ 有没有发现我们的数据比较好转?欢迎一起来盗亦有道啦

    @ViYun 你是再次创业了吗?有机会围绕你的新网站——网站估值 进行一些合作吗?

    @just4fan 在编程框架与算法上没有特别的要求,因为我们几乎在大数据这块从 0 开始探索了~~如果你有兴趣,欢迎与我们一起交流啦

    @rubytek 嗯,我们会涉及到知识图谱,除开新闻外,还有 公司与人、机构 之间的交叉复合关系等~欢迎来指导了
    ViYun
        7
    ViYun  
       2016-04-27 12:40:59 +08:00
    @wenfeixiang 也算再次创业吧,以前做的模板网站关掉了,新网站才上线半个月,还有很多功能需要完善,如果有机会合作的话那是最好不过了。
    wenfeixiang
        8
    wenfeixiang  
    OP
       2016-04-28 11:57:59 +08:00
    @ViYun Hi ,好的啊~ 我们可以约个时间认识交流啊?我的微信( QQ )是 108044282
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2540 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 03:20 · PVG 11:20 · LAX 19:20 · JFK 22:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.