V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
taozhijiangscu
V2EX  ›  程序员

最近要做数据挖掘和数据分析

  •  
  •   taozhijiangscu · 2015-11-23 08:37:38 +08:00 · 4231 次点击
    这是一个创建于 3292 天前的主题,其中的信息可能已经有所发展或是发生改变。

    以前都没搞过,不知道这里的大神能不能指点一下迷津?可以入口的地方。

    拜谢!

    29 条回复    2015-11-23 17:06:19 +08:00
    HunterPan
        1
    HunterPan  
       2015-11-23 08:49:47 +08:00
    神经网络 好多...
    nevin47
        2
    nevin47  
       2015-11-23 09:22:25 +08:00   ❤️ 2
    这个需求给的好模糊,要做什么类别的东西呢?给 LZ 一个图片参考一下路径

    imn1
        3
    imn1  
       2015-11-23 09:26:27 +08:00
    如果有需求的就按需求做
    如果是学习,没什么基础的,从交叉分析和正态分布入门
    binjade
        4
    binjade  
       2015-11-23 09:27:04 +08:00
    这个话题太了,根据需求吧。
    lydhr
        5
    lydhr  
       2015-11-23 09:44:57 +08:00
    推荐 tableau ,数据可视化软件
    alloyapple
        6
    alloyapple  
       2015-11-23 10:04:03 +08:00
    http://datacademy.io/
    学习数据科学的网站
    fxxkgw
        7
    fxxkgw  
       2015-11-23 10:13:55 +08:00
    搜索 elk 搜索 三斗室
    luoqeng
        8
    luoqeng  
       2015-11-23 10:25:40 +08:00
    hive pig storm 之类的
    sunjiayao
        9
    sunjiayao  
       2015-11-23 10:29:42 +08:00   ❤️ 1
    不基于业务场景的谈技术都是在耍流氓
    Light3
        10
    Light3  
       2015-11-23 10:42:01 +08:00
    我记得这样一个事就是有一个主播买方便面然后天猫超市用大数据分析然后给了他一个赠品是卫生巾 主播是男的
    inFinityzc
        11
    inFinityzc  
       2015-11-23 11:08:17 +08:00
    @Light3 天猫大数据的推荐现在用的深度卷积网络,据说给阿里提升了过亿的效益
    zonghua
        12
    zonghua  
       2015-11-23 11:12:19 +08:00 via iPhone
    不会数学的都是个笑话
    jyhmijack
        13
    jyhmijack  
       2015-11-23 12:04:08 +08:00
    @alloyapple 服务挂了
    Whoops, looks like something went wrong.

    G_will
        14
    G_will  
       2015-11-23 12:36:13 +08:00
    @jyhmijack fixed
    moxiaotiao
        15
    moxiaotiao  
       2015-11-23 12:42:12 +08:00 via Android
    聚类,分类算法太多
    hqs123
        16
    hqs123  
       2015-11-23 14:07:32 +08:00
    神经网络算法,最大期望算法,贝叶斯模型等等.
    flyingkid
        17
    flyingkid  
       2015-11-23 14:49:59 +08:00
    @Light3 老中医错觉:doge
    taozhijiangscu
        18
    taozhijiangscu  
    OP
       2015-11-23 15:15:52 +08:00
    @imn1 主要是互联网方面的,偏向于自然语言处理,比如客户咨询、客户评价等。
    貌似学习用 weibo 作数据分析的比较多啊。
    taozhijiangscu
        19
    taozhijiangscu  
    OP
       2015-11-23 15:17:14 +08:00
    @alloyapple 卧槽,处处有商机啊。。。
    taozhijiangscu
        20
    taozhijiangscu  
    OP
       2015-11-23 15:18:10 +08:00
    @fxxkgw 好像偏运维啊。。。。
    taozhijiangscu
        21
    taozhijiangscu  
    OP
       2015-11-23 15:18:57 +08:00
    @sunjiayao 比如我有类似狗东的用户咨询,用户评论。怎么做用户数据的价值分析呢?
    taozhijiangscu
        22
    taozhijiangscu  
    OP
       2015-11-23 15:19:33 +08:00
    @inFinityzc 确信么?还有那些消息?
    taozhijiangscu
        23
    taozhijiangscu  
    OP
       2015-11-23 15:20:23 +08:00
    @moxiaotiao
    @hqs123
    这些基础的机器学习算法都知道,关键不知道怎么实践的用起来啊。
    sunjiayao
        24
    sunjiayao  
       2015-11-23 15:46:59 +08:00
    @taozhijiangscu 得有个目标啊,最后我想要一个什么样的数据?这个数据能给我带来什么价值?我要从什么维度去获取这个数据?
    以上条件都有了 剩下的才是技术的事
    inFinityzc
        25
    inFinityzc  
       2015-11-23 16:50:38 +08:00
    @taozhijiangscu 确信,详情请看今年天猫大数据比赛的结果分析。
    如果你想入门搞数据挖掘的话,建议你听听数据挖掘或者机器学习的公开课先,然后在着手开发。
    PS 需要比较扎实的数学功底。
    mko0okmko0
        26
    mko0okmko0  
       2015-11-23 16:52:49 +08:00
    或是反着来:
    首先你需要知道你有什么数据.
    然后依照数据最多的 kv 去做相关性.
    注意相关性不需要因果关系.只需要局部有接近线性或是可预测性即可.
    但如果你都不知道你的数据内容的栏位意义和值意义,那基本上没戏.
    Zzzzzzzzz
        27
    Zzzzzzzzz  
       2015-11-23 16:56:03 +08:00
    @Light3 在天喵超市消费了十几单的表示还有赠品这回事儿么? 怒, 再也不去了。
    vtea
        28
    vtea  
       2015-11-23 16:58:42 +08:00 via iPhone
    统计分析我只会 spss ,抓关键词分析有时候能发现很多有趣的事
    reverland
        29
    reverland  
       2015-11-23 17:06:19 +08:00
    我倒准备做计算机辅助诊断系统。。。两个月前看病看得纠结。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3285 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 12:19 · PVG 20:19 · LAX 04:19 · JFK 07:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.