V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
musclepanda
V2EX  ›  程序员

新手入门想学数据分析,最终到机器学习,数学是不是要从头学起。。

  •  
  •   musclepanda · 2018-05-05 10:04:41 +08:00 · 8586 次点击
    这是一个创建于 2395 天前的主题,其中的信息可能已经有所发展或是发生改变。
    前几天给自己立了个 flag,自学机器学习

    然后听了节课…………发现根本不懂啊…………

    虽然是理科生,但毕业了好多年之后根本接触不到数学,连 sin,cos,tan 都忘记啥意思了,还有啥求导什么的。

    求问我这个数学应该有个什么步骤学习

    我计划是高中数学重新拿出来看看…………然后后面是高等数学?线性代数?微积分?不知道什么个步骤了。。

    求问。
    52 条回复    2018-05-07 16:43:29 +08:00
    fengheorg
        1
    fengheorg  
       2018-05-05 10:07:23 +08:00
    高等数学、线性代数、概率与统计,无外乎这几门。快速捡起来看下,入门其实不难。
    murmur
        2
    murmur  
       2018-05-05 10:11:38 +08:00
    入门其实挺难的 数学个人感觉靠那么一丢丢天分的 如果说数学不难的话为什么那么多人转文
    evanvane
        3
    evanvane  
       2018-05-05 10:28:24 +08:00 via Android
    楼主还是放过自己吧
    zetary
        4
    zetary  
       2018-05-05 10:47:50 +08:00 via iPhone
    劝退劝退
    Nick2VIPUser
        5
    Nick2VIPUser  
       2018-05-05 10:49:11 +08:00 via iPhone
    考个研如何
    zst
        6
    zst  
       2018-05-05 11:11:53 +08:00 via Android
    买本陶哲轩实分析开始看,反正是从最基础开始的 手动 doge (有没人教下我 v2er 怎么快速加 doge)
    musclepanda
        7
    musclepanda  
    OP
       2018-05-05 11:13:46 +08:00
    @Nick2VIPUser 已经研究生毕业了
    musclepanda
        8
    musclepanda  
    OP
       2018-05-05 11:14:08 +08:00
    @evanvane 哈哈,我也想,但是已经立了 flag 了
    takato
        9
    takato  
       2018-05-05 11:22:49 +08:00
    后面还有更凶的:)
    劝退
    starcraft
        10
    starcraft  
       2018-05-05 11:54:04 +08:00 via iPhone
    数分 线代 概率论 数理统计。最后的最后,才是计算机相关,和数学比起来约等于不学。
    musclepanda
        11
    musclepanda  
    OP
       2018-05-05 11:59:33 +08:00
    @starcraft 约等于不学...哭。。。
    wizardforcel
        12
    wizardforcel  
       2018-05-05 12:22:56 +08:00 via Android
    个人感觉是传统机器学习概率论用的多,深度学习微积分和最优化用的多。

    线代两个都用。
    Leigg
        13
    Leigg  
       2018-05-05 12:56:58 +08:00 via Android   ❤️ 1
    自学线代中,当中苦只有自己知道,这个真不是只靠毅力就行的,需要一点点天赋,你懂的。就想有些人天生数学就賊 tm 好,有些人百分努力也只是勉勉强强。。。我就是后者。。
    TimePPT
        14
    TimePPT  
       2018-05-05 13:07:01 +08:00 via iPhone
    数据分析方向,数据科学方向,机器学习方向,这仨是有区别的……
    vegito2002
        15
    vegito2002  
       2018-05-05 13:12:00 +08:00
    看你想学到什么程度了, 如果只是把 Andrew Ng 那个大学课程程度的学完, 入门的线代以及较熟练的线代就行了. 大学的 ML 基本都是入门级别, 想往深了走就看你自己造化了.
    musclepanda
        16
    musclepanda  
    OP
       2018-05-05 13:55:49 +08:00
    @Leigg 感觉前者我是不可能了。。
    musclepanda
        17
    musclepanda  
    OP
       2018-05-05 13:56:08 +08:00
    @vegito2002 恩恩,听说他的课很有名,我的目标就是把他的课学完
    enenaaa
        18
    enenaaa  
       2018-05-05 14:27:09 +08:00   ❤️ 2
    同自学中。我的学习路径是这样的。
    1. 直接去阿里天池参加比赛, 发现干不过别人。
    2. 找机器学习的书看, 比如, 机器学习实战, 统计学习方法,周志华的 机器学习等。 发现看不懂。
    3. 意识到统计学和优化理论是基础。 于是看 概率论和数理统计, 线代,及复习微积分、级数等概念。当年学渣, 看得很艰难。
    4. 此过程中, 一边看书一边比赛。将理论知识一点点融入实践, 积累实际的处理经验。

    不过, 目前还是渣渣一枚。
    dobest
        19
    dobest  
       2018-05-05 17:56:14 +08:00 via iPhone
    贴一篇知乎的文章,说了初学者的误区和路径,可作参考 https://zhuanlan.zhihu.com/p/29704017
    zyxbcde
        20
    zyxbcde  
       2018-05-05 18:00:56 +08:00 via Android   ❤️ 2
    劝退劝退
    有天同学送了我本周志华的机器学习,发现啥也看不懂,翻出了大学数学,发现还是看不懂,又翻出了高中数学,发现还是看不懂,又翻出了初中数学。现在可算补回高数了,然而感觉自己没啥天赋,感觉自己就不是理科的料。
    那个机器学习实战倒还简单点。
    orangeade
        21
    orangeade  
       2018-05-05 18:21:54 +08:00 via Android
    Google 开发者网站上有个完整的机器学习入门教程,可以了解下机器学习的基础,概念,和工具,数学边用边补吧
    twistedmeadows
        22
    twistedmeadows  
       2018-05-05 19:05:14 +08:00 via Android
    ……不要从头开始学吧,那个太多了。你会死在半路的。

    deep learning 领域几位神级人物写了一本书: https://www.deeplearningbook.org
    貌似是从数学角度入手的。你挨着看,看不懂的再去找相关的基础教程。

    机器学习用得到的也就只是数学里的线代、统计、概率,但又分别只用了这几门里的一部分。要找准方向啊兄弟。
    visualeric
        23
    visualeric  
       2018-05-05 20:03:46 +08:00
    推荐一套教材《程序员的数学》,第二本讲概率与统计,第三本讲线性代数。
    diggerdu
        24
    diggerdu  
       2018-05-05 20:57:44 +08:00
    deep learning 一本书够了
    diggerdu
        25
    diggerdu  
       2018-05-05 20:58:41 +08:00
    @musclepanda @starcraft 完全是乱讲
    thedrwu
        26
    thedrwu  
       2018-05-05 21:12:32 +08:00 via Android
    @Leigg 自学线代没有参考应用的场景那只有数学系的人才能学下去吧?
    若不知道一些基本概念比如特征值、正定矩阵、二次形、以及各种 span 出来的空间,在现实世界中有什么具体模型可以参考,学完立刻忘了。

    对于偏向实践应用,没有系统的经过专业数学训练的工程人员,还是从现实应用返回去抽象出原理,然后有兴趣再推导细节扩展到高维度,比较实际。
    Leigg
        27
    Leigg  
       2018-05-05 21:44:06 +08:00 via Android
    @thedrwu 对,所以我现在是结合 ML 的视频在看。
    bucky
        28
    bucky  
       2018-05-05 22:04:26 +08:00
    我觉得从底层往上学绝对是一个很差的方法
    wizardforcel
        29
    wizardforcel  
       2018-05-05 22:06:59 +08:00
    @diggerdu 你要是想靠它吃饭,**绝对不应该**只看它本身,还要了解具体的应用领域。
    SingeeKing
        30
    SingeeKing  
       2018-05-05 22:07:36 +08:00
    @zst #6
    YRodT
        31
    YRodT  
       2018-05-05 22:45:52 +08:00 via Android
    给初学者推荐花书,这是要把人往死里逼么
    BadMan
        32
    BadMan  
       2018-05-05 22:55:11 +08:00
    花书不错啊,可就是看起来有点像科普书,没有很深入,建议上 prml,然后直接打比赛和看 nlp、cv 等相关应用方向的论文。
    lunafreya
        33
    lunafreya  
       2018-05-05 23:11:48 +08:00
    懂几个基本概念后去看论文。
    razerhell
        34
    razerhell  
       2018-05-06 00:37:57 +08:00 via iPhone
    不知道我们对

    “立 flag ”

    这个说法的理解是否有偏差,我印象中这个东西最好不要拿来表达“定了个目标”的意思。
    WildCat
        35
    WildCat  
       2018-05-06 04:36:48 +08:00
    @twistedmeadows
    @zyxbcde

    周志华教授的《机器学习》和 《 Deep Learning 》都特别不适合入门,读者对象要么是数学系物理系的想看看机器学习的理论,要么是你已经熟悉了基本的机器学习,想丰满下知识体系,需要一个导论的书。这些书的地位类似《 Java 编程思想》《算法导论》。

    对于楼主,你最适合看的是吴恩达的 deeplearning.ai 的课,没有之一。这门课价格合适(免费收费版都有),吴恩达教授非常善于鼓励人,不是特别强调数学基础(虽然是必须的)。你如果认真看下去(记得做笔记),一定可以成功的。附上我的《 deeplearning.ai 课程学习总结》: https://blog.wildcat.io/2018/02/summary-of-my-learning-experience-about-deeplearning-ai-zh/ 。希望可以对你有帮助。

    另外对于楼上说自己看论文的,我相信你们也不会这么做的,希望不要瞎指点人。看论文是需要的,但一开始就看那简直是搞笑。

    附上自己做的笔记:​
    Geoffrey Hinton 对学习深度学习有什么建议:
    Read some literature but don ’ t read too much of it. For creative researchers, read something, find where you think most of people are doing wrong. I ’ m contrary in that sense. Just doesn ’ t feel right. Keep yourself. If you intuition is that, you should follow it and eventually it will be successful.
    Replicate paper, finding the tricks that make it work.
    Never stop programming. Good students: keep working on some work. Bad students: Give up easily.
    General advice for AI starters: Basically read enough so you start developing intuitions, and trust your intuitions and go for it, and don ’ t be too worried if everybody else says it ’ s nonsense. There ’ s one thing, which is, if you think it ’ s a really good idea, and other people tell you it ’ s complete nonsense, then you know you ’ re really on to something. So one example of that is, when I first came up with variational methods, I sent email explaining to a former student of mine called Peter Brown, who knew a lot about EN. And he showed it to people who worked with him. And they said this guy ’ s drunk, or he ’ s just stupid. So they really, really thought it was nonsense. Now, it could have been partly the way I explained it, because I explained it in intuitive terms. But when you have what you think is a good idea, and other people think is complete rubbish, that ’ s the sign of a really good idea. (有点哲学 =。=)
    One good piece of advice for new grad students is, see if you can find an advisor who has beliefs similar to yours. Because if you work on stuff that your advisor feels deeply about, you ’ ll get a lot of good advice and time from your advisor. If you work on stuff your advisor ’ s not interested in, all you ’ ll get is, you get some advice, but it won ’ t be nearly so useful.
    How do you feel about people entering a PhD program, or in top team? A: 没有真正足够深刻理解这次革命的人,这不是第二次工业革命,但是已经很接近了。这改变了我们使用电脑的方式,然而现在的计算机科学部门是传统时代建立的。我以前的部门就不允许大量的人员搞这个方向,只让一小部分人去搞。
    Geoffrey 过去老不理解 Andrew 老 push 他去做。虽然他老抱怨但是他做到了,并且现在认为这是个好想法,虽然工作量极大。
    关于 AI 领域辩论自己的看法:Symbolic AI is a big mistake. 传统观念认为,words 进,words 出,中间思考的过程也应该是 类似 words 或者 strings 的东西。但是比如 CNN,是 pixels 入,pixels 出,但是中间是数学向量表示。他认为这才是正确的方向。

    事实胜于雄辩。
    Xs0ul
        36
    Xs0ul  
       2018-05-06 04:41:09 +08:00
    周志华的西瓜书很不错,属于深入浅出,有直观理解也有数学推导,至少我第一次看跳过了很多证明的细节,但是还是对算法思路有大致的理解

    另外吴军的数学之美涉及很多 NLP 的模型,因为不是按机器学习教材写的,读起来也很愉悦
    stevenbipt
        37
    stevenbipt  
       2018-05-06 09:28:13 +08:00 via Android
    数据分析除了上面几门课估计还要加上统计学
    fghjghf
        38
    fghjghf  
       2018-05-06 09:29:19 +08:00
    楼主别怂。我昨天才看到一个 70+的老大爷,还在背英文单词。。数学不用从头学,捉重点。有目的的学,不然这是个无止境的坑。程序员的数学是坑来的,没点基础你绝对看不懂。建议直接入手 Python 的 DL。书名忘记了。不过小白也能懂。
    twistedmeadows
        39
    twistedmeadows  
       2018-05-06 09:52:19 +08:00 via Android
    @WildCat
    楼主理科研究生毕业。我不认为他拿到这种数学公式多的资料会是一脸懵。他上面说的懵逼我个人理解为谦虚了,是假懵逼。学过考过忘掉了,和完全没碰过是不一样的。

    deep learning.ai 的课我也在学。现在刚学完两门。
    但我给吴恩达的斯坦福 ML 课打了 10 分推荐度,给他 DeepLearning.ai 前两门只打了 7 分。它太简单了。过于简化了。仗着深度神经网络一些优越的特性而抛掉了很多细致的论证。
    我在这套课里获得的成就感远小于斯坦福 ML。如果是很功利地急于在这方面产生价值,当然可以学这个。但是我还是推荐走一条稍微困难一点但是更坚实的路。
    twistedmeadows
        40
    twistedmeadows  
       2018-05-06 09:54:59 +08:00 via Android
    西瓜书我也觉得不错。我第一次看的时候是跳过大多数公式当科普书看的。
    不过后来再想认真看的时候又发现它「教材」性质比较重。面铺得比较广,一些在实践上比较关注的技术它都没有深入去讲。
    twistedmeadows
        41
    twistedmeadows  
       2018-05-06 12:22:05 +08:00
    另外也不太能理解 wildcat 为什么觉得上来就看论文是搞笑。你要了解某一领域目前最新的学术进展,难道不是看论文最快么。

    对不同的人适用不同的方法吧。
    如果要看论文,GitHub 上有个仓库 Deep Learning Papers Reading Roadmap: https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap
    如果是学 Deeplearning.AI 的课程,这里有全套笔记给楼主助攻: https://github.com/mbadry1/DeepLearning.ai-Summary
    wqzjk393
        42
    wqzjk393  
       2018-05-06 13:03:14 +08:00 via iPhone
    刚开始看李航的统计学习方法。感觉数学不外乎就是概率论概率密度函数那些,高数的常微分偏微分之类的,一步步来吧,需要什么学什么,你当年学三角函数时候也是一脸懵逼啊,学要不也就那回事么
    wqzjk393
        43
    wqzjk393  
       2018-05-06 13:04:54 +08:00 via iPhone
    @Leigg 线代的话其实我更推荐看一看考研的那些线代复习课,当初怎么都搞不懂,上了几节考研线代课,全明白了
    takato
        44
    takato  
       2018-05-06 13:09:19 +08:00
    @WildCat 的确现在的 AI 更像是一门哲学。是否可以认为现在是联结主义回归的时刻呢?
    Leigg
        45
    Leigg  
       2018-05-06 14:04:25 +08:00 via Android
    @wqzjk393 去哪看?
    wizardforcel
        46
    wizardforcel  
       2018-05-07 00:14:32 +08:00 via Android
    @wqzjk393 强烈不推荐考研的那些视频

    原因是

    1. 先讲行列式
    2. 不涉及太多矩阵分解的东西

    推荐清华在学堂在线上的那套,基本是按照 mit 18.06 的大纲编排的
    wizardforcel
        47
    wizardforcel  
       2018-05-07 00:17:18 +08:00 via Android
    选材很重要,几个热门材料的难易程度是:

    udacity cs221 < stanford cs229 < mlapp < 周志华机器学习 < prml
    wizardforcel
        48
    wizardforcel  
       2018-05-07 00:22:48 +08:00 via Android
    @BadMan @diggerdu

    初学者看花书,就相当于给你一本日文字典,然后把你扔到东京。
    wqzjk393
        49
    wqzjk393  
       2018-05-07 08:53:35 +08:00 via iPhone
    @wizardforcel 各有各的习惯吧。我是因为大学学过线代,但是课程学的很模糊,后来听了听考研的课,算是系统的又学了一遍
    cuzfinal
        50
    cuzfinal  
       2018-05-07 15:12:45 +08:00
    应该考研究生把。
    Len1133
        51
    Len1133  
       2018-05-07 16:15:28 +08:00
    概率论+最优化+一些高数基础知识,基本可以看懂大部分东西了。
    cheesea
        52
    cheesea  
       2018-05-07 16:43:29 +08:00
    从高中数学学期,你咋不从小学数学学起呢。
    我觉得还是边看边补,哪些数学忘了就去看那一部分。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1135 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 23:37 · PVG 07:37 · LAX 15:37 · JFK 18:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.