阿里云
发表主题 回复主题
  • 521阅读
  • 1回复

[交流乐园]最佳机器学习入门级资源

级别: 论坛版主
发帖
1467
云币
4429
翻译:青蛙跳 D9,! %7i  
VO9f~>`(  
原文:machinelearningmastery.com/best-machine-learning-resources-for-getting-started/ l BiovT  
6VR18Y!y  
起初,关于这个问题,我脑子其实是一片空白的。我在想图书馆里的书、课程资料、论文、书籍哪个更加适合推荐给机器学习领域的入门初学者。 @\!!t{y  
期间,我很纠结应该减掉、增加哪些内容。我努力把己置身于程序员和初学者之中,从他们的角度思考哪些资源最有利于他们学习“机器学习”。 /?3:X *  
我精心挑选最好的资源。如果你真的是一个初学者,并且极其希望在机器学习领域有所耕耘,希望你能从中找到一些对你有帮助的知识。我的建议是专注于一项资料,一本书或一个编程库,并反复阅读其中涵盖的知识、教程。选择一样,坚持下去,一旦你已经掌握透了,再换一本书,反复阅读这本书。让它融入你的知识储备。 5EhE`k4  
,C!n}+27  
编程库 ^![{,o@"A  
syFI$rf _  
X% J%A-k]  
我认为,对于一件事应该学到可以构成威胁为止,再开始小试身手。 6lU|mJ`M  
这就是我学习编程的方法,我相信很多其他人也是这样学习的。了解你的局限性,充分利用你的优势。如果你知道如何编程,可以利用它来快速深入了解“机器学习”。在你开始操作之前,应该先进行大量的训练,学习数学相关知识。 )5i* /I\  
找到一个编程库,阅读文档,按照教程,开始尝试。以下是最好的开源机器学习编程库。它们并非都适合在你的生产系统中使用,但它们是很好学习资源,你可以从中学习、探索、研究。 TzY!D *%z  
你可以从一个熟悉的语言库开始,然后转到其他更强大的编程库。如果你是一名优秀的程序员,相信你可以很容易地在各种语言之间切换。它们的逻辑是相同的,只是在语法和API上略有不同。
  • 用于统计计算的“R项目”(R Project):这是一个环境和lisp脚本类似的语言。所有你想做的统计资料将被提供给R,包括一些测绘。CRAN上的机器学习类(第三方机器学习软件包)代码由该领域的领先人物编写,以及任何你能想到的东西。如果你想快速研究和探索,那么必须学习“R项目”。因此,你也可以从学习“R项目”(R Project)开始。
  • WEKA:这是一个提供API的数据挖掘工作台,包含用于整个数据挖掘中所需的大量命令行,它也具有图形用户界面。可以用于准备数据,可视化探索,构建分类,回归和聚类模型,许多算法都内置在第三方插件中。如果您是大数据和机器学习的新手,请坚持使用WEKA并坚持一次学习一样东西。
  • Scikit Learn:基于NumPy和SciPy构建的Python中的机器学习。如果你是一个Python或Ruby程序员,这是你的图书馆。这是友好的,功能强大,并提供优秀的文件。如果你想尝试别的,橙色将是一个很好的选择。
  • Octave:如果你熟悉MatLab或者你是一个NumPy程序员寻找不同的东西,可以考虑Octave。这是一个像Matlab一样的数值计算环境,可以很容易地编写程序来解决线性和非线性问题,比如大多数机器学习算法的基础问题。如果你有工程背景,这可能是你开始的好地方。
  • BigML:也许你不想做任何编程。您可以完全不用编程就可以像WEKA一样驱动工具。您可以进一步使用BigML等服务,在Web上提供机器学习界面,您可以在浏览器中浏览构建模型。
AF[>fMI  
选择一个更适合自己的平台,用它进行“机器学习”实际学习。不要仅停留于学习表面,还要实际操作哦! QN #)F  
%c0z)R~  
视频课程 C9Wojo.  
*f*f&l%  
RIo'X@zb  
很多初学者都很喜欢通过视频进行初步学习。 Ut;'Gk  
我在YouTube和VideoLectures.Net上观看了很多“机器学习”相关视频。但是有些人只是简单的看看视频,这并不是一种高效的学习方法。我建议在观看视频的时候应该记笔记,也可以对照视频自己演练一遍。 _S<?t9mS  
坦白说,我所见过的大多数视频课程都不太适合初学者。这些视频实际上都包含了线性代数和概率论的相关知识。 Qdm(q:w  
在我看过的视频中,Andrew Ng在斯坦福大学的讲座视频,很适合推荐给初学者。
  • 斯坦福机器学习(Stanford·Machine Learning):可通过Coursera观看,这个课程由Andrew Ng任教。在Coursera上报名后,可以随时观看所有讲座,并从斯坦福大学CS229课程中获得讲义和讲义笔记。这门课程包含作业和测验,并重点介绍线性代数(Linear algebra)和使用八度(Octave)。
  • 加州理工学院·从数据中学习(Caltech·Learning from Data):可通过edX观看,该课程由Yaser Abu-Mostafa授课。所有讲义和相关材料都可以在CalTech网站上找到。这门课程和斯坦福大学的课程一样,可以按照自己的节奏来完成作业和任务点。它涵盖了类似的主题,并进行了更加细致的学习,有更多有关数学的知识。该课程的作业对于初学者来说,可能具有一定的挑战性。
  • VideoLectures.Net上的机器学习分类(Machine Learning Category on VideoLectures.Net):这是一个在内容过载中淹没的容易的地方。找一些自己感兴趣的视频,看看是不是适合自己。如果发现选的课程太难了就换一个,找到自己喜欢的、适合自己的。
  • “为数据科学的运动而变形” - 杰里米·霍华德(“Getting In Shape For The Sport Of Data Science” – Talk by Jeremy Howard):与用户小组讨论如何在竞争激烈的机器学习中学习的更好。很少有人讨论解决问题的实际方法以及如何去做,所以这是很有效的学习方法。
[D9:A  
R9E6uz.j  
论文概述 -7 L  
X8.y4{5  
dqwWfn1lt  
如果你不习惯阅读、研究论文,第一次阅读论文时,你会发现字里行间的语言非常僵硬。一篇论文就像是教科书中截取的片段,但它描述了一些实际情况。如果想要开始学习“机器学习”,你可能会在其中发现一些有趣的论文。
  • 机器学习(The Discipline of Machine Learning):由Tom Mitchell撰写,这是定义机器学习的白皮书。这是Mitchell用来说服CMU总裁创建一个独立的机器学习部门的一个论点(Tom Mitchell的简短的采访)。
  • 关于机器学习的一些有用的知识(A Few Useful Things to Know about Machine Learning):这是一篇很好的论文,因为它从特定的算法中出发,并激起了一些重要的问题,如特征选择泛化(feature selection generalizability)和简单模型(model simplicity)。从一开始就从正确的角度思考,这是一件好事。
f-]><z  
我只列出了两篇重要的文章,因为阅读文章可能会让你失望。 H oS|f0  
i0i`k^bA  
初学者机器学习书籍 f@*>P_t  
;r=?BbND?  
J;HkTT   
有很多机器学习书籍,但为初学者编写的书籍却很少。 @:IL/o*  
什么是真的初学者? Avd *~  
最有可能的是,你来自另一个领域,但现在开始学习“机器学习”,那些领域可能是计算机科学,编程或统计学。即使如此,阅读大多数书籍都需要至少有线性代数和概率论的知识基础。 :'ihE\j  
有一些书鼓励程序员从通过算法的基础部分开始,并指向工具和库,以便可以开始尝试。 *sAOpf@M  
最值得推荐的是  编程集体智能(Programming Collective Intelligence)黑客机器学习(Machine Learning for Hackers)和  数据挖掘(Data Mining):分别用于Python,R和Java的实用机器学习工具和技术。如果有疑问,请阅读这三本书中的任意一本! 'M lXnHxt  
#O><A&FrF`  
6*V8k%H  
#\0TxG5'QA  
  • 编程集体智能:构建智能Web 2.0应用程序(Programming Collective Intelligence: Building Smart Web 2.0 Applications):本书是为程序员编写的。这本书不侧重于理论,重在代码示例和实际的网络问题、解决方案。买它、读它、做练习。
  • 黑客机器学习(Machine Learning for Hackers):我推荐在阅读 编程集体智慧(上文)之后,再学习这本书。它也提供了实用的实例,但它更多关于数据分析,以及使用R。我真的很喜欢这本书!
  • 机器学习:一个算法的角度(Machine Learning: An Algorithmic Perspective):这本书就像编程集体智慧的更高级版本。它有类似的内容(让机器学习 开 始的程序员),但它包括数学和参考,以及在Python中的例子和片段。如果对这本书有兴趣,我建议学习编程集体智慧(Programming Collective Intelligence)后阅读。
  • 数据挖掘:实用机器学习工具和技术,第三版(Data Mining: Practical Machine Learning Tools and Techniques, Third Edition):我实际上是从这本书开始的,实际上它是第一版,大约是2000年。我是一个Java程序员,这本书和随书库WEKA为我提供了一个完美的环境,可以将我自己的算法作为插件来实现,并且通常练习机器学习和更广泛的数据挖掘过程。我强烈推荐这本书和这条路。
  • 机器学习(Machine Learning):这是一本很老的书,包括公式和大量的参考文献。也是一本教科书,但对于每种算法都有很好的解释。
-UTV:^  
虽然很多人都有在讨论、推荐一些很棒的机器学习教科书,但很多都不适合初学者。 1zR/HT  
n8Q* _?Z/  
更生层次的阅读 _4Ii5CNNU  
`+Xe'ey  
0hb/`[Q  
我深深地思考了这个问题,我也去看了其他人的清单。 pbFYiu+  
为了完整起见,下面是网络上一些关于机器学习入门的大量资源清单。
  • 数据科学和机器学习资源列表:仔细整理一下这个列表。花时间阅读他的建议,然后点击链接。很棒的内容。
  • 学习机器学习有什么好的资源?为什么?:这个Quora问题的第一个答案是惊人的。每次我读书时,我都会做笔记和书签。这个答案最有价值的部分是机器学习课程列表,包括讲座笔记和问答网站上的相关帖子列表。
  • 机器学习不堪重负:ML101有没有书?:一个StackOverflow的问题。真的是机器学习书籍很棒的推荐列表。Jeff Moser的第一个回答列出了演讲视频和介绍,很有价值。
" C&x ,Ic  
c0SX]4} G  
[ 此帖被青蛙跳在2018-07-23 20:21重新编辑 ]
级别: 管理员
发帖
108
云币
193
只看该作者 沙发  发表于: 07-24
点个赞~
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
批量上传需要先选择文件,再选择上传
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个