问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

假期新手练习Ph

发布网友 发布时间:2023-06-22 04:46

我来回答

1个回答

热心网友 时间:2024-11-10 13:08

适合新手练习的项目Python机器学习练完你就牛了!


Python机器学习

再多的理论也不能代替动手实践。

教科书和课程会让你误以为精通,因为材料就在你面前。

但当你尝试去应用它时,可能会发现它比看起来更难。而

「项目」可帮助你快速提高应用的ML技能,同时让你有

机会探索有趣的主题。

此外,你可以将项目添加到你的投资组合中,从而更轻松

地找到工作,找到很酷的职业机会,甚至协商更高的薪水

1、机器学习角斗士

我们亲切地称其为「机器学习角斗士」,但它并不新鲜。

这是围绕机器学习建立实用直觉的最快方法之一。

目标是采用开箱即用的模型并将其应用于不同的数据集。

这个项目很棒有3个主要原因:

首先,你将建立模型与问题拟合的直觉。哪些模型对缺失

数据具有鲁棒性?哪些模型可以很好地处理分类特征?是

的,你可以翻阅教科书来寻找答案,但是通过实际操作您

会学得更好。

Python机器学习

其次,这个项目将教你快速制作原型的宝贵技能。在现实

世界中,如果不简单地尝试它们,通常很难知道哪种模型

表现最好。

最后,本练习可以帮助你掌握模型构建的工作流程。例如

,你将开始练习……

清理数据

将其拆分为训练/测试或交叉验证集

预处理

转型

特征工程

因为你将使用开箱即用的模型,你将有机会专注于磨练这

些关键步骤。

查看sk learn(Python) 或caret(R) 文档页面以获取说明

。你应该练习回归、分类和聚类算法。

教程:

·Python:sklearn-sklearn包的官方教程

·使用Sci kit-Learn预测葡萄酒质量――训练机器学习模

型的分步教程

Python机器学习

·R:caret-由caret包的作者提供的网络研讨会

数据源

·UCI机器学习存储库--350多个可搜索的数据集, 涵盖

几乎所有主题。您一定会找到您感兴趣的数据集。

·Kag gle数据集--Kag gle社区上传的100多个数据集。

这里有一些非常有趣的数据集, 包括Pokemon Go产卵地

点和圣地亚哥的墨西哥卷饼。

·data.gov―-美国*发布的开放数据集。如果您对社

会科学感兴趣,可以去看看。

2、玩钱球

在《点球成金》一书中,对于初学者来说,有很多有趣的

机器学习项目。例如,您可以尝试…·

·体育*……根据每场新比赛前的可用数据预测盒子得

分。

·人才球探……使用大学统计数据来预测哪些球员将拥有

最好的职业生涯。

Python机器学习

·综合管理......根据他们的优势创建球员集群,以建立一

个全面的团队。

体育也是练习数据可视化和探索性分析的绝佳领域。你可

以使用这些技能来帮助您决定要在分析中包含哪些类型的

数据。

数据源

·体育统计数据库―-体育统计和历史数据,涵盖了许多

职业运动和一些大*动。干净的界面使网页抓取更容易

·Sports Reference-另一个体育统计数据库。界面更杂

乱, 但可以将单个表格导出为CSV文件。

·cric sheet.org-国际和IPL板球比赛的逐球数据。提供

IPL和T 20国际比赛的CSV文件。

3、预测股票价格

对于任何对金融感兴趣的数据科学家来说,股票市场就像是糖

果乐园。

首先,您有多种类型的数据可供选择。您可以找到价格、基本

面、全球宏观经济指标、波动率指数等……不胜枚举

其次,数据可能非常精细。您可以轻松获取每家公司按天(甚

至按分钟)的时间序列数据,从而让您创造性地思考交易策略

Python机器学习

最后,金融市场通常具有较短的反馈周期。因此,您可以

快速验证您对新数据的预测。

你可以尝试的一些适合初学者的机器学习项目示例包括…

·量化价值投资……根据公司季度报告的基本面指标预测

6个月的价格走势。

·预测……在隐含波动率和实际波动率之间的差值上构建

时间序列模型,甚至是循环神经网络。

·统计套利……根据价格走势和其他因素找到相似的股票

,并寻找价格出现分歧的时期。

明显的免责声明:建立交易模型来练习机器学习很简单。

让他们盈利是极其困难的。这里没有任何财务建议,我们

不建议交易真钱。

教程

·Python:sklearnforInvesting-将机器学习应用于投资

的*视频系列。

·R:Quantitative Trading with R-使用R进行量化金融

的详细课堂笔记。

数据源

Python机器学习

·Quand l-提供免费(和优质) 金融和经济数据的数据市

场。例如,您可以批量下载3000多家美国公司的日终股

票价格或美联储的经济数据。

·Quanto pian-量化金融社区, 为开发交易算法提供免费

平台。包括数据集。

·US Fundamentals Archive-5000多家美国公司的5年

基本面数据。

4、教神经网络阅读笔迹

神经网络和深度学习是现代人工智能的两个成功案例。它

们在图像识别、自动文本生成甚至自动驾驶汽车方面取得

了重大进展。

要涉足这个令人兴奋的领域,您应该从可管理的数据集开

始。

M NIST手写数字分类挑战赛是经典的切入点。图像数据通

常比「平面」关系数据更难处理。M NIST数据对初学者很

友好,并且小到可以放在一台计算机上。

手写识别会挑战你,但它不需要高计算能力

首先,我们建议使用下面教程中的第一章。它将教你如何

从头开始构建神经网络, 以高精度解决M NIST挑战。

Python机器学习

教程

·神经网络和深度学习(在线书籍)--第1章介绍了如何在

Python中从头开始编写神经网络, 以对来自M NIST的数字进

行分类。作者还对神经网络背后的直觉给出了很好的解释。

数据源

·M NIST-M NIST是美国国家标准与技术研究院收集的两个数

据集的修改子集。它包含70,000个带标签的手写数字图像

5、调查安然

学习项目示例

·异常检测…...按小时绘制和接收电子邮件的分布图,并尝试检

测导致公共丑闻的异常行为。

·社交网络分析…在员工之间建立网络图模型以找到关键影响

者。

·自然语言处理……结合电子邮件元数据分析正文消息,以根据

电子邮件的目的对电子邮件进行分类。

数据源

·安然电子邮件数据集--这是由CMU托管的安然电子邮件存

档。

·安然数据描述(PDF) -对安然电子邮件数据的探索性分析, 可

以帮助您获得基础。




声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
...抛物线y=x2-4x+3与x轴交于A、B两点,与y轴交于点C,连AC,将直线AC向右... 抢劫罪的构成要素有哪些 抢劫罪的几个要素 抢劫罪违反了什么法律 转化型抢劫的法律认定 我想问问我的魔兽世界帐号值多少钱? 我的号能卖多少?(魔兽世界) 求评估魔兽世界账号价值,懂得来! 魔兽世界账号问题,我有一个90级的DK,想便宜出售了,直接卖了,想问问大... 魔兽世界号价值评估 用辽宁移动手机话费可以买什么? 辽宁移动话费有什么优惠政策 梦见晚上两次被拘留的预兆 200smart和1200步进电机一样么 已出售限价商品房还可享受拆迁补偿吗 经济适用房如果拆迁怎么办 旧房子遇到拆迁怎么办 地域性分类信息网站中,实行信息收费方式可行吗? 剑三重制版双开后其中一个角色WSAD键和左边键位失灵,聊天栏却可以打字... 电脑用了四、五年,现在开机老是花屏,通常要开几次才正常,而且以前2G左 ... ...这电脑配置开机后第一次进dnf游戏会卡死,双开打团有时也会卡死,有... 梦见河水泛金光的预兆 玩LOL总是被检测到双开,但是我没有双开。重启后玩一局还是被检测到双开... 开机搜狗游览器出现自动双开的情况。 描写地响的词语 【哀弹】 期货铁矿石多少钱? gtx680配什么机箱电 林熙蕾演过哪些禁播电影? 梦见两只猫同时咬住拇指的预兆 通信机房拆除旧设备时应先拆除( )。 中央空调拆除后怎么处理 旧房装修暖气怎么拆 滑跪时,在草皮上留下三条杠的是谁 中国十大名牌大学是哪些学校 巅峰时期的德罗巴到底有多强? 我问我男朋友他回来,他发这个是什么意思呢,我们是异地恋呢,他发个... 电脑内存插槽没坏,插上内存条灯亮,就是开不了机,是什么问题? 海澜之家色号90L是什么颜色? 电脑开不了机是什么原因内存灯亮cpu风扇转显卡风扇不转主箱红绿灯都亮... 服装90l是多大 ...3岁大了,但是一直没打疫苗。 请问过年回家能寄养吗? 运城市中心医院的历史沿革 猫咪寄养一般多少钱一天啊? 求云浮汽车客运站到云浮人民医院的最短的公交路线 父母都是中国公民,怎样为孩子办理签证延期或寄养 84年农村老人户外寄养的条件是什么 寄养的孩子能上户口吗 美团优选排期太多了怎么解决 圆规怎么换笔芯我家圆规不懂怎么换笔芯啊!