Introduction

欢迎来到 Kaggle 的中级机器学习课程!

如果您具备一些机器学习背景,并且想要学习如何快速提升模型质量,那么您来对地方了!在本课程中,您将通过学习以下技能来加速您的机器学习专业知识:

  • 处理实际数据集中常见的数据类型(缺失值分类变量);
  • 设计流程来提升机器学习代码的质量;
  • 使用高级技术进行模型验证(交叉验证);
  • 构建广泛用于赢得 Kaggle 比赛的先进模型(XGBoost);以及
  • 避免常见且重要的数据科学错误(数据泄露)。

在此过程中,您将通过完成每个新主题的实际数据练习来应用所学知识。这些实践练习使用来自Kaggle Learn 用户房价竞赛的数据,你将使用 79 个不同的解释变量(例如屋顶类型、卧室数量和浴室数量)来预测房价。你将通过提交预测来衡量你的进度,并观察你在排行榜上的排名上升!

先修课程

如果您之前构建过机器学习模型,并且熟悉模型验证欠拟合和过拟合随机森林 等主题,那么您就可以学习本课程了。

如果您是机器学习新手,请查看我们的机器学习入门课程,其中涵盖了学习本课程所需的所有准备内容。

轮到你了

继续进行**第一个练习**,学习如何向 Kaggle 竞赛提交预测,并确定在开始之前可能需要复习的内容。