x

引导后台提高学生对数据科学的交叉应用,积累相关经验,用实践打动招生官。

2022-12-22 11:22:53编辑:智库News

本文为留学生原创,转载请联系授权。※

引导后台提高学生对数据科学的交叉应用,积累相关经验,用实践打动招生官。

背景学生Y的本科背景江南大学的化学背举项目;留学生机器学习项目实战。

携程网酒店客房更新预测系统

01

背景

自从我打算出国留学,我就积极联系各种留学中介,与新东方、启德、金吉列等有过交流。并讨论了出国留学的问题。在我交流过的留学中介中,给我印象最深的是智楠留学。而不是大空的口头对话,直接把机构的背景数据给我看,简单明了的跟我分析,以我的背景能上什么样的学校。这种坦率和直接是我选择智楠留学的主要原因。

而且研究生阶段想申请专业,需要提升相关背景。导游出国留学的签约费和其他机构差不多,还包含背景提升项目,性价比极高。在考虑了各种因素后,我最终选择了贵德留学作为23fall帮我申请留学的申请机构,并参与了贵德提供的后台推广服务。

我本科专业是应用化学,研究生却想报考数据科学或者cs相关专业,可谓跨度巨大。不过还好,我的数学课成绩不错。如果我能有数据科学或者cs相关项目的实战背景,把这个项目放在我的简历和PS里,就能让招生官看到我转专业的努力,申请难度会降低很多。

02

项目过程和收获

机器学习实战项目预定开始后,导师梅老师很快联系了我,约好了腾讯,给我详细讲解了本次机器学习实战训练营的安排。

这个项目分为两个阶段。首先,作为第一阶段,六周的学习时间通过网上课和作业的形式,向我介绍了python的基本操作,以及熊猫、numpy、Matplotlib等各种数据分析数据库的使用方法。之前对python语言并不熟悉,但是经过几周的系统学习,已经可以熟练的编写代码处理各种数据。由于之前没有系统的学习过python,所以在学习之初,我有很多专业人士可能觉得很奇怪的问题,但是每次问梅老师,他都能及时耐心的帮我解答疑惑。

在掌握了必要的编程技巧后,我开始学习机器学习算法的理论和实践。本项目提供的在线课程清晰有条理地讲解了各种机器学习算法的原理,如线性回归、随机森林、堆叠算法、Kmeans聚类算法等。原理讲解完后,会有匹配的实战案例来讲解和应用算法。

虽然机器学习的模型已经用python非常方便地打包了,但是只需要调用它的打包函数就可以了。但是,学习原理不仅让我明白了简单代码背后的道理,也让我在应用中更加得心应手。这个项目通过理论+实战的方式,让我在修完课程后,对机器学习的基本算法形成了一个大致的框架,这让小白这个应用化学专业的本科生非常满意。

机器学习中为了得到更好的训练模型,有很多超级参数需要人工调整,有很多特征需要筛选。所以这门课也包括了参数调整技巧和特征工程的讲解,让我知道各种参数的作用以及如何筛选特征。经过这样一套第一阶段的课程,可以说作为一个对机器学习一无所知的化学本科生,我被成功地带进了机器学习的大门。

而第二阶段——项目的实战阶段是检验我学习成果的时候。

我的实际项目是基于机器学习的智能酒店系统。如今,大数据技术广泛应用于各行各业。如何在酒店运营管理中更有效地利用大数据,高效地管理酒店,成为酒店经营者为实现利润最大化需要考虑的重要研究课题。

我的智慧酒店系统会根据携程的酒店数据预测客户第二天是否入住,比如客人数量、入住时间、是否熟客、所需车位数量、历史取消次数等。该系统可以帮助酒店安排房间,并制定相关的营销计划。

在进行这一实际任务时,第一个难点就是对海量数据无从下手的困境。虽然在第一阶段的课程中已经有所研究,在课后作业中也有所实践,但之前使用的数据大多是比较小规模且分布均匀的。但是现实中的数据量大面广,在某些方面可以说是混乱的。虽然我认为经过第一阶段的学习,我已经掌握了数据清洗和预处理的方法,但是第一次面对实际的数据集,我还是无所适从。

然而从另一方面来说,这也反映了实战题目的合理性。只有用亲身实践去面对,才能真正做到理论与应用相结合。既然数据太大太复杂,我解决不了,那我就把这个大问题分解成几个小问题,一个一个解决。经过去除重复,删除缺失值,编码类别特征,归一化数据特征,删除无用特征,最终得到一个可以应用于机器学习的数据集。

得益于python的便利,你可以简单地调用代码来构建一个机器学习模型。我通过特征工程提取相对重要的特征数据,应用logistic回归模型、决策树分类模型、随机森林模型对数据集进行训练,调整寻找最佳参数。最后,模型能够以较高的准确率预测客户是否会停留在测试集上(logistic回归87%,决策树83%,随机森林82%)。最后基于这个项目的实战,完成了一份实战报告。

(摘自实战报告)

这个机器学习训练营丰富了我的后台经验。作为一个转专业的学生,如果这种与申请专业紧密相关的经历能够在文书和简历中体现出来,那么相信会比其他没有相关经历的转专业学生有一定的优势。而且目标专业的学习和经历也能打动招生官,让ta看到申请人转专业所做的努力,拿到offer的几率也会更高。

个人认为,作为一名化学本科生,有机会系统学习机器学习的理论知识,最后完成一个实践项目,拓宽了知识面,锻炼了能力。我对这个机器学习训练营很满意。在此,我也非常感谢我的指导老师梅老师的帮助。她总是不厌其烦地回答我那些在现场看起来很奇怪的问题。总的来说,这次机器学习训练营真的是收获满满。

更多排行:[db:tag]