没稀有学和编程基本,这几个数据科学项目相识一下
大数据文摘出品 编译:蒋宝尚 本日,文摘菌给各人先容几个较量有特色的数据科学模块,这些模块本来是一些西席用来举办解说行使,,辅佐门生有机遇行使与其课程相干的数据集,并指导门生举办数据说明以及辅佐领略统计和计较机道理。 一路来看~ 模块合集链接:https://ds-modules.github.io/DS-Modules/ Introduction to Phonetics and Phonolog 这个模块由两个尝试构成,尝试所用到的数据都是门生本身网络的,而且在这个模块中,门生独立说明数据并编码。在第一个尝试室里,门生们研究声音开始以及竣事的时刻,以及母语口语和身高之间的相干性。在第二个尝试中,门生说明元音发音,并将研究个别彼此较量,从而显现单个元数据对特性猜测手段的影响。该模块合用于没有编码或统计履历的门生。 Neighborhood Mapping 本模块让门生说明并可视化整个东湾生齿普查区的社会经济和生齿变革环境。门生们到社区举办定性调查,然后与生齿普查数据举办较量。把一些的调查功效组合成一幅舆图。该模块合用于没有编码或统计履历的门生。 Macroeconomics 这个模块包括一些宏观经济学题目集。 第一个notebook辅佐门生行使Latex公式以及教他们怎样插图。 第一个notebook的建模部门可视化了索洛增添模子。该模块还行使自动评分成果可以实时反馈门生提交的功课。同样,该模块也合用于没有编码或统计履历的门生 Chinatown and Culture of Exclusion 行使20世纪-21世纪的生齿统计数据,让门生说明一个特定的唐人街跟着时刻的推移是怎样变革的。在尝试进程中,门生可以行使一些简朴的文天职析要领做相干研究。 Implicit Bias and Social Outcomes 本模块向门生先容相干和回归说明。门生从一个关于康健功效的数据集和一组关于内隐成见的数据齐集挑选出整个美国的县级数据集。然后,他们将这两个数据集归并,并计较相干性和举办回归猜测,从而确定成见与康健功效之间是否存在相干性。 Moral Foundations Theory 这些模块将政治演讲中的词汇行使与道德基本理论接洽起来。这些数据的统计揣度和可视化辅佐门生探求守旧派和自由派总统候选人之间的修辞差别。然后,门生们将数据驱动的要领作为修辞器材举办研究和批驳。 Sumerian Text Analysis 本模块行使一个风趣的数据集,即苏美尔文学电子文本语料库(ETCSL)。这些文本是从六千年前的资料中翻译出来的。在本模块中行使的技能在文天职析中不太常见,如k均值、分层聚类和多维缩放。 Data, Prediction, and Law 操作2016年美国总统竞选演讲的数据,门生从语音文本中发掘特性,可视化这些特性,并用主因素说明提取特性。该模块最后给出了一个三维特性图的例子,此模块必要门生有一些统计学常识。 最后,在次给出项目合集:https://ds-modules.github.io/DS-Modules/ 【本文是51CTO专栏机构大数据文摘的原创文章,微信公家号“大数据文摘( id: BigDataDigest)”】 戳这里,看该作者更多好文 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |