以下是COMP6037课程作业2的详细翻译:
学校: 工程、计算与数学学院
大学: 牛津布鲁克斯大学
这是一次个人作业,因此每位学生需独立提交自己的作业。
本次作业占该模块最终成绩的60%。
此次作业评估的学习成果包括:
- 批判性分析数据可视化方法与人类感官模式的关系;
- 为时间序列、动态和高维数据创建适当的可视化;
- 制定数据交互的方法以支持探索性数据分析。
您需要选择一个大数据集,并制作一个可视化来沟通和探索数据中的特征。最终成果是一个互动的HTML文件,同时需提交报告、R脚本以及相关数据和可视化文件。
您可以自由选择任何公开可访问的数据集,并将在巩固周期间讨论您的选择。
-
数据导入:
- 数据需导入R中以进行探索性数据分析(EDA)和可视化开发。
- 可对数据进行转换以便导入,但转换过程不在评估范围内。推荐使用静态CSV格式的数据集。
-
数据框格式:
- 数据需以单一的R数据框("data.frame"类变量)表示。
- 提交时需将数据框导出为名为
data.csv
的文件,使用readr
包的write_csv
函数。
- 内容:
- 描述数据来源和背景(100-200字,最多1张图)。
- 可使用有助于理解数据的图片,但需注明来源。
- 提供数据的公开访问链接。
- 提供选定变量的总结统计信息(200-300字,1-2个表格,最多1张图)。
- 包括数据大小(行数、列数、导出的CSV文件大小)。
- 列出每列数据的类型。
- 如有必要,可包含缺失数据可视化图(如
visdat
包的viz_miss
图)。
- 描述数据来源和背景(100-200字,最多1张图)。
- 内容:
- 讨论数据中的某一洞察(趋势或行为),并计划为其制作可视化(300-500字,最多3张图)。
- 说明可视化目的。
- 定义可视化的目标受众。
- 描述计划的互动式可视化(使用
plotly
实现)。 - 可用最多3张静态图片来说明洞察和设计计划。
- 讨论数据中的某一洞察(趋势或行为),并计划为其制作可视化(300-500字,最多3张图)。
-
内容:
- 提交最终可视化,需通过单一的R脚本生成并保存为HTML文件。
- 可视化文件需命名为
visualisation_2.html
。 - 提交的R脚本需完整注释,并包括
htmlwidgets::saveWidget()
函数以保存可视化。
-
报告内容:
- 描述最终可视化的设计决策和代码编写考量(100-200字)。可包括:
- 可访问性;
- 文件大小;
- 目标受众的理解;
- 任务的约束条件。
- 描述最终可视化的设计决策和代码编写考量(100-200字)。可包括:
- 提交的内容包括:
- 报告(PDF格式,基于提供的模板)。
- 脚本(
script.R
)。 - 数据文件(
data.csv
)。 - 可视化文件(
visualisation_2.html
)。
部分 | 分数 |
---|---|
第1部分:背景与EDA | 20分 |
第2部分:设计 | 20分 |
第3部分:最终可视化 | 20分 |
总计 | 60分 |
需引用作业中使用的其他人工作并附上参考文献清单(需使用学校推荐的参考格式)。避免抄袭和串通。