0% found this document useful (0 votes)
60 views5 pages

24T2 COMM5007 - Group - Assignment - P2

Comm assignment

Uploaded by

Erutangisrg 1995
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
60 views5 pages

24T2 COMM5007 - Group - Assignment - P2

Comm assignment

Uploaded by

Erutangisrg 1995
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 5

Python 数据可视化分析

P2 写作

Report 写作举例

Executive Summary

(简写,不用 reference,具体结论和建议 conclusion 中再详细写)

本次分析通过 NSW 政府的公开数据【数据】研究了 2018 年至 2022 年间的交通事故分


布和趋势。【分析目的】其中事故发生的频率和伤亡人数是重点研究对象。【Measure】


通过 Python 数据可视化技术【分析方法】,我们发现事故主要分为非伤亡(拖车)、受伤

k
和致命三类【可视化结果 1】,其中非伤亡事故占多数【可视化结果 2】。某些特定天数和

r
移动类型在事故总量中占有较大比例【可视化结果 3】。

M a
Problem Statement.

(写清楚提的问题,以及 measure:衡量这个问题的数据)

为了有效降低 NSW 的交通事故【motivation】,本次分析关注以下的 research


questions。

第一,哪些时间段的交通事故频率最高?【Question 1】分析中统计每周不同天数的交通
事故总数。可以通过分析数据集中日期,Time of day, Month of crash 等字段,计算不同
时间段的事故数量,识别出事故频率较高的天数。【Measure 1】

第二, 不同移动类型(如州内、州际)在事故总量中所占比例如何?【Question 2】可以


通过分析数据集中 MovementType 字段,计算每种移动类型的事故数量,并与总事故量
进行比较,以了解不同移动类型在事故中的相对比例。【Measure 2】

第三,….

(如果有分析中的 assumption,在这里写 assumption)


Data

1. 数据源:https://opendata.transport.nsw.gov.au/

对于找了额外数据的小组,这里解释新加入的数据。(选做)

2. 局限性:数据的质量问题,或者你认为分析还缺少的信息。

Data Analytics

Data Cleaning
一定要写有没有 missing data。
分析检查并处理了数据中空值,和 outlier。

学 ⻓
Data Exploration

k
展示统计值,以及 Histogram, Box Plot 或者 Bar Chart 描述数据分布。

ar
M 简单解释重要数据的分布。
Question 1:哪些时间段的交通事故频率最高?

所有图片必须有脚注。

图片太多,考虑放一部分到 appendix,
正文中可以引用。


Figure 1 显示,交通事故的高峰时段集中在早上 8 点到晚上 6 点之间,尤其是上午 8 点到
10 点和下午 4 点到 6 点。这些时段可能与上班和下班高峰时间重合,反映出交通流量较


大时的事故风险较高【维度 1】。非伤亡(拖车)事故在所有时段内占据了较大的比例,

k
尤其是在高峰时段。这表明虽然事故频繁发生,但大多数事故并未导致严重伤害。【维度

r
2】图表中还包含了一部分时间未知的事故数据。这部分数据虽然数量不多,但可能反映

a
了数据集的限制【特殊情况讨论】。

M
Figure 2 显示,周五的交通事故数量最高,接近 15000 起。这可能与周末前的交通流量增
加有关【维度 1】。受伤事故在周五和周末期间略有增加,显示出这些天数内的交通事故
不仅数量多,而且严重程度较高【维度 2】。

(详细建议可以留到 conclusion 再写。)


Question 2:哪些时间段的交通事故频率最高?

….

Question 3:…

….

至少有 3 个以上的分析问题,每个问题可以包含多个 visuals。尽量找 reference 解释你观


察到的趋势可能发生的原因。


Flow Chart


可以用 PPT 画。有能力的同学还可以尝试其他工具比如 Visio。再截图到 Report 中。流程

k
图展示了从数据收集、预处理、探索性分析、建模到结果解释的过程,并包括了反馈调整

r
步骤。

a
(下图只是举例,flow chart 必须结合选择的数据集画)

M Data
Visualization

Collect Create
New Data Report
Conclusion

(总结所有 Question 的最终结果)

分析表明, 一周中的某些天数显示出一致的较高事故频率。例如,周末或特定工作日可
能会出现高峰,这可能与较高的交通量或特定的驾驶模式相关。【Question 1 小结】非伤
亡(拖车)事故的比例最高,表明尽管事故频繁发生,但很多事故并未导致严重伤害或死
亡。然而,所有天数都有致命和受伤事故,凸显了持续进行道路安全举措的必要性。
【Question 2 小结】…. 【Question 3 小结】….

(接着根据结果提建议)

根据分析结果,我们建议将安全宣传和干预措施集中在事故频率较高的天数。在这些天数


进行定制化的信息传播和执法行动,可能有助于减少事故发生。【建议 1】同时考虑基础
设施改进,如更好的照明、清晰的标志或道路重新设计。【建议 2】….

Reference

r k 学
a
 如果过程中引用文献解释要写 reference (Harvard 或者 APA7)。

M
 如果过程中用到了 AI,也需要引用。

Appendix

 正文中放不下的图表。(正文可以引用 Appendix)
 AI 的使用过程可以简述。(选写)
 不需要放 Python 代码。

最后记得核对作业要求,调整格式,并加入 coversheet 和目录等内容。

You might also like