24T2 COMM5007 - Group - Assignment - P2
24T2 COMM5007 - Group - Assignment - P2
P2 写作
Report 写作举例
Executive Summary
⻓
布和趋势。【分析目的】其中事故发生的频率和伤亡人数是重点研究对象。【Measure】
学
通过 Python 数据可视化技术【分析方法】,我们发现事故主要分为非伤亡(拖车)、受伤
k
和致命三类【可视化结果 1】,其中非伤亡事故占多数【可视化结果 2】。某些特定天数和
r
移动类型在事故总量中占有较大比例【可视化结果 3】。
M a
Problem Statement.
(写清楚提的问题,以及 measure:衡量这个问题的数据)
第一,哪些时间段的交通事故频率最高?【Question 1】分析中统计每周不同天数的交通
事故总数。可以通过分析数据集中日期,Time of day, Month of crash 等字段,计算不同
时间段的事故数量,识别出事故频率较高的天数。【Measure 1】
第三,….
1. 数据源:https://opendata.transport.nsw.gov.au/
对于找了额外数据的小组,这里解释新加入的数据。(选做)
2. 局限性:数据的质量问题,或者你认为分析还缺少的信息。
Data Analytics
Data Cleaning
一定要写有没有 missing data。
分析检查并处理了数据中空值,和 outlier。
学 ⻓
Data Exploration
k
展示统计值,以及 Histogram, Box Plot 或者 Bar Chart 描述数据分布。
ar
M 简单解释重要数据的分布。
Question 1:哪些时间段的交通事故频率最高?
所有图片必须有脚注。
图片太多,考虑放一部分到 appendix,
正文中可以引用。
⻓
Figure 1 显示,交通事故的高峰时段集中在早上 8 点到晚上 6 点之间,尤其是上午 8 点到
10 点和下午 4 点到 6 点。这些时段可能与上班和下班高峰时间重合,反映出交通流量较
学
大时的事故风险较高【维度 1】。非伤亡(拖车)事故在所有时段内占据了较大的比例,
k
尤其是在高峰时段。这表明虽然事故频繁发生,但大多数事故并未导致严重伤害。【维度
r
2】图表中还包含了一部分时间未知的事故数据。这部分数据虽然数量不多,但可能反映
a
了数据集的限制【特殊情况讨论】。
M
Figure 2 显示,周五的交通事故数量最高,接近 15000 起。这可能与周末前的交通流量增
加有关【维度 1】。受伤事故在周五和周末期间略有增加,显示出这些天数内的交通事故
不仅数量多,而且严重程度较高【维度 2】。
….
Question 3:…
….
⻓
Flow Chart
学
可以用 PPT 画。有能力的同学还可以尝试其他工具比如 Visio。再截图到 Report 中。流程
k
图展示了从数据收集、预处理、探索性分析、建模到结果解释的过程,并包括了反馈调整
r
步骤。
a
(下图只是举例,flow chart 必须结合选择的数据集画)
M Data
Visualization
Collect Create
New Data Report
Conclusion
分析表明, 一周中的某些天数显示出一致的较高事故频率。例如,周末或特定工作日可
能会出现高峰,这可能与较高的交通量或特定的驾驶模式相关。【Question 1 小结】非伤
亡(拖车)事故的比例最高,表明尽管事故频繁发生,但很多事故并未导致严重伤害或死
亡。然而,所有天数都有致命和受伤事故,凸显了持续进行道路安全举措的必要性。
【Question 2 小结】…. 【Question 3 小结】….
(接着根据结果提建议)
根据分析结果,我们建议将安全宣传和干预措施集中在事故频率较高的天数。在这些天数
⻓
进行定制化的信息传播和执法行动,可能有助于减少事故发生。【建议 1】同时考虑基础
设施改进,如更好的照明、清晰的标志或道路重新设计。【建议 2】….
Reference
r k 学
a
如果过程中引用文献解释要写 reference (Harvard 或者 APA7)。
M
如果过程中用到了 AI,也需要引用。
Appendix
正文中放不下的图表。(正文可以引用 Appendix)
AI 的使用过程可以简述。(选写)
不需要放 Python 代码。