副标题:厦门2020年共享单车数据深度清洗与分析
为了深入分析厦门2020年底的共享单车数据并确保数据质量,我们依据中国城市规划设计研究院(CAUPD)自2020年至2024年发布的《中国主要城市共享单车/电单车骑行报告》中关于厦门市的各项指标描述和分类方法进行了数据清洗。通过参考报告中的数据结论和标准分类体系,来确认清洗数据的限制条件,确保其标准化和可比性,从而揭示厦门特有的出行模式和发展特点。我们先来对齐一下信息颗粒度;
参考《2021年度中国主要城市共享单车、电单车骑行报告》的指标,我们来看看厦门市;
厦门属于Ⅰ型大城市,也就是城区常住人口300万以上500万以下的城市;
活跃用户日均骑行距离: 1.7公里;
活跃用户日均骑行时长: 约12分钟;
骑行时长分布: 15分钟以内的骑行占总骑行次数的90%以上;
高峰时段平均骑行速度:Ⅰ型大城市速度约9.5km/h(2022年报告);
对于轨道规模在50-100公里的城市,如厦门,其周边共享单车的平均骑行距离为1.3公里;
基于上述的统计背景,我们来对现有数据进行清洗;
订单有效性限制条件(这个判断条件具有一定个人主观性)
单次订单的总骑行距离必须至少为50米;
单次订单的持续时间必须至少为1分钟;
对于每辆共享单车的单次订单,它会检查连续两个定位点之间的时间差和距离差(从一个定位点到下一个定位点的时间间隔不得超过1分钟,且从一个定位点到下一个定位点的距离不得超过100米(相当于24km/h)),以判断是否构成一个有效的订单;
如果超过3分钟没有出现下一个坐标点