狗熊会精品案例 | 共享单车损坏识别

日期: 2024-03-27 18:48:40|浏览: 125|编号: 39815

友情提醒:信息内容由网友发布,请自鉴内容实用性。

狗熊会精品案例 | 共享单车损坏识别

原创 狗熊会 XJTU磕盐小组

狗熊会,数据产业的高端智库!狗熊会帮助合作伙伴制定数据战略,培养数据人才,研究数据业务,发现数据价值,推动产业进步!

狗熊会使命:聚数据英才,助产业振兴

大家好,我们是XJTU磕盐小组。

随着近年来经济的飞速发展,中国城市化进程一日千里。随之而来的是大城市的通病,例如交通拥堵、城市污染与居民亚健康状态等。

公共自行车系统,作为缓解大城市的交通拥堵的一种工具在很多中国的城市开始被使用,例如北京,深圳,西安等地。商家也盯上了这块蛋糕,例如ofo,摩拜单车等共享单车公司也纷纷进入了这个领域。

与此同时,共享公共自行车领域也遇到了很多相应的亟待解决的业务问题公共自行车图,例如自行车的调度问题、自行车的损坏识别问题与自行车站点优化问题等。

本案例希望能够通过分析公共自行车站点的交易流水数据去识别疑似损坏的自行车,以此为公共自行车的维修保养提出合理性建议。

研究背景

19世纪末,自行车从西方传入中国,首先成为宫廷贵族们的玩具,称为“洋马儿”,即海外传过来的,能够代替马儿的交通工具。20世纪50年代左右,自行车成为了当时国人的梦想出行工具。中国被世界称为“自行车王国”。

90年代后期,受欧美的汽车文化影响,中国的汽车文化兴起。伴随着中国的城市化进程公共自行车图,家家有汽车成为了一种潮流。随之带来的是,交通拥堵,空气污染与亚健康等城市病。

人们又开始重新审视自行车这种交通工具,它能够在一定程度上缓解很多城市的通病。首先,在城市中提倡自行车出行的绿色生活,可以降低污染。其次,自行车出行可以锻炼身体。最后,自行车能够解决近距离出行,并与远距离的公共交通系统对接。例如可以骑自行车到地铁口,再乘地铁出发前行。

公共自行车系统作为一种鼓励绿色出行的办法,首先始于丹麦。他们在1965年创建了第一代的公共自行车系统,即政府主导的免费共享自行车体系。然后丹麦在1991年开始了第二代投币式公共自行车系统的使用。第三代的基于信息化技术的公共自行车系统在1996年始于英国。进入本世纪,商家也盯上了公共自行车系统的商业价值,纷纷推出了基于最新的移动互联网端的共享自行车平台,例如ofo与摩拜单车等。

数据描述

由于国内公共自行车系统,一部分属于初创公司,例如ofo等,其数据并不公开。而另一部分一般都属于事业单位,在数据公开方面仍然意识不强。故这里我们选择了美国芝加哥的Divvy公共自行车系统的交易流水数据与站点位置数据作为数据源,系统地研究第三代公共自行车系统。其实我们也获得了国内某些地区的公共自行车系统的类似数据,并进行了同样的分析。我们发现很多模式是相同的,但鉴于他们不希望公开这部分数据,故我们仅以芝加哥的数据为例来展示这些有趣的模式。

Divvy的公共自行车系统的交易流程如下:

这里我们收集了Divvy公共自行车系统2016年4月的交易流水与站点信息数据。交易流水数据条,其中涉及到公共自行车535个,公共自行车使用量为4537台。

统计描述分析

芝加哥()占地606.2平方千米,位于美国中西部的伊利诺伊州,东临壮丽的北美五大湖之一密歇根湖,是著名国际金融中心之一,也是全美人口第三大城市。

截至2016年6月底,芝加哥Divvy公共自行车系统共有535个站点。由于公众对公共自行车出行需求的增加,该系统也不断在现有和新的服务区域增加站点。如图所示,我们展示了芝加哥城Divvy站点的分布。

我们可以观察到中心部分的站点密度是最高的,事实上,这个部分的人口密度也非常高。其中,最繁华的区域当属芝加哥卢普区(Loop Area),这是芝加哥的中心商业区,也是Divvy最初建站的地方。为了进一步研究,我们将这个区域放大(如图),可以观察到站点极度密集,且有较高比例分布在道路交汇处和主干道上。

我们也想知道用户交易行为在时间上有什么特征。为此,我们将每天分为24个小时,根据交易的开始时间和结束时间,计算出这一个月中每个小时的还车量均值,如图所示。可以观察到,一天中的还车高峰都出现在早7点到9点和晚16点到18点,这恰好是大多数雇员和学生的上下班高峰时间。

我们可以继续观察自行车自身的使用情况。上图描述了自行车的月使用量分布。其中自行车一个月最大使用量是被借184次。而最小的自行车使用量为1次。可见这些自行车命运是不相同的。那些被使用次数非常多的自行车其实是最需要被“关(bǎo)怀(yǎng)”的。

疑似损坏自行车的识别

经过与业务人员的沟通,我们得知一般公共自行车系统都是政府委托给第三方公司运营。而最重要的考核指标是自行车使用量,自行车被使用的越多,被委托公司得到的政府支持越多。因此这是他们核心的业务考核指标。

影响自行车的使用总量的原因很多。业务人员讲述了其中的一个重要问题就是自行车的维修与保养。如果损坏的自行车过多或者自行车骑行不舒适,这都会大大降低公共自行车系统的用户体验,最终影响自行车的被使用量。如果能够高效的识别疑似损坏的自行车,能够帮助他们提升运营的效率。

本案例通过与业务人员沟通,提出了一种简单的业务指标去识别疑似损坏的自行车。下面是通过我们提出的疑似损坏自行车的业务指标找出的典型异常自行车的使用行为图。

例如自行车606,它在4月2号之后有相当大的一段时间没有被使用,而且在这一个月就只被使用了三次,使用行为非常异常。

各位看官,我们的剧透就到这里。如果想知道我们提出的业务指标是什么样子?想知道如何运用这个业务指标去运营管理公共自行车系统?如果想知道交易流水类型的数据如何清洗与整合?如果想掌握如何高效的处理几十万条的数据?如何处理时间类型的数据?如何去在地图上进行数据的描述分析?那就请各位客官猛戳狗熊会数据案例菜单吧。

提醒:请联系我时一定说明是从浚耀商务生活网上看到的!