右下角图片

Halo出行-通勤活跃用户标签开发

2024-12 哈啰出行 困难

在现代城市生活中,共享单车作为一种便捷、环保的出行方式,已经广泛融入到居民的日常交通选择中。

根据用户的不同需求,共享单车的使用场景多种多样,涵盖了休闲娱乐、社交聚会、紧急赶时间、日常通勤等各类情况。

本次研究聚焦于 上班通勤场景,这是共享单车使用频率最高的场景之一。在大城市中,通勤是居民每日必须面对的任务,尤其是在高峰时段,公共交通可能因拥堵而变得不可靠或拥挤不堪。共享单车以其灵活性和便捷性,成为了许多上班族解决“最后一公里”问题的理想选择。具体而言:

  • 从地铁站到写字楼:许多上班族依赖地铁作为主要的通勤工具,但由于地铁站与工作地点之间可能存在一定的距离,共享单车成为了连接这两点的最佳桥梁。

  • 避开交通拥堵:在早晚高峰期间,道路车辆密集,乘坐私家车或出租车可能会遇到严重的交通堵塞。相比之下,骑共享单车可以更灵活地穿梭于街道之间,节省通勤时间。

  • 健康生活方式:骑行不仅是一种绿色出行方式,还能帮助人们保持身体健康。对于一些注重健康的上班族来说,骑行上下班既能锻炼身体,又能享受户外的新鲜空气。

为了更好地理解这一特定场景下的用户行为模式,并优化共享单车服务以满足通勤需求,我们定义了一个关键指标——活跃用户标签 (active_tag)

该标签用于标识那些在连续三个月每个月至少有5天往返地铁站到写字楼进行通勤的用户。通过识别这些高频通勤用户,我们可以进一步分析他们的出行习惯,提供个性化的服务推荐,如优惠券、专属停车区等,从而提升用户体验和满意度。

此外,这项研究还将有助于公司制定更精准的运营策略,例如合理调配单车资源、优化站点布局以及加强高峰时段的调度管理,以确保共享单车系统能够高效服务于广大通勤用户。

表和字段介绍

hello_bike_riding_rcd,出行记录表

  • 截取了北京望京片区切片
  • 包含订单id、用户id、出发时间、锁车时间、出发地点、锁车地点5个字段

gd_loc_map,地理位置映射表

  • 从高德接口获取,近期已有业务同事反映部分地点分类不准的情况
  • 包含地点、地点分类字段

业务口径

  • 时间选取:2020-2024年
  • 通勤活跃:连续3个月,每个月都有5天或以上符合通勤路径的骑行记录。
  • 通勤路径:从地铁站-写字楼或从写字楼到地铁站

要求输出

  • 对所有用户打标
  • 输出客户id和标识两列,user_id、active_tag(0,1)

运力调度评估 字符串处理 时间日期 聚合函数 窗口函数 口径探查 行列转化 多表连接 高级条件过滤 CTE或SubQuery group by inner join or and max case when row_number sum over lag distinct timestampdiff date_format
排名 用户名 得分 耗时(ms)
1 小橘子 100.0 2887.62
2 沸羊羊 100.0 3208.81
3 空空在饼状图54980 100.0 3229.99
4 无糖零卡 100.0 3285.06
5 100.0 3323.0
6 Mikan 100.0 3344.45
7 菠萝菠萝 100.0 3369.78
8 我会有猫的 100.0 3768.12
9 Refrain 100.0 3995.72
10 蜘蛛侠在谈薪74642 100.0 4010.92
11 小小明-代码实体 100.0 4048.57
12 美无澜 100.0 4188.1
13 分类器强化学习21410 100.0 4201.7
14 绿巨人在打卡98334 100.0 4622.14
15 Lyndon 100.0 4799.47
16 梯度提搞定了2056 100.0 4982.1
17 咸鱼茄子煲 100.0 5649.03
18 随机林学外语5978 100.0 8582.38
19 Delores在决策树63959 100.0 9159.36
20 卡魔拉在深度学73144 99.8 2.05
21 药丸 97.31 6172.86
22 计划通 89.39 5264.91
23 绯红女巫在emo 83.61 4079.22
24 杰伦深度学习18060 79.3 13704.65
25 星爵在打卡3769 73.58 8173.72
26 回归树爱跨栏37012 70.82 7243.43
27 小于零 68.01 12858.06
28 逻辑斯看星星84098 67.94 4603.18
29 思扣SQLintern小助理 67.52 2.25
30 陈清泉冻鱼拍 67.52 3983.26
31 李达康香蕉吧啦43957 50.75 3112.8
32 润发搞定了90570 44.11 3576.13
33 猪猪在逛展30400 0.0 2015.42

gd_loc_map,地理位置映射表

loc_nm loc_type
中关村电子城 写字楼
凯德广场 写字楼
北京机床研究所 地铁站
天启大厦 写字楼
将台西 写字楼

hello_bike_riding_rcd,出行记录表

id user_id start_time end_time start_loc end_loc
1 u420200 2023-12-28 13:46:51 2023-12-28 14:16:51 恒通国际商务园 凯德广场
2 u549693 2024-03-15 13:03:51 2024-03-15 14:03:51 西门子大厦 恒通国际商务园
3 u390764 2024-11-22 16:34:51 2024-11-22 17:20:51 将台西 望京
4 u476172 2024-03-28 07:02:51 2024-03-28 08:00:51 望京南 将台西
5 u541066 2024-02-12 21:32:51 2024-02-12 22:03:51 北京机床研究所 恒通国际商务园

user_id active_tag
u000911 0
u000926 0
u002686 0
u003046 1
u003165 1
u004183 0

ID100 通勤、午休、临睡个时间段活跃人数分布
简单 between and or case when distinct count date_add date_format < >= 时间日期 字节跳动
ID111 找出所有以酒店为起点或终点的类别组合的最热门路线  
中等 group by inner join or row_number count 多表连接 多连接条件 运力调度评估 滴滴出行
ID178 各班第一名  
中等 inner join max case when row_number 字符串处理 窗口函数 行列转化 多表连接 经典-学生表课程表 作业帮
ID227 快手面试真题(4)按购买金额统计用户数  
中等 group by inner join between and case when distinct round date_format 时间日期 聚合函数 百分比计算 CTE或SubQuery 客户订单分析 2025春招面试真题 快手
ID231 得物面试真题(4)首单Mac二单iPhone的客户  
困难 max case when row_number 窗口函数 CTE或SubQuery 客户订单分析 2025春招面试真题 得物

MySQL 8.0

00:00