大厂实战-情人节红包流向话题探索分析    

本场景共使用3张表,表结构如下:

用户基本信息简表模拟真实的数据治理场景,特意设计了脏数据,你能躲过这些坑吗?




1.红包发送方用户的基本信息缺失率有多高?(即有多少红包发送方用户无法在用户基本信息表中匹配?)(1分)

36.83%

59.62%

30%


2.哪一组红包金额的拒收率最高?(1分)

(50元, 200元]

(0, 50元]

[200元, +)


3.最受二线城市欢迎的红包金额为?(即发出次数最多)(1分)

200元

520元

1元


4.北上广深4大城市中,哪座城市的男性用户发出的520红包比例最低?(2分)

上海市

北京市

广州市


5.将用户划分为两大群体,都市丽人(年龄25-35岁,性别女,一线城市)和时尚大妈(年龄45-55岁,性别女,三四线城市)收到的红包平均金额分别是?(2分)

126.4元,127.7元

127.8元,120.0元

136.5元,129.4元