第1页
外卖商家排序的算法演进
温赟 美团外卖
第2页
外卖商家排序的算法演进
温赟 wenyun@meituan.com
第3页
内容概览
• 外卖行业发展简介 • 外卖与团购的异同 • 外卖商家排序的技术演进 • 外卖商家排序的算法挑战与应对 • 小结
第4页
外卖行业发展简介
第5页
外卖⾏行业发展简介
1993.8
常州·丽华 快餐
2013.12
杭州·淘点 点
北京·美团 外卖
2014.11.9 美团外卖 单天百万单
2016.1
去年餐饮行 业收入突破
三万亿
2009.4
上海闵 行·饿了么
2014.5
北京·百度 外卖
2015.12.20
美团外卖
单天三百万 单
第6页
外卖⾏行业发展简介
来源:艾瑞网 2015年中国外卖O2O行业发展报告
第7页
外卖与团购的异同
第8页
外卖与团购的异同
• 团购应用、网站
• 低价活动
• 线上支付
引流 支付
外卖 • 外卖应用 • 低价活动
• 线上支付
• 商家套餐 • 到店消费
就餐
• 自助点餐 • 等待配送
团购
第9页
外卖与团购的异同
• 移动化 • 本地化 • 场景化 • 时间刚性 • 资源约束
第10页
移动化
美团团购 移动端交易占比
100 90 80 70 60 50 40 30 20 10 0 2011
2012 2013 百分比
美团外卖 移动端交易占比
100 90 80 70 60 50 40 30 20 10 0 2013
2014 百分比
第11页
本地化
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
美团外卖各品类订单距离分布占比图
0 1km 1 2km 2 3km 3 4km 4 5km >5km
第12页
场景化
美团外卖单天订单趋势图
第13页
时间刚性
第14页
资源约束
• 食材库存 • 厨房产能 • 配送运力
订餐 出餐 送餐
第15页
外卖商家排序的技术演进
第16页
产品形态
第17页
技术框架
ek S
APP
API HI
Rank Service A/B Testing Engine L1: a i L2: A H L3: Sa P
m c
/
第18页
在线服务
• A/B Testing
• 做AA测试,坚持做 • 重视抽样误差 • 关注时间周期效应
第19页
在线服务
• 插件化策略模块
• 模块分解可读性 v.s. 代码性能优化 • 重视接口约束合约 • 关注插件链的前后依赖
第20页
在线服务
• 调试系统
• 结果的可解释性 • 业务、产品的协同
第21页
离线流程
• 流量清洗
• 抓取流量 • 无效加载
最后点击/下单
skip above +2
第22页
离线流程
• 特征矩阵
用户-商 家
• UP-浏览行为
• UP-点击行为 • UP-成单行为
• UP-加购行为 • UP-评论行为
• UP-收藏行为
• P-基本信息
• P-转化率 • P-优惠活动
• P-用户评价 • P-热门信息
• P-竞对信息
• P-配送信息 • P-服务质量
商家
用户
• U-人口统计
• U-品类偏好 • U-购买力
• U-优惠偏好 • U-上下文信息
第23页
离线流程
• GBDT——机器学习模型Startup
• Decision Tree 简单贪婪
• Bagging
民主智慧
• Boosting
知错就改
• Shrinkage
小步快跑
• 非线性模型 & 特征选择功能
第24页
效果⾥里程碑
• 时段特征交叉
• 特征工程
• 按照小时数hour划分 用户行为数据,取前后 n个小时数据进行衰减 后线性加权
• 按照星期数weekday 划分用户行为数据,按 照不同的相似度关系衰 减后线性加权
• 问题
• 商家扩展新的营业时段
第25页
效果⾥里程碑
• 距离特征交叉
• 特征工程
• 按照距离区间分段确定转 化率基准,供平滑参考
• 按照GeoHash划分区域 网格,取上下前后左右共 计9个方格确认区域用户 行为热度数据
• 问题
• 计算和存储开销明显增大
第26页
效果⾥里程碑
• CTR还是ROI
• 基于用户-商家预测下单金额的重排序
DAU
成交额
CTR
CVR
平均下单次数
单均价
第27页
外卖商家排序的算法挑战与应对
第28页
排序稳定性
• 排序结果不稳定的成因
• 不同人——个性化策略 • 不同地点——LBS检索、商家配送范围 • 不同时间——时段、星期、场景 • 不同竞对营业情况——同行歇业
• 效果的稳定性 & 结果的可解释性
第29页
特征实时化
• 商家实时库存 • 商家服务质量 • 商家活动情况 • 配送运力情况
第30页
特征实时化
第31页
跨端系统反馈
• 配送拥塞控制
• 配送实时负载指标 • 配送等待时间
调整商家 排名
• 配送预计送达时间
关联商家 订单配送
超时
用户选择 高排名商 家下单
商家接单、 配送派单
区域配送 运力紧张
第32页
跨端系统反馈
• 商家库存售罄预测
• 单量预测
调整商家 排名
用户选择 高排名商 家下单
区域局部 单量短期
预测
商家接单、 配送派单
区域配送 实时负载
第33页
Explore & Exploit
• 外卖商家供给的演变
第34页
Explore & Exploit
• 外卖平台的基尼系数
第35页
Explore & Exploit
• 多来源数据融合解决冷启动
• 数据重合覆盖度 • 迁移学习的可信度
• 基于用户好奇心偏好的探索
• 专一 v.s. 尝鲜
第36页
小结
第37页
⼩小结
• 技术驱动的前提理解业务 • 做正确的事,不做容易的事 • 在正确的时间做正确的事 • 关注模型策略对数据分布的影响