AirJD 焦点
AirJD

没有录音文件
00:00/00:00
加收藏

外卖商家排序的算法演进 by 温赟@美团

发布者 security
发布于 1464225558670  浏览 8361 关键词 人工智能, 算法 
分享到

第1页

外卖商家排序的算法演进

温赟 美团外卖



第2页

外卖商家排序的算法演进

温赟 wenyun@meituan.com



第3页

内容概览

• 外卖行业发展简介 • 外卖与团购的异同 • 外卖商家排序的技术演进 • 外卖商家排序的算法挑战与应对 • 小结



第4页

外卖行业发展简介



第5页

外卖⾏行业发展简介



1993.8

常州·丽华 快餐



2013.12

杭州·淘点 点

北京·美团 外卖



2014.11.9 美团外卖 单天百万单



2016.1

去年餐饮行 业收入突破

三万亿



2009.4

上海闵 行·饿了么



2014.5

北京·百度 外卖



2015.12.20

美团外卖

单天三百万 单



第6页

外卖⾏行业发展简介

来源:艾瑞网 2015年中国外卖O2O行业发展报告



第7页

外卖与团购的异同



第8页

外卖与团购的异同



• 团购应用、网站



• 低价活动



• 线上支付



引流 支付



外卖 • 外卖应用 • 低价活动



• 线上支付



• 商家套餐 • 到店消费

就餐

• 自助点餐 • 等待配送



团购



第9页

外卖与团购的异同

• 移动化 • 本地化 • 场景化 • 时间刚性 • 资源约束



第10页

移动化



美团团购 移动端交易占比



100 90 80 70 60 50 40 30 20 10 0 2011



2012 2013 百分比







美团外卖 移动端交易占比



100 90 80 70 60 50 40 30 20 10 0 2013



2014 百分比





第11页

本地化



100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%



美团外卖各品类订单距离分布占比图

0 1km 1 2km 2 3km 3 4km 4 5km >5km



第12页

场景化



美团外卖单天订单趋势图



第13页

时间刚性



第14页

资源约束

• 食材库存 • 厨房产能 • 配送运力

订餐 出餐 送餐



第15页

外卖商家排序的技术演进



第16页

产品形态



第17页

技术框架



ek S



APP

API HI

Rank Service A/B Testing Engine L1: a i L2: A H L3: Sa P



m c

/



第18页

在线服务

• A/B Testing

• 做AA测试,坚持做 • 重视抽样误差 • 关注时间周期效应



第19页

在线服务

• 插件化策略模块

• 模块分解可读性 v.s. 代码性能优化 • 重视接口约束合约 • 关注插件链的前后依赖



第20页

在线服务

• 调试系统

• 结果的可解释性 • 业务、产品的协同



第21页

离线流程



• 流量清洗



• 抓取流量 • 无效加载



最后点击/下单



skip above +2



第22页

离线流程



• 特征矩阵



用户-商 家



• UP-浏览行为

• UP-点击行为 • UP-成单行为

• UP-加购行为 • UP-评论行为

• UP-收藏行为



• P-基本信息

• P-转化率 • P-优惠活动

• P-用户评价 • P-热门信息

• P-竞对信息

• P-配送信息 • P-服务质量



商家



用户



• U-人口统计

• U-品类偏好 • U-购买力

• U-优惠偏好 • U-上下文信息



第23页

离线流程



• GBDT——机器学习模型Startup



• Decision Tree 简单贪婪



• Bagging



民主智慧



• Boosting



知错就改



• Shrinkage



小步快跑



• 非线性模型 & 特征选择功能



第24页

效果⾥里程碑

• 时段特征交叉



• 特征工程

• 按照小时数hour划分 用户行为数据,取前后 n个小时数据进行衰减 后线性加权

• 按照星期数weekday 划分用户行为数据,按 照不同的相似度关系衰 减后线性加权

• 问题

• 商家扩展新的营业时段



第25页

效果⾥里程碑

• 距离特征交叉



• 特征工程

• 按照距离区间分段确定转 化率基准,供平滑参考

• 按照GeoHash划分区域 网格,取上下前后左右共 计9个方格确认区域用户 行为热度数据

• 问题

• 计算和存储开销明显增大



第26页

效果⾥里程碑

• CTR还是ROI

• 基于用户-商家预测下单金额的重排序



DAU



成交额



CTR



CVR



平均下单次数



单均价



第27页

外卖商家排序的算法挑战与应对



第28页

排序稳定性

• 排序结果不稳定的成因

• 不同人——个性化策略 • 不同地点——LBS检索、商家配送范围 • 不同时间——时段、星期、场景 • 不同竞对营业情况——同行歇业

• 效果的稳定性 & 结果的可解释性



第29页

特征实时化

• 商家实时库存 • 商家服务质量 • 商家活动情况 • 配送运力情况



第30页

特征实时化



第31页

跨端系统反馈



• 配送拥塞控制



• 配送实时负载指标 • 配送等待时间



调整商家 排名



• 配送预计送达时间



关联商家 订单配送

超时



用户选择 高排名商 家下单

商家接单、 配送派单



区域配送 运力紧张



第32页

跨端系统反馈



• 商家库存售罄预测



• 单量预测



调整商家 排名



用户选择 高排名商 家下单



区域局部 单量短期

预测



商家接单、 配送派单

区域配送 实时负载



第33页

Explore & Exploit

• 外卖商家供给的演变



第34页

Explore & Exploit

• 外卖平台的基尼系数



第35页

Explore & Exploit

• 多来源数据融合解决冷启动

• 数据重合覆盖度 • 迁移学习的可信度

• 基于用户好奇心偏好的探索

• 专一 v.s. 尝鲜



第36页

小结



第37页

⼩小结

• 技术驱动的前提理解业务 • 做正确的事,不做容易的事 • 在正确的时间做正确的事 • 关注模型策略对数据分布的影响



支持文件格式:*.pdf
上传最后阶段需要进行在线转换,可能需要1~2分钟,请耐心等待。