2张图带你看懂今日头条推荐系统

推荐系统的“前身”
2016年,腾讯以80亿美元估值投资今日头条,结果大家都知道,张一鸣拒绝了腾讯的投资,现在大家也知道,字节跳动估值750亿美元,这一切,推荐系统功不可没。
因为搜索引擎和推荐系统太相似,相对来说也更简单(勿喷),所以我们先来了解一下搜索引擎。至于搜素引擎是不是推荐系统的前身,我很懒,没有考察。
如上图,搜索引擎分成为离线部分和在线部分,每一部分有不同的使命。
简单来说,搜索引擎的离线部分,专注于内容的搜集和处理。搜索引擎通过网络爬虫抓取网站上的原始内容,并将内容建立索引。这些内容会根据搜索系统的不同要求建立不同的索引体系,比如新闻类型的内容,会建立时效性的索引数据。
搜索引擎的在线部分,负责响应用户的搜索请求,完成内容的筛选和排序,并将最终结果返回给用户。我们举一个例子来说明这个流程:
用户在搜索引擎输入一个关键词NBA,搜索引擎搜索会对关键词进行分析、变换、扩充和纠错等处理,比如发现美职篮与NBA是同义词,就会将其扩充。接下来,搜索引擎会通过多种方式从不同索引数据获得候选集,这个环节叫召回。得到候选集后,搜索引擎通过更精细的计算模型对每一篇候选内容进行分值计算,对候选集的每一项进行排序。这个时候,还不能将结果展示给用户,需要经过规则干预这一过程。这个过程服务于特定的产品目的。假如有这样一条“官方网站保护规则,确保所有品牌搜索词都可以优先返回官网”,则此时就会将官网插入并置顶,最后再将结果展示给用户。此时,搜索引擎的工作还未结束。搜索引擎会根据用户的点击反馈去优化排序模型。比如,大部分用户都没有点击文章10,则文章10后续就不会获得更靠前的展现位置。
对以上两图进行总结就是下图,就是想让你们看的第一张图:
今日头条的推荐系统
通过上“一”张图,我们明白了搜索引擎的原理(无论怎样我都会装作你看懂了),而今日头条的这张图,就是比上图上多了一笔,考虑到这两张图高度相似,我这么懒的人,当然是不会去画的了,你们发挥想象吧。
其实,推荐系统也有离线部分和在线部分。上图(那不是图,是PNG)即是推荐系统的离线部分,与搜索引擎大同小异。
和搜索引擎一样,推荐系统也需要获取内容。推荐系统通过数据库导入、协议同步和用户提交等方式获取推荐内容。区别于搜索引擎,推荐系统获取内容的方式较多,且内容的结构化程度要远胜于搜索引擎爬虫抓取的内容。推荐系统也需要将待推荐的内容进行索引化处理,这一点与搜索引擎较为相似。推荐系统的维度会更多。
接下来,就是推荐系统的在线部分了。天啊,看到上图,发现推荐系统真的和搜索引擎太像了,就多了一笔。
搜索引擎的输入为用户的搜索关键词,推荐系统同样需要输入,只是这个过程用户没有感知,对推荐系统来说,它的输入为场景信息,比如时间、地点和设备等。搜索引擎获得输入后,会进行关键词处理,对于推荐系统来说,会进行用户画像查询。这个案例中,推荐系统了解到,该用户在实体词维度,对NBA感兴趣,在分类维度,对体育和科技感兴趣。查询到用户画像后,推荐系统就进入召回环节。它通过多种方式,根据用户画像查询结果“NBA、体育和科技”,从不同索引数据里获得候选集合。在召回完成后,和搜索引擎一样,推荐系统按照预定预估目标对候选集进行排序。同样,推荐系统也需要经过规则干预步骤后,才会将最终结果展示给用户。对于最后一步,用户的各种动作行为,在搜索引擎里,会持续优化排序模型,在推荐系统里,还会持续改进自身的画像。
对以上两图进行总结就是下图,就是想让你们看的第二张PNG(图):
推荐系统的本质
通过对搜索引擎和推荐系统的两张图,我们大致明白了推荐系统是怎么个一回事。实际上,推荐系统是一个策略行为。对于策略,他有四要素,分别是:
待解决问题输入(影响解决方案的因素)计算逻辑(将输入转换成输出的规则)输出(具体的解决方案)
对于今日头条来说:
它待解决的问题是“从海量的内容中,找到用户喜欢的内容”;
他的输入是“用户画像和内容特征”;
计算逻辑:将这些内容特征按一定规则转化为喜欢度;
输出:将内容按喜欢度从高到低排序。
由于我推荐系统的课程还未结束,先不展开这部分内容了。后面博客会对上文进行展开,有兴趣的同学,欢迎关注。
说明:以上内容来源于个人阅读和付费课程的归纳整理。
作者:皮带
来源:皮带
本文地址:http://www.ym.55jiaoyu.com/show-778586.html
本文由合作方发布,不代表展全思梦立场,转载联系作者并注明出处:展全思梦
推荐文档
- 11.张家口职业技术学院地球物理勘查技术专业介绍_河北
- 12.2023东华大学高考录取分数线是多少(2025年参考)
- 13.烟台城乡建设学校2025年报名条件、招生要求、招生对象
- 14.湖南工学院是什么样的大学(附王牌特色专业)
- 15.湖北高考专科分数线汇总(2012-2022年)
- 16.校友会2025北方工业大学专业排名
- 17.2023河北工程大学高考录取分数线是多少(2025参考)
- 18.济南三中(领秀校区、市南校区)2022录取分数线(2023参考)
- 19.2023年青海高考分数线(2025参考)
- 20.西安欧亚学院学校代码是12712(学校代码)
- 21.2023中国海洋大学高考录取分数线是多少(2025年参考)
- 22.柳州职业技术学院网站网址
- 23.山东商务职业学院应用英语专业介绍_山东应用英语的
- 24.定西师范高等专科学校开设哪些专业,定西师范高等专科
- 25.2025盐城护理学校有哪些盐城护理学校名单一览表
- 26.飒爽英姿,2021年四川城市技师学院学生军训风采
- 27.宣城市信息工程学校_宣城招生网
- 28.邦博尔渭南招生网_渭南招生信息_渭南招生考试平台
- 29.安徽马鞍山中考分数线(2022)-2023年参考
- 30.河北游戏艺术设计专业专科学校
- 31.2022山东所有专科学校名单一览表山东专科学校最新
- 32.成都棠湖外国语学校_成都招生网
- 33.2025益阳民办中专学校有哪些益阳民办中专学校名单
- 34.铜陵一中2022录取分数线(2023参考)
- 35.贵阳兴农中学网站网址
- 36.渭南师范学院学校代码是10723(学校代码)
- 37.2025湖北公办护理学校有哪些湖北公办护理学校名单
- 38.西安航空职业技术学院阎良校区在哪?(西安航空职业技术
- 39.2025年黄河科技学院附属中等专业学校招生简章
- 40.2023陕西师范大学高考录取分数线是多少(2025年参考)
- 41.重庆大学在四川历年招生录取分数线
- 42.西昌礼州中学2021年学费、收费多少
- 43.酒泉职业技术学院开设哪些专业,酒泉职业技术学院招生
- 44.女生学石油专业哪个好?(附适合女生的石油类专业)
- 45.2023山西师大实验中学录取分数线(2025年参考)
- 46.濮阳市油田二高2022录取分数线(2023参考)
- 47.河南高考二本分数线汇总(2012-2022年)
- 48.2025全国新闻学专业大学排名一览表
- 49.青岛城阳区职业教育中心2025年招生简章
- 50.2025天津财经大学珠江学院评价怎么样,学校好不好
- 51.菏泽学院评价怎么样,学校好不好
- 52.上海市崇明中学_上海招生网
- 53.2025安顺职业技术学院(中职部)开设的专业一览表
- 54.广东房地产经营与估价专业专科学校
- 55.江苏淮阴中学2020年宿舍条件
- 56.柘城二高2022录取分数线(2023参考)
- 57.肇庆科技中等职业学校2025年报名条件、招生要求、招生
- 58.百色祈福高级中学_百色招生网
- 59.江苏省苏州第十中学历年招生分数线一览表(2023参考)
- 60.景德镇十大高中排名(最新)汇总
- 51.上海税收“百亿楼”折射高质量发展新脉动
- 52.b站直播的要求和页面弄字上去方法
- 53.RCEP生效逾百日,对亚太区域合作影响几何?——聆听博鳌亚洲论坛往年年会的声音
- 54.用户为什么会形成转化?
- 55.美加息靴子落地 无碍中国货币政策“以我为主”
- 56.绿洲关注及赞提醒
- 57.跟着“种草笔记”买买买?当心碰上虚假营销!
- 58.分类别的作用是什么 分类别的说明方法
- 59.微博话题增加阅读量的方法及软件代增加的作用
- 60.往年抖音推广方案全攻略,你想知道的都在这!
- 61.微信视频号开通小商店的流程
- 62.北交所上市公司数量与质量将实现“双升”
- 63.新的公众号如何推广,一个新公众号怎么吸粉
- 64.如何写竞品分析,我总结出5个常见问题和1套方法论!
- 65.视频号推广广告主开通方法介绍与预约转发技巧
- 66.新华全媒+丨为了让毕业生更好就业——各地高校“高招”扫描
- 67.揭秘抖音基因以及抖音达人的流量真假!
- 68.微信阅读数怎么增加,微信增加阅读数软件和平台有哪些
- 69.房地产板块走势反转了?机构建议理性应对
- 70.公众号1w阅读量多少钱

