> 数据图表

一起讨论下GPU和生成式推荐模型软硬相辅,打造Meta高性能、高精度的AI推荐系统

2025-5-5
一起讨论下GPU和生成式推荐模型软硬相辅,打造Meta高性能、高精度的AI推荐系统
GPU和生成式推荐模型软硬相辅,打造Meta高性能、高精度的AI推荐系统内容排名推荐系统拆解编码和向量化编码和向量化内容召回内容召回候选粗排粗排精排精排重排重排定义将信息流及用户的特征转化成数值型可处理的形式。视频的内容(如标题、图像、内容等)和用户的行为(如观看历史、互动行为等)被转换成数值向量,通过计算向量之间的余弦相似度,来识别内容相关性和用户偏好从海量内容库中筛选出一小部分特定用户可能感兴趣的信息,实现对海量内容的“降维”。使用用户的历史行为、兴趣标签、社交关系等信息,通过各种召回策略(如基于内容的推荐、协同过滤推荐等)来实现对召回的视频进行初步排序。使用较为简单的模型对视频进行粗排,结合用户的历史行为和兴趣特征,逐步缩小推荐范围在候选粗排的基础上,使用更复杂、更精细的模型对视频进行排序。主要考虑内容特征和用户个性化需求,通过生成式AI模型计算得分对信息流进行综合排名在精排之后,根据特定的业务需求对视频列表进行最后的调整,引入多样性、新颖性,或者对特定业务目标(如提高点击率、观看时长等)进行优化业务需求数据量:尽可能多的引入用户历史行为和信息流更细颗粒度的解析内容时效性与内容覆盖:以最快的速度在尽可能多的内容池中召回更多候选素材时效性:在极短时间内进一步筛选出更有可能被用户喜欢的视频,为精排环节减少计算负担GPU和生成式模型贡献除了传统的用户信息、互动行为(如点赞、收藏等)、内容标签等信息,生成式模型还能深入精准地提取信息流的文字、声音、图像等多模态信息并输入系统,精准捕捉不同内容的细致差异相较于CPU,GPU相同时间召回量可以达到十倍至百倍级别,满足时效性与内容覆盖要求GPU算力的提升能增强大规模粗排的承载能力,并通过大吞吐量减少延迟准确率:尽可能多的发掘内容和用户历史行为的隐藏关系,确保推荐给用户的视频列表更加个性化和精准,提高用户的满意度和互动率改善用户体验,满足业务需求:通过重新排序,以满足用户的多样化需求和改善用户体验,同时达成用户留存/点击率提升等业务目标重排只针对Top10-20内容进行重新排序,算力、时延要求小-生成式AI模型复杂度提升使算力需求达到数十倍,甚至百倍级别,需要GPU提供算力-生成式AI模型实现参数和神经网络规模的突破,能够更精准的捕捉内容和用户兴趣间的关系,推荐精度更高生成式模型赋能GPU赋能GPU+生成式模型赋能GPU和生成式模型需求较小p GPU优势:算力强、带宽高,海量数据处理能力强,能够支撑复杂生成式AI模型运行,确保低延迟p 生成式模型优势:1)内容理解理强:相较于传统的内容标签推荐体系,生成式模型能理解文字、声音、图像等多模态内容并输入系统,精准捕捉不同内容的细致差异;2)推荐精准度高:生成式模型实现参数和神经网络规模的突破,能够更精准的捕捉内容和用户兴趣间的关系资料来源:DataFunTalk公众号、驰风而来网、国海证券研究所请务必阅读报告附注中的风险提示和免责声明 20