当前位置: 首页 > news >正文

(10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】

(1)工业界推荐系统-小红书推荐场景及内部实践【业务指标、链路、ItemCF】
(2)工业界推荐系统-小红书推荐场景及内部实践【UserCF、离线特征处理】
(3)工业界推荐系统-小红书推荐场景及内部实践【矩阵补充、双塔模型】
(4)工业界推荐系统-小红书推荐场景及内部实践【正负样本选择】
(5)工业界推荐系统-小红书推荐场景及内部实践【线上召回和模型更新】
(6)工业界推荐系统-小红书推荐场景及内部实践【其他召回通道】
(7)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题1】
(8)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题2】
(9)工业界推荐系统-小红书推荐场景及内部实践【排序模型】

推荐系统链路

在这里插入图片描述

用户画像

• 用户 ID(在召回、排序中做 embedding)。
• 人口统计学属性:性别、年龄。
• 账号信息:新老、活跃度…
• 感兴趣的类目、关键词、品牌。

物品画像

• 物品 ID(在召回、排序中做 embedding)。
• 发布时间(或者年龄)。
• GeoHash(经纬度编码)、所在城市。
• 标题、类目、关键词、品牌…
• 字数、图片数、视频清晰度、标签数…
• 内容信息量、图片美学…

用户统计特征

• 用户最近30天(7天、1天、1小时)的曝光数、点击数、 点赞数、收藏数…
• 按照笔记图文/视频分桶。(比如最近7天,该用户对图文笔记的点击率、对视频笔记的点击率。)
• 按照笔记类目分桶。(比如最近30天,用户对美妆笔记的点击率、对美食笔记的点击率、对科技数码笔记的点击率。)

笔记统计特征

  • 笔记最近30天(7天、1天、1小时)的曝光数、点击数、 点赞数、收藏数…
  • 按照用户性别分桶、按照用户年龄分桶…
  • 作者特征:
    • 发布笔记数
    • 粉丝数
    • 消费指标(曝光数、点击数、点赞数、收藏数)

场景特征

• 用户定位 GeoHash(经纬度编码)、城市。
• 当前时刻(分段,做 embedding)。
• 是否是周末、是否是节假日。
• 手机品牌、手机型号、操作系统。

特征处理

• 离散特征:做embedding。

  • 用户ID、笔记ID、作者ID。
  • 类目、关键词、城市、手机品牌。

• 连续特征:做分桶,变成离散特征。

  • 年龄、笔记字数、视频长度。

• 连续特征:其他变换。

  • 曝光数、点击数、点赞数等数值做 log 1 + 𝑥 。
  • 转化为点击率、点赞率等值,并做平滑。

数据服务链路

在这里插入图片描述

相关文章:

  • SpringBoot、SpringCloud、SpringCloudAlibab对应版本选择
  • 【DevPress】V2.2.1版本发布,增加专栏内容管理
  • VirtualLab专题实验教程-1.超表面纳米柱及其相位分析
  • 基本if选择结构以及random
  • goland远程调试k8s上容器
  • Spring IoC、容器初始化、对象
  • java中的集合框架基础-5
  • Python连接Mongodb数据库-PyMongo模块
  • 三、OO三大特性
  • SpringBoot导出Jar包并测试(使用IDEA)
  • 用Windows性能监视器测试分析网站运行状况
  • 3.【异步通信框架】RabbitMQ
  • C++学习(四八七)android studio println的输出位置
  • PCL 生成空间圆点云
  • [JS真好玩] 掘金创作者必备: 监控每天是谁取关了你?
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 【Amaple教程】5. 插件
  • 【刷算法】求1+2+3+...+n
  • 2017-08-04 前端日报
  • laravel 用artisan创建自己的模板
  • Laravel5.4 Queues队列学习
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • PHP变量
  • PHP那些事儿
  • python_bomb----数据类型总结
  • Spring技术内幕笔记(2):Spring MVC 与 Web
  • Terraform入门 - 3. 变更基础设施
  • vue从入门到进阶:计算属性computed与侦听器watch(三)
  • Vue小说阅读器(仿追书神器)
  • Zsh 开发指南(第十四篇 文件读写)
  • 从tcpdump抓包看TCP/IP协议
  • 动手做个聊天室,前端工程师百无聊赖的人生
  • 如何优雅地使用 Sublime Text
  • 说说动画卡顿的解决方案
  • 源码之下无秘密 ── 做最好的 Netty 源码分析教程
  • 你学不懂C语言,是因为不懂编写C程序的7个步骤 ...
  • ​软考-高级-系统架构设计师教程(清华第2版)【第20章 系统架构设计师论文写作要点(P717~728)-思维导图】​
  • (rabbitmq的高级特性)消息可靠性
  • (八)Spring源码解析:Spring MVC
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (附源码)spring boot车辆管理系统 毕业设计 031034
  • (附源码)springboot 个人网页的网站 毕业设计031623
  • (附源码)计算机毕业设计SSM在线影视购票系统
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (转)EOS中账户、钱包和密钥的关系
  • .Net - 类的介绍
  • .NET CORE 3.1 集成JWT鉴权和授权2
  • .NET 某和OA办公系统全局绕过漏洞分析
  • .net8.0与halcon编程环境构建
  • .NET委托:一个关于C#的睡前故事
  • [AI]文心一言出圈的同时,NLP处理下的ChatGPT-4.5最新资讯
  • [AIGC 大数据基础]hive浅谈
  • [E单调栈] lc2487. 从链表中移除节点(单调栈+递归+反转链表+多思路)
  • [GXYCTF2019]禁止套娃
  • [hdu 3065] 病毒侵袭持续中 [AC自动机] [病毒特征码匹配]