如何制定有效的海外营销规划?| 海外营销规划 | 优化全球市场的关键步骤
168
2023-05-07
让用户痴迷TikTok的AI算法(下)
大家好,我是外贸老司机Allen。Tik Tok入门小白或者对独立站和跨境电商感兴趣的朋友们,欢迎关注我,这里将持续分享更多运营干货哦~
(接上文)
2. TikTok推荐系统设计的原型
2.1 数据和特点
首先,数据。如果我们正式描述推荐模型,它是一个用户对生成内容的满意度的函数。要提供这个功能,需要从三个维度输入数据。
内容数据——TikTok 是一个拥有大量用户生成内容的平台。每种类型的内容都有其特征,系统能够识别和区分它们以获得可靠的推荐。用户数据——包括兴趣标签、职业、年龄、性别、人口统计等。它还包括来自基于机器学习的客户聚类的潜在特征。场景数据——该数据根据不同的场景跟踪使用场景和用户的偏好变化。例如,用户在工作、旅行或通勤时喜欢观看什么类型的视频
收集到相关数据后,将导出四种类型的关键工程特征并将其输入推荐引擎。
该模型将通过学习上述特征来预测该内容是否适合某个场景中的用户。
2.2 无形的指标
但是,其他无形的指标不能用那些可量化的指标来评估。
例如,为了维护健康的社区和生态系统,TikTok 旨在压制涉及暴力、诈骗、色情和失实新闻等内容。
为此,需要在可量化的模型目标之外定义边界控制框架。(内容审核机制)
2.3 算法
推荐目标可以表述为一个经典的机器学习问题。然后通过协同过滤模型、逻辑回归模型、分解机、 GBD、深度学习等算法求解。
工业级推荐系统需要灵活且可扩展的 ML 平台来建立实验管道以快速训练各种模型。然后堆叠它们以实时服务。(例如结合LR和DNN,SVM和CNN)
除了主要推荐算法,TikTok还需要训练内容分类算法和用户画像算法。下面是用于内容分析的层次结构分类架构。
从主根向下钻取。每层向下是主类和子类。与单独的分类器相比,使用分层分类机制可以更好地解决数据倾斜的问题。
2.4 训练机制
TikTok 使用实时在线训练协议,它需要更少的计算资源并提供快速的反馈。这些对于流媒体和信息流产品很重要。
他们还构建了高性能系统作为模型参数和特征服务器(特征存储和模型存储)。该功能存储可以保存和服务十数以百万计的原有的特色和设计的载体。并且模型存储将维护和提供模型和tuned_parameters。
整个训练过程是1)在线服务器捕获实时数据然后存储到Kafka,2)Storm集群消费Kafka数据和产品特征,3)特征存储收集新特征和推荐标签以构建新的训练集, 4) 在线训练管道重新训练模型参数,将它们相同地放入模型存储中, 5) 更新客户端推荐列表,捕获新的反馈(用户操作)并再次循环。
3. TikTok的推荐工作流程
步骤 0:用户生成内容 (UGC) 的双重审核系统
在 TikTok,每天有数百万用户上传的内容。恶意内容更容易找到单机审核系统的漏洞,在这种情况下人工审核是不现实的。因此,duo-review 成为 TikTok 筛选视频内容的主要算法。
机器审核: 一般来说,Duo-audit 模型(基于计算机视觉)可以识别您的视频图像和关键字。它主要有两个主要功能:1)检查剪辑是否有漏洞,检查文案。如果涉嫌违规,内容将被模型拦截并标记为黄色或红色以供人工审核。2) 通过从视频中提取图片和关键帧,TikTok 的双人审计算法将提取与其海量存档内容库相匹配。重复将被拾取并降低流量并减少推荐引擎的权重。
人工审核: 主要集中在3个方面:视频标题、封面缩略图和视频关键帧。对于通过 Duo-Audit 模型标记为可疑的内容,技术人员将对其进行人工审核。如果被认定为违规,视频将被删除,并暂停帐户。
第 1 步:冷启动
TikTok 推荐机制的核心是信息流漏斗。 内容通过双审核后,将放入冷启动流量池。例如,在您的新视频通过审核流程后,TikTok 会分配 200-300 名活跃用户的初始流量,您最多可以获得数千次曝光。
在这种机制中,新的创作者可以与社交影响者(可能拥有数万粉丝)竞争,因为他们的起点是相同的。
第 2 步:基于公制的称重
通过初始流量池,视频可以获得数千次观看,这些数据将被收集和分析。分析中要考虑的指标包括喜欢、查看、完整查看、评论、关注者、转发、分享数据等。
然后推荐引擎会根据这些初始指标和您的帐户分数(无论您是否是高质量的创作者)权衡你的内容。
如果引擎决定权衡你的内容,前 10% 的内容将额外获得 10,000-100,000 次流量曝光。
第 3 步:用户配置文件放大器
将进一步分析来自步骤 2 流量池的反馈,以决定是否使用用户配置文件放大器。在这一步中,表现优异的内容将在特定的用户群体(例如体育迷、时尚爱好者)中得到加强和放大。
这类似于“猜你喜欢什么”功能的概念。推荐引擎将建立一个用户档案库,以便它可以找到内容和用户组之间的最佳匹配。
第 4 步:精品趋势池
不到 1% 的内容最终会进入趋势池。内容在此池中获得的曝光量比其他池高出一个数量级。因为热门内容会被推荐给所有用户。(假设,不管你是谁,你可能想看最新的抗议者视频“黑人的命也是命”)
其他步骤:延迟点火
一些 Tiktokers 会注意到,他们的内容在发布数周后突然获得了巨大的曝光。
主要有两个原因:
限制:流量高峰
如果一个内容云通过了信息流漏斗(双审核、权重迭代、放大器),创作者的账号将获得过多的曝光、用户互动和粉丝。
但根据研究,这种高曝光时间窗口很窄。通常,该窗口将持续一周左右。过了这个时间段,这个内容和账号就会降温,就连后续的视频也很难流行起来。
为什么?
主要原因是 TikTok 想要在其算法中引入多样性并消除无意的偏见。通过这种设计,推荐引擎不会偏向于特定类型的内容,从而确保新内容有平等的机会进入流行池。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。发表评论
暂时没有评论,来抢沙发吧~