腾讯内容平台系统的架构实践|互联网,生产,实践,深度学习,框架,微服务架构,平台,架构设计,生产力,腾讯,存储,基础设施,数据仓库,微服务,架,德仔网

腾讯内容平台系统的架构实践

来源: InfoQ　　作者:孙子荀　　日期:2018/10/10　　类别:架构设计　　主题:综合　　编辑:blueteethxx

随着云结合微服务架构切实的提高了生产效率；深度学习不断深入内容处理的各个领域促进生产力的发展。在消息系统，数据仓库，计算框架，存储系统等基础架构层建设逐步提升的基础上，大型互联网公

工程篇

前身

在 15 年的时候，内容平台（承载腾讯包括手 Q 等内容业务等的内容中台）最初来源于 QQ 公众号系统（公众号系统承载了包括 QQ 服务号，订阅号的关注关系，红包等大型活动的推送，订阅号消息下发，素材内容管理等）。当时公众号系统有几个子系统：资料子系统，消息子系统，关系链子系统和素材子系统。一个号主如果需要把自己的内容给粉丝，需要经过这 4 个子系统。

（子系统就是有独立的存储逻辑数据流接口体系。概念来自 Systems Analysis & Design 的 DFD sub-system）

在最简单的粉丝发送的场景，首先使用素材系统管理群发任务的内容，然后用关系链子系统拉取粉丝数据，通过消息子系统创建群发任务进行消息发送，过程中需要和资料子系统交互获得各自参数。

在 15 年下半年，内容战略升级，除了来自平台的号主发送内容，我们还有大量来自其他外部合作平台。他们通过公司其他平台对接进来，当时我们复用这套基于消息发送的场景，让对方创建群发任务，内容进入素材库进行处理，然后就可以触达粉丝了。

但是后来整个业务形态从订阅变成了 Feeds 流，原来的粉丝关系变成了推荐，随着内容处理服务的越来越多，内容量的不断增加，老的这套系统就无法承载了。于是我们需要改造老的系统。

我们希望是有一套统一的多源内容库，在良好的扩展性框架下，各类型服务通过实现预定义接口，完成对内容的加工处理，人机结合，输出给订阅方。

内容的处理服务包括了内容安全质量（质量评价，暴力色情，低俗，标题党，错别字等），内容建模特征（分类，主题，标签等），内容理解生成（封面图，摘要，结构化，剪辑等）。

文本介绍一下其中主要的架构部分工作。

存储

物理存储

原来存号主发送内容的素材系统就变成了内容平台的最早雏形，素材还是通过 MySql 来存储用户发送的内容，所有的文本和 html 生成的页面样式也存储在一张表中，单表不堪重负，进行了 partition Sql 执行优化等工作，但是无济于事。在进入内容时代我们需要有一个性能更高的存储系统来支持。当时的技术选项的考虑基于过去素材系统的痛点和未来需要支持的规模。

我们需要我们的存储系统能支持任意的字段扩展，Schema Free。便于扩展根据列的定位效率需要在 O(1)
存储系统一定要支持永久存储，同时能满足基础的并发读，虽然不要求像 Redis 一样上万 /s ，至少也要是千级别。
需要支持多机水平扩展。
公司有团队成熟运维。

当时考虑过 Mongodb 和 Hbase ，Cassandra 以及其他 KV 存储。

Mongodb 的好处很多。但是他的高效率访问带来的是内存资源的极大开销。冷热不均的分配，不可控的并发写入和副本存储都使得他无法承载未来几年更大的发展。

其他的就是 Hbase ，当初能预料到的是如果我们需要把 Hbase 当作 KV 对在线服务，是无法承受的，但是我们可以在其之上增加一个 KV 的 cache 解决这个问题，剩下的事情就是我们去打造一个中间层支持 Hbase 和内存 KV 的数据同步。

Hbase 的 row key + column family + column qualifier + timestamp + value 是 HFile 中数据排列依据。HFile 据此，对数据的索引到 data block 级别，而不是行级别。

另外当初还考虑过一个方案就是基于 LevelDB 的全新内容中间件方案，这样能做到内存 KV 和永久存储合二为一，可是在那个时候的环境下，我们就算之前做过初级版本，也无法快速开发来，但是 Hbase 的好处是他可以支撑一段时间的 KV 访问，未来扛不住再优化上增加 Cache，事实上后来我们也是这样走的。

关于存储这里的工作我们后面还会提到，我们怎么进化到存储中间件 RCS。存储有了接下来就是如何设计存储层的数据模型。

数据建模

在设计存储模型的时候，在 16 年的时候，确认的事情有几个：

内容处理的肯定会有大量的模块并行的需要对内容进行处理加工；
这些模块有共性的属性获取，也有特化的属性获取需求。
模块自身彼此会产生输出给其他模块用。

我们的目标：

在架构上，打造统一存储来托管所有模块需要读写存储的场景，这样每个模块的同学统一存储。无论是业务同学的业务逻辑字段。还是算法同学的模型业务输出 or 模型特征输出。开发人员需要更加关注于策略本身，存储上的事情统一收拢提供 API 就行。

在表结构上：

如果第 1 点做到了，那么我们未来可以基于这个宽表进行天然的单表检索，单表基础内容特征挖掘。甚至是算法实验字段都可以统一在一张宽表里。

于是我们做了几个重要的设计：

1、推广新的唯一 ID 体系，废除公众号的自增 articleID，ID 能支持以下特征：

ID 体系 = 预留字段 + 时间 + 自增 ID + 内容类型 + 业务来源

于是有了 rowkey，拿到任意一个 rowkey 我们至少能第一眼知道来源大概的时间和类型，便于路由。

2、规范列名，所有列名分为【状态类】和【内容特征类】，前者用于标记状态，处理情况。后者用于保存内容的基础元信息，模块处理过程中产生的结果信息，中间信息。当时列的结构约定的格式是：

列名 = 列属性（状态类 or 业务类 or 模型类） + 字段属主 + 字段描述

当时所不能预估的事情，现在思考有几点：

业务字段可能会根据不同的业务场景产生「多态」，这个在语言中很好解决的问题，落到存储层会有不少问题。业务场景之间，多个业务之间对同一个内容的标题和封面图都可能有自己的子类，需要增加场景概念。
当初假设的是执行是树或者图这样的深度遍历 DAG，不会产生回路重遍历，事实上居然真的出现了这种场景。
随着字段的成倍扩张字段，列名一直没有很好的规划收拢分配，造成开发人员组织架构复杂之后不可控，需要有个合理的收拢分配方式。

我们在这里的数据模型使用了宽表格式，相比复杂的 EVA 存储，我们觉得宽表更加利于数据汇总统计。后续 RCS 部分会再次介绍。