腾讯混元大模型负责人刘煜宏：腾讯做大模型不争一时之先

标签：

导读【腾讯混元大模型负责人刘煜宏：腾讯做大模型不争一时之先】具体的是什么情况呢，跟随小编一起来看看！ 5月30日，腾讯推出基于混元大模型的...

【腾讯混元大模型负责人刘煜宏：腾讯做大模型不争一时之先】具体的是什么情况呢，跟随小编一起来看看！

5月30日，腾讯推出基于混元大模型的App“腾讯元宝”，主要面向工作场景，提供AI搜索、AI总结和AI写作等核心能力，同时面向日常生活场景新增创建个人智能体的能力。

从去年底至今，众多头部大模型厂商和创业公司都推出了面向C端的App应用，腾讯的入局时间并不算早，考虑到腾讯拥有国内数一数二的C端用户体量，这个决定让人有些意外。

腾讯云副总裁、腾讯混元大模型负责人刘煜宏在采访中给出了官方的态度：“腾讯做大模型不争一时之先。”

因为按照腾讯的估算，目前国内大模型应用日活跃用户渗透率还不到1%，比同行慢几个月推出App也没什么影响。

在混元大模型发布至今的九个月时间里，腾讯在技术架构上做了比较大的升级，从最初的通用专家稠密大模型，变成了如今的MoE混合专家架构，打开了混元大模型参数量的天花板。

“从测试数据看，能力提升超过50%”，刘煜宏介绍称，升级之后，腾讯混元大模型的参数规模已从千亿提升至万亿，预训练语料从万亿提升至7万亿tokens。

在腾讯元宝上线之后，绝大多数头部大模型产品都已经推出了独立的C端应用，业界推动AI落地的共识也进入了新的阶段。

虽然市面上与大模型相关的AI应用有很多，而且每家产品都说自己有几十万或者几百万DAU，但刘煜宏认为，在去重之后，这些应用合并到一起的DAU也就几百万，对比国内的12亿移动互联网用户规模来说，用户渗透率还不到1%。

看似火热的技术和产品，渗透率为何如此之低？

他给出了两个原因：一个是大模型从ChatGPT 3.5问世开始大火，至今也就不到两年时间，大模型技术的发展处于早期阶段，产品能力不足，距离企业和用户需求又很远，导致大模型的落地能力较弱。

另一个原因是公众对大模型的认知度不够。虽然很多企业、开发者和用户都知道大模型很厉害，但具体怎么用它，大部分人都不知道。

腾讯与很多企业的CTO或技术负责人都聊过大模型的应用场景，很多人的第一反应还是智能客服，应用落地的探索路径很窄，说明在用户教育层面还有很长的路要走。

所以刘煜宏认为就算腾讯元宝的发布时间晚了几个月，拉长时间看也不是什么重要的事情，“（大模型应用的）渗透率不到1%，先发优势也就百分之零点几，这个优势微不足道。”

腾讯不着急的心态从“打榜”这件事上也能体现出来。

“我们看到很多榜单，（有些模型）天天刷榜，但是对用户有用么？”腾讯并不太关注榜单，也不太参与评测，很多时候“看到媒体报道才知道我们被评测了”，刘煜宏表示。

今年以来，字节跳动旗下的豆包以及月之暗面的Kimi等应用，都投入不少资金用于买量，进行付费推广以及广告投放。

刘煜宏对此表态称，买量营销不是腾讯元宝现阶段的主要目标，“甚至对标竞品拉高整体规模也不是我们现阶段的目标。”

同样，因为当下大模型应用的渗透率非常低，现阶段去谈整个行业的商业化也为时尚早，“还是个摸索的阶段。”

未来一段时间，腾讯元宝的重心会放在串联腾讯内部的核心产品（比如微信公众号和小程序）通路，以及优化更多垂直行业（法律、金融和医疗等）的大模型应用体验。

因为腾讯元宝主要面向工作场景，所以在信息获取、处理和生产三个环节进行了针对性优化。

在AI搜索方面，腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎，同时内容覆盖微信公众号等信源。

在AI总结方面，腾讯元宝可上传最多10个PDF、word、txt等多格式文档，一次性解析多个微信公众号链接、网址，支持256K的原生窗口上下文，相当于一本《三国演义》或英文版《哈利波特》全集。

很多大模型都说自己有千万文字的长文能力，刘煜宏认为这个技术上不是问题，腾讯混元大模型也支持，但用户没什么需求，“谁会扔一千万的文字给它，256K长文足以支持99%的需求。”

在AI写作方面，元宝不仅支持多轮问答，还能够将对话的内容整理成报告，按照要求进行结构化输出。

此外，目前腾讯元宝还提供了AI头像、口语陪练和智能翻译等生活场景中的常见应用，它们大多由第三方开发者完成。

根据公开信息，腾讯内部有超600个业务及场景都已经接入混元大模型，其中包括腾讯广告、微信读书、腾讯会议、腾讯文档和腾讯客服等都已经基于混元进行过升级，内部业务每日调用次数已经超过2亿次。

这被刘煜宏称为混元大模型最大的优势之一。他认为腾讯的产品覆盖领域非常全面，大模型在内部落地时应用的场景也很广泛，其它产品无法遇到的问题，混元都已经遇到并且解决了。

混元底层的腾讯自研Angel分布式系统架构，也被视为腾讯的优势之一。

与行业内很多大模型产品相比，“腾讯的产品工程能力比较强，技术演进比较早”，刘煜宏表示，“同等情况下我们的成本更低、表现更好。”

此外，在5月中旬，腾讯刚推出一站式智能体创作与分发平台“腾讯元器”，主要面向企业用户和开发者群体。

该平台能提供丰富的官方插件和知识库，支持用户低门槛创建智能体。该平台支持用户以API形式将智能体分发至各类场景，免费token额度从此前的100万提升至1个亿。本次发布的腾讯元宝也支持用户和开发者自建智能体的操作。

“腾讯自己不会做太多智能体”，刘煜宏表示，“更多还是希望（第三方）开发者用它去创作。”

转载来源：界面新闻作者：崔鹏CP

以上就是关于【腾讯混元大模型负责人刘煜宏：腾讯做大模型不争一时之先】相关内容！