对话腾讯蒋杰：全链路自研通用大模型有何挑战_中国IT创新网

(资料图片仅供参考)

9月7日，腾讯正式宣布旗下的通用大模型“混元大模型”对外开放，作为全链路自研的通用大语言模型，混元具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。

在大会后的采访中，腾讯集团副总裁蒋杰，介绍了它的研发过程、方向选择思路以及自研模型的技术挑战。

蒋杰表示，腾讯混元大模型拥有自主研发的路径规划，掌握了从算法到框架再到平台的全链路自研技术。

在其它公司着急推出各种模型的时候，腾讯的通用大模型已经在内部大量业务场景中进行了长期测试，产品成熟之后才对外输出。

这种先服务于腾讯本身的业务，再通过腾讯云对外开放、服务客户和外部合作方的模式，也被腾讯视为自家通用大模型的重要优势。

腾讯方面表示，混元大模型有良好的上下文理解和长文记忆能力，能够流畅完成各专业领域的对轮问答；支持文学创作、文本摘要、角色扮演；能够准确理解用户意图，基于已有数据或信息进行推理、分析；同时有效解决事实性、时效性问题，提升内容生成效果。

蒋杰认为，大语言模型最有商业价值的部分是提效，这也是大语言模型存在的使命。

未来混元大模型将重点做好提效的基础能力，“希望它不要胡言乱语，更安全、更可靠、有更好的逻辑思维能力，可以回答更复杂的题目”。

对于大模型在训练和存储过程中涉及到的数据问题，蒋杰表示，无论有没有大模型，腾讯都严格遵循法律要求，“我们可以向大家保证，我们做的小模型、大模型还是大语言模型，都绝不会使用个人隐私数据。”

混元为什么不着急

公开数据显示，截止到今年7月底国内已经有130个大模型产品亮相或宣布，其中既有一些大模型，也有小模型，有通用模型，也有专业领域的模型。

但腾讯的通用大模型虽然已经在内部运营迭代多个版本，但直到9月份才正式对外开放，这也被很多人认为是一次姗姗来迟的亮相，多少显得有些“不着急”。

其实，混元大模型的推出并非一蹴而就，从2021年开始，腾讯就已经在研发相关的技术能力。也是从那年起，腾讯先后推出了千亿和万亿参数的NLP稀疏大模型。

他向界面新闻介绍称，混元大模型是从零开始训练，整个体系包含了平台架构、模型和算法等能力，同时将腾讯自身的业务需求和大模型进行深度结合。

马化腾在股东大会上曾明确表示，腾讯在埋头研发自己的大模型，但是并不急于早早做完，把半成品拿出来展示。

在最近几个月内，混元大模型始终处于边研发边应用的状态，腾讯内部一直在用大量内部业务场景对它进行磨炼，尤其是腾讯文档、腾讯会议和腾讯广告等非常复杂的应用场景。

在腾讯看来，对于基础模型而言，技术和机会并不仅局限于聊天机器人这样的问答式场景，大模型的长期价值将通过应用来体现，所以更广泛的应用场景是决胜的关键因素。

虽然测试大语言模型的途径有很多，部分厂商也采用了Chat的方式进行测试，但蒋杰认为，腾讯在过去二十年间积累了大量的C端应用场景以及海量用户，也包含了很多B端应用场景验证体系，混元大模型在腾讯内部各业务的场景中也能得到良好的测试。

此前在6月份，腾讯曾推出MaaS（Model-as-a-Service）服务，向外部客户提供行业大模型服务。本次混元大模型对外开放之后，也将作为MaaS服务的底座，客户可以基于混元大模型，也可以基于开源模型，来搭建自己专属的行业大模型。

选择自研，寻求技术突破

现在市场上有很多开源大模型，部分厂商选择在它们基础上叠加精调，然后推出自己的大模型产品。

但蒋杰认为，如果不从头做自研，就无法对这项技术完全掌握。腾讯选择自研的首要原因就是要解决根本的技术能力突破，建立自己的技术栈体系，模型的后续研发迭代速度会更快，也更容易与未来腾讯其他产品业务相融合。

其次，腾讯旗下拥有很多海量高并发的业务，而很多开源模型的架构并不能支撑这种体量。所以腾讯需要走出一条基于自主体系研发的道路，才能应对海量高并发业务的冲击。

与此同时，全链路自研也让腾讯的大模型拥有了差异化的优势。

比如，“幻觉”是每个大语言模型都会面临的重要问题，当前Transformer架构的大模型无论做到什么阶段，都会出现不同程度的幻觉，这是做大语言模型的技术人员终身的挑战。

行业内很多大模型用的是知识图谱和搜索外挂的方式，去提升模型的检索能力，腾讯也部分采用了这些方式，“但比例不会很高，我们要在整个大模型的预训练阶段就控制这个问题”，蒋杰表示。

在腾讯内部看来，虽然搜索增强能丰富大模型的答案，但它并不是大模型的底层能力。在方向选择上，腾讯更倾向于通过底层能力的提升来增强大模型的水平，这也是腾讯选择自研“探真”技术来解决幻觉的原因。

蒋杰表示，虽然市面上并不缺乏大模型产品，很多公司的技术路线也都类似，但这是一个拼细节的过程。

也许未来对头部厂商大模型进行评分，大家的差距仅在一两分之间，但投入资源的不同、专注细节的区别，都会凸显不同模型之间的差异性。

蒋杰认为，大模型还远没有触碰到技术的天花板，不是靠几个技术单点的突破就能让大模型呈现出最终形态，这是一个综合实力的比拼过程。它包括了技术突破的能力、语料的完整度、数据标注的能力、纠错能力和评测能力的突破等。

而腾讯“有使用场景的资源，有数据方面的优势，有云计算基础设施方面的加持，有打造人工智能应用，为既有业务提供辅助方面的长期实践。”用腾讯总裁刘炽平的话说，这也是腾讯持续投入大模型研发并参与市场竞争的底气。

（文章来源：界面新闻）

推荐内容

对话腾讯蒋杰：全链路自研通用大模型有何挑战

2023-09-09
乌龙！Xbox为《星空》发媒体好评海报

2023-09-09
山东郯城通报“一女子滥用职权威胁理发店”：对王某某给予记大过处分

2023-09-09
西安又传解除限购？别急！看看8月西安楼市如何？切勿乱传谣！

2023-09-09
特斯拉回应“哨兵模式”：中国大陆车辆数据存储在境内

2023-09-09
张永泽受贿案一审开庭

2023-09-09
显示产业前景可期产业发展看好成都—中国新闻网·四川新闻

2023-09-09
风语筑：正积极推进多项亚运会数字媒体内容制作和软件系统服务

2023-09-09
海南一地通报4起腐败典型案例！涉及校长、所长、主任等→|海上夜闻·视听汇

2023-09-09
“奥本海默”式患者！男子日抽百根烟啤酒当水喝患多种癌症具体是什么情况?

2023-09-09
赔835.4万巴奴火锅为子品牌超岛涉事羊肉买单

2023-09-09
貂蝉在三国里是哪个国家的人

2023-09-09
传汇丰银行上调H按封顶利率香港房贷利率将突破4%

2023-09-09
今日重磅回归！江上体验文化味儿

2023-09-09
我省首批国内包机旅游团首站抵汴尽享大美开封

2023-09-09
药物行业市场深度调研我国焦虑失眠人数已经高达2亿

2023-09-09
华为Mate60Pro+开售，超大杯来了！

2023-09-09
打卡中国新坐标Vlog：跨越天山，走大国公路看“醉美新疆”

2023-09-09
甘肃定西马铃薯变身“金元宝”

2023-09-09
众安科技钮程昊：业、技、数融合已经成为数字化转型的主旋律

2023-09-09
塞尔维亚男篮杀进决赛！博格达诺维奇大爆发，替补奇兵三分5中3

2023-09-09
午评:粘合线死叉要谨慎

2023-09-09
天命奇御通关个人评分及分析（天命奇御完美结局攻略）

2023-09-09
江苏农村三级寄递物流体系不断完善快递深度嵌入农业产业链

2023-09-09
戴尔笔记本每次开机都要按f1 每次开机都要按f1

2023-09-09
国足迎来马来西亚挑战，这场有大胜的机会？

2023-09-09
楼市新政一周实地看：房价涨真火还是虚火？

2023-09-09
榕江：罗汉果苗移栽忙

2023-09-09
10月1日起，海口、三亚、儋州将率先实行用水报装“102”模式

2023-09-09
小折中的人像神器，OPPO Find N3 Flip正式开售

2023-09-09
达实智能获15家机构调研：公司基于物联网核心产品及相关应用系统，在建筑楼宇、医院、城市轨道交通、数据中心、企业园区等多个市场领域已得到客户充分的认可，也取得了不错的经济效益（附调研问答）

2023-09-09
广东鸿图独立董事李军亲属短线交易

2023-09-09
创投周报十条（9月4日-9月8日）

2023-09-09
龙凤区人民法院招聘

2023-09-09
9月8日基金净值：南方创新驱动混合A最新净值0.6388，跌0.14%

2023-09-09
东盟秘书长：东盟与中国合作造福双方民生福祉

2023-09-09
麦肯尼：我在危机时刻离开了尤文，现在留队希望重新证明自己

2023-09-09
第35届巴西圣保罗双年展启幕多族裔文化现异彩

2023-09-09
华辰装备(300809.SZ)：公司不涉及手机相关业务

2023-09-09
贵州8名干部被查！涉嫌严重违纪违法

2023-09-09
重磅来袭！一文了解苹果(AAPL.US)秋季发布会看点

2023-09-09
三夫百度云云盘三夫百度云

2023-09-09
刘备的幕僚简雍的事迹有哪些？他是一个怎样的人？

2023-09-09
截至目前江西再生稻推广种植面积突破200万亩

2023-09-09
妇女创业主题成就展亮相中蒙博览会展现北疆“她力量”

2023-09-09
家族诞生20090208_家族诞生65期

2023-09-09
鲸鱼的叫声是怎么回事（鲸鱼的叫声为何感觉这么悲伤孤独又无助呢）

2023-09-09
王石辟谣在日本换心脏：没换心脏目前身体健康状况良好

2023-09-09
股票行情快报：*ST三盛（300282）9月8日主力资金净卖出280.99万元

2023-09-09
9月9日，长三角（临沂）招商引资推介会召开，这些亮点值得期待

2023-09-09
聚赛龙：截至2023年8月末，公司股东总户数7,706户

2023-09-09
对话腾讯蒋杰：全链路自研通用大模型有何挑战

2023-09-09
9月8日上市公司晚间公告一览

2023-09-09
面对暴雨洪涝灾害，个人如何做好自我防护？

2023-09-09
智通ADR统计 | 9月9日

2023-09-09
扣非净利出现较大波动浩辰软件IPO提示业绩下滑风险

2023-09-09
《工业自动化时间敏感网络应用行规》征求意见

2023-09-09
中国驻肯尼亚大使馆援助贫民窟学校，改善当地儿童求学前景

2023-09-09
中建二局安徽分公司万科朗拾项目全面冲出“正负零”

2023-09-09
RTX 4060首次出现Steam 用户欢迎度超过7个月前的RTX 7900 XTX

2023-09-09
西安又传解除限购？别急！看看8月西安楼市如何？切勿乱传谣！

2023-09-09
杭州亚运村今日预开村，迎接代表团先遣人员

2023-09-09
449元，小米果蔬清洗机上架 0添加洗涤剂

2023-09-09
白癜风红斑一般多久消失贵州白癜风皮肤病医院治愈率高吗

2023-09-09
鹏辉能源：公司没有生产您提到的相关名称的产品

2023-09-09
看着都疼！孙铭徽晒视频：大连康复Day1 康复治疗走起

2023-09-09
北京向民间资本公开推介57个重点项目总投资近2000亿元

2023-09-09
《武胜县麻哥面产业发展扶持办法》出台！最高一次性奖励20万元

2023-09-09
中方就菲律宾非法侵闯仁爱礁发表谈话

2023-09-09
乌龙！Xbox为《星空》发媒体好评海报

2023-09-09
北京房山区所有涉山涉水乡村旅游民宿暂停营业

2023-09-09
九月第8天，土耳其说了句没用的话，美国给乌克兰反攻泼冷水

2023-09-09
广州暂时解除暴雨预警信号

2023-09-09
胡昌升会见华侨城集团和中国煤炭地质总局客人

2023-09-09
沪农商行：9月8日融资买入729.92万元，融资融券余额9791.68万元

2023-09-09
广深两地出现极端强降雨广东深夜将防汛应急响应跳级提升

2023-09-09
把“世界超市”义乌搬上京东京东9.9超省日打造靠谱版“9.9包邮”

2023-09-09
楼阳生到郑州市上街区调研学前教育工作并看望慰问教师

2023-09-09
年化利率达4%，短期可超10%？赴港存款可能没你想的那么“香”

2023-09-09
泰国猴痘确诊病例达316例

2023-09-09
windows10的电源选项在哪里 w10系统电源选项在哪里

2023-09-09
【洋腔队】从来华求学到执教福州大学非洲小伙圆梦中国

2023-09-09
山东郯城通报“一女子滥用职权威胁理发店”：对王某某给予记大过处分

2023-09-09
洛阳王城公园，中国第一座遗址公园，内有河图洛书碑大气优雅

2023-09-09
2023年山西省高考本科录取最低分数线公布

2023-09-09
曾参加奥运会的中国体操国家队夫妻移民，16岁女儿将代表美国比赛

2023-09-09
新疆昌吉市积极筹备参加第二十三届中国国际投资贸易洽谈会

2023-09-09
特斯拉回应“哨兵模式”：中国大陆车辆数据存储在境内

2023-09-09
中证军工指数强势上涨，成分股晨曦航空领涨，国防军工ETF(512810)上涨1.61%

2023-09-09
张雪峰问华为什么意思网友：张老师连续两次志愿填报失误滑档了！

2023-09-09
工伤认定决定书如何申请

2023-09-09
中国多家企业13年为青藏高原“植绿”两万亩

2023-09-09
财经早班车丨工行、农行、中行、建行官宣存量首套房贷利率调整细则

2023-09-09
“潺溪”“湍溪”“澜溪”……百年老校为教师送上职业发展大餐

2023-09-09
风语筑：正积极推进多项亚运会数字媒体内容制作和软件系统服务

2023-09-09
海南一地通报4起腐败典型案例！涉及校长、所长、主任等→|海上夜闻·视听汇

2023-09-09
被威胁店主：希望未来不要影响理发店正常经营

2023-09-09
从武侠剧到武侠+：江湖梦在，侠义不老

2023-09-09
a2能开多少座的客车 a2能开多少座的客车,车长多少

2023-09-09
张永泽受贿案一审开庭

2023-09-09
这回，华为“令华盛顿感到非常惊讶”

2023-09-09
新疆巴音郭楞州和静县发生3.9级地震震源深度13千米

2023-09-09
中国制造？Steam Deck被认证为中国制造

2023-09-09
天津电子信息职业技术学院宿舍费天津电子信息职业技术学院宿舍

2023-09-09
富德生命人寿七台河中支举办小海豚计划公益游学之旅活动

2023-09-09
【台胞“申”活II⑧】魅力上海｜马叔安：遇见昆曲中的自己

2023-09-09
显示产业前景可期产业发展看好成都—中国新闻网·四川新闻

2023-09-09
记者：梅西感到疲劳，阿根廷队将很快决定是否让他前往玻利维亚

2023-09-09
美黄金期货实时行情：黄金尾盘还有低点

2023-09-09
山西天镇：送戏下乡进农村文化惠民欢乐多

2023-09-09
比人类更适合交流的人工智能淘宝问问内部测试开启

2023-09-09
看了汤唯的无修生图，我明白了“不整容”的重要性

2023-09-09
9月8日基金净值：工银战略远见混合A最新净值0.8057，跌0.19%

2023-09-09
金水区开展“智慧郑好停文明郑州人”宣传活动

2023-09-09
浙江杭州：老街“新生”扮靓城市颜值

2023-09-09
9月8日基金净值：广发多元新兴股票最新净值1.4792，跌0.42%

2023-09-09
中国美术馆以塑像致敬教师

2023-09-09
台北一建筑严重下陷，25户居民被疏散

2023-09-09
美联储内部的一项模型显示：抗通胀已获胜利

2023-09-09
9月8日 13:46分奥泰生物（688606）股价快速拉升

2023-09-09
从乡村篮球赛看浙江乡村体育蓬勃发展势头

2023-09-09
杭州第19届亚运会火炬传递启动

2023-09-09
甘肃夏河泥石流灾区应急道路已打通通信逐步恢复

2023-09-09
不可计数的读音有几个不可计数的读音

2023-09-09
新力金融(600318.SH)：自身无信托类业务，也从未投资过信托类产品

2023-09-09
中国足彩网竞彩09日推荐：长崎群马激战成和

2023-09-09
中央气象台：华南强降雨仍将持续四川盆地至华北也将有降雨过程

2023-09-09
美沙阿印四国拟签署连接中东的铁路协议，美媒又不忘扯上中国

2023-09-09
湖南卫视招聘岗位湖南卫视招聘

2023-09-09
“奥本海默”式患者！男子日抽百根烟啤酒当水喝患多种癌症具体是什么情况?

2023-09-09
中国第一变性人张克莎：从小就留长发穿裙子，一生未告诉老公真相

2023-09-09
学习本上线5?3专区，支持10.3英寸墨水屏

2023-09-09
广东的暴雨还要下多久？什么是“列车效应”？

2023-09-09
太原签约30个重点项目，总投资额514.14亿元

2023-09-09
三亚蘭园与世贸兰庭房产优势是什么？想在海南三亚市买房子最便宜多少钱？

2023-09-09
偷拍的图片和视频都去哪儿了？供人免费浏览引流或网上打包售卖

2023-09-09
新光快速路西侧地块封顶摇号番禺区今年第六宗！

2023-09-09
跨越600余公里，湖南一患者家属特地给贵阳这家医院的医生送上一份心意……

2023-09-09
奥普光电涨停

2023-09-09
教大家Edraw Max怎么绘制红豆面包的办法

2023-09-09
报告称去年全球超高净值人口四年来首次下降，亚洲减少近11%降幅最大

2023-09-09
环比增长6% 吉利汽车5月销量120053辆

2023-09-09
9月8日基金净值：鹏扬汇利债券A最新净值1.0764，跌0.05%

2023-09-09
人民币兑美元中间价调贬164个基点

2023-09-09
和男朋友说早安的句子（和男朋友说早安的句子说说）

2023-09-09
跳桥救人外卖小哥成亚运会火炬手

2023-09-09
强降雨致珠三角多地发生内涝广东全省提前转移8万余人

2023-09-09
梁檗：9月8日外汇市场分析与交易策略

2023-09-09
探访宁波象山亚帆中心：多队进驻开展赛前训练

2023-09-09
国家疾控局发布秋季儿童轮状病毒感染健康提示

2023-09-09