劳动报-商汤科技发布日日新5.0大模型，五大产品全新亮相，局部能力甚至赶超GPT-4

商汤科技发布日日新5.0大模型，五大产品全新亮相，局部能力甚至赶超GPT-4

来源：劳动观察作者：陈宁发布时间：2024-04-23 19:40

摘要： 4月23日下午，商汤在临港AIDC举行“2024年商汤技术交流日”活动现场。

4月23日下午，在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场，商汤发布行业首个“云、端、边”全栈大模型产品矩阵，以满足不同规模场景的应用需求，并且全新升级“日日新SenseNova 5.0”大模型体系，其综合能力全面对标GPT-4 Turbo，技术领跑加速生成式AI向产业落地的全面跃迁，实现大模型按需所取。

商量、秒画、如影、琼宇、格物

五大模型全新亮相

按照科技行业普遍观点，某个技术超越科技奇点后就会产生科技大爆炸，围绕该技术的各类应用层出不穷，继而激活一轮新科技革命。在2024商汤技术交流日上，面对眼花缭乱的AI应用，与会观众无不感叹：“AI正在进入‘大航海时代’。”

厚积薄发之下，2023年上半年，商汤科技顺应潮流，发布了“日日新SenseNova”大模型体系和生成式AI产品系列，其中包括商量、秒画、如影、琼宇、格物五大模型，分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。

在技术交流日，记者发现，这五大模型以全新版本全面亮相，其中一些局部能力甚至赶超GPT-4。

大语言模型完成各种任务的基础，是能够理解用户提出的问题，并搞清楚文字背后的意图。许多中国的公司比较自研模型与GPT-4 等海外模型时，会强调自己的模型更懂中文。记者就在现场测试了商汤“商量”大语言模型的中文理解能力。

根据现场工作人员提示，记者“调取”了资料库里《道德经》、《论语》、《易经》这三本古籍的文档，并输入“找到文章的名字，一句话总结，并写出摘要”等指令，几秒钟内，“商量”便有条不紊地输出相关内容，包括每章节的名字、大纲概要，对内容的总结理解等。记者粗略浏览了一页，“商量”撰写的内容言简意赅，内容排版清晰，用户在阅读时能够准确及时找到每本书每章节对应的概要。

除了对中文的深入理解能力，“商量”的数学理解能力也是一大优势。据了解，数学曾一度是大语言模型的短板，GPT-3.5发布后，也被指出过做不了简单数学题。记者在现场“调取”了一页数学题，要求“商量”解答其中一道“判断题：求商的近似值时，要保留三位小数，就要除到商的百分位。”“商量”给出的答案为：（×）。

“商量”解释称，求商的近似值时，保留几位小数并不直接决定于除法运算进行到哪一位，而是根据题目要求决定保留的小数位数。例如，如果要求保留三位小数，那么除法的结果至少要到千分位。并且根据第四位小数来决定是否进位。因此，该说法不准确。同时，它还附上了正确做法。

日日新5.0版本发布

聚集增强数学、推理及代码能力

商汤生成式AI产品系列的突破性表现，得益于其最新发布的日日新5.0版本大模型。记者了解到，自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据，全新的“日日新SenseNova 5.0”采用混合专家架构，推理时上下文窗口可以有效到200K左右。

技术交流日上，商汤科技董事长兼CEO徐立表示，本次更新主要聚集增强了知识、数学、推理及代码能力，全面对标GPT-4 Turbo，主流客观评测上达到或超越GPT-4 Turbo。

在文科能力方面，“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升，相同的中文知识注入后，可以获得更好的理解总结及问答，为教育、内容产业等垂直应用场景提供有力辅助；在理科能力方面，“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平，为金融、数据分析等场景落地提供坚实基础。

本次“日日新5.0”另一大核心指标就是多模态能力，与此同时，在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的多模态交互能力。

在本次技术交流日最后环节，徐立还带来了三段完全由大模型生成的视频，并强调文生视频平台对于人物、动作和场景的可控性。他表示，通过商汤打造的智能算力中心，可以不断赋能于大模型的训练，目前，日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得创新。

头图为商汤临港智算中心沙盘展示。劳动报记者陈宁摄

摄影：陈宁

摄像：陈宁

责任编辑：罗菁

劳动观察新闻，未经授权不得转载