4月23日下午,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova 5.0”大模型体系,其综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。
商量、秒画、如影、琼宇、格物
五大模型全新亮相
按照科技行业普遍观点,某个技术超越科技奇点后就会产生科技大爆炸,围绕该技术的各类应用层出不穷,继而激活一轮新科技革命。在2024商汤技术交流日上,面对眼花缭乱的AI应用,与会观众无不感叹:“AI正在进入‘大航海时代’。”
厚积薄发之下,2023年上半年,商汤科技顺应潮流,发布了“日日新SenseNova”大模型体系和生成式AI产品系列,其中包括商量、秒画、如影、琼宇、格物五大模型,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。
在技术交流日,记者发现,这五大模型以全新版本全面亮相,其中一些局部能力甚至赶超GPT-4。
大语言模型完成各种任务的基础,是能够理解用户提出的问题,并搞清楚文字背后的意图。许多中国的公司比较自研模型与GPT-4 等海外模型时,会强调自己的模型更懂中文。记者就在现场测试了商汤“商量”大语言模型的中文理解能力。
根据现场工作人员提示,记者“调取”了资料库里《道德经》、《论语》、《易经》这三本古籍的文档,并输入“找到文章的名字,一句话总结,并写出摘要”等指令,几秒钟内,“商量”便有条不紊地输出相关内容,包括每章节的名字、大纲概要,对内容的总结理解等。记者粗略浏览了一页,“商量”撰写的内容言简意赅,内容排版清晰,用户在阅读时能够准确及时找到每本书每章节对应的概要。
除了对中文的深入理解能力,“商量”的数学理解能力也是一大优势。据了解,数学曾一度是大语言模型的短板,GPT-3.5发布后,也被指出过做不了简单数学题。记者在现场“调取”了一页数学题,要求“商量”解答其中一道“判断题:求商的近似值时,要保留三位小数,就要除到商的百分位。”“商量”给出的答案为:(×)。
“商量”解释称,求商的近似值时,保留几位小数并不直接决定于除法运算进行到哪一位,而是根据题目要求决定保留的小数位数。例如,如果要求保留三位小数,那么除法的结果至少要到千分位。并且根据第四位小数来决定是否进位。因此,该说法不准确。同时,它还附上了正确做法。
日日新5.0版本发布
聚集增强数学、推理及代码能力
商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。
技术交流日上,商汤科技董事长兼CEO徐立表示,本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。
在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助;在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。
本次“日日新5.0”另一大核心指标就是多模态能力,与此同时,在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。
在本次技术交流日最后环节,徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。他表示,通过商汤打造的智能算力中心,可以不断赋能于大模型的训练,目前,日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得创新。
头图为商汤临港智算中心沙盘展示。劳动报记者陈宁摄