2026年04月29日 星期三
儿童打鼾要做手术吗 青春放歌 为机器人提供“具身大脑” 提取复用科学家智慧 放学后也能有一张“课外书桌”
第6版:科教卫新闻 2026-04-29
商汤开源“原生理解生成统一模型”

为机器人提供“具身大脑”

本报讯(记者 郜阳)昨天夜间,商汤科技发布并开源“日日新SenseNova U1”系列原生理解生成统一模型。它基于商汤今年3月自主研发的NEO-unify架构,首次在单一模型架构上实现多模态理解、推理与生成的统一,标志着从“模态集成”向“原生统一”的范式跨越。

据悉,NEO-unify架构彻底摒弃了主流的拼接式设计,重新构建了统一的表征空间,并将统一表征深入融入模型的每一层计算中。SenseNova U1能将语言与视觉信息作为一个复合体直接建模,让理解与生成能力同步增强,在保留语义丰富度的同时维持像素级的视觉保真度。在逻辑推理与空间智能方面,该模型能深度理解物理世界的复杂布局与精细关系。未来,它可为机器人提供“具身大脑”,在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行全过程。

本次开源发布的是SenseNova U1的轻量版系列——SenseNova U1 Lite,包含两个不同规格的模型:SenseNova-U1-8B-MoT(基于稠密骨干网络)和SenseNova-U1-A3B-MoT(基于混合专家MoE骨干网络)。相关代码与模型已上线GitHub和Hugging Face平台,商汤表示将于近期公布详细技术报告。

实验结果显示,SenseNova U1 Lite均达到同量级开源模型的SOTA(最先进水平)。仅凭8B-MoT的较小规格,就能达到甚至超越部分大型商业闭源模型。在通用图像生成测试中,其生成质量比肩Qwen-Image 2.0 Pro或Seedream 4.5等大型闭源模型,同时推理响应速度具有显著优势;在开源模型长期表现不佳的复杂信息图生成任务中,也展现出商业级水准。商汤科技表示,正沿着当前技术路径继续“规模化”,计划未来推出体量更大的模型。基于高效的原生架构,有望以远低于传统方案的计算成本达到国际顶尖模型水平。

凭借NEO-Unify架构,SenseNova U1在业内首个实现连续性的图文创作输出,并且仅需单次单模型调用即可完成。

放大

缩小

上一版

下一版

下载

读报纸首页