为机器人提供“具身大脑”

本版

第6版：科教卫新闻

儿童打鼾要做手术吗青春放歌为机器人提供“具身大脑” 提取复用科学家智慧放学后也能有一张“课外书桌”
目录

第1版:一版要闻

第2版:要闻

第3版:申观察

第4版:上海新闻

第5版:特别报道

第6版:科教卫新闻

第7版:社会新闻

第8版:蓝天下的至爱

第9版:长三角

第10版:长三角/万象

第11版:国际新闻

第12版:文体新闻

第13版:文体新闻/体育

第14版:文体新闻/体育

第15版:夜光杯

第16版:夜光杯

第6版：科教卫新闻 2026-04-29

商汤开源“原生理解生成统一模型”

为机器人提供“具身大脑”

本报讯（记者郜阳）昨天夜间，商汤科技发布并开源“日日新SenseNova U1”系列原生理解生成统一模型。它基于商汤今年3月自主研发的NEO-unify架构，首次在单一模型架构上实现多模态理解、推理与生成的统一，标志着从“模态集成”向“原生统一”的范式跨越。

据悉，NEO-unify架构彻底摒弃了主流的拼接式设计，重新构建了统一的表征空间，并将统一表征深入融入模型的每一层计算中。SenseNova U1能将语言与视觉信息作为一个复合体直接建模，让理解与生成能力同步增强，在保留语义丰富度的同时维持像素级的视觉保真度。在逻辑推理与空间智能方面，该模型能深度理解物理世界的复杂布局与精细关系。未来，它可为机器人提供“具身大脑”，在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行全过程。

本次开源发布的是SenseNova U1的轻量版系列——SenseNova U1 Lite，包含两个不同规格的模型：SenseNova-U1-8B-MoT（基于稠密骨干网络）和SenseNova-U1-A3B-MoT（基于混合专家MoE骨干网络）。相关代码与模型已上线GitHub和Hugging Face平台，商汤表示将于近期公布详细技术报告。

实验结果显示，SenseNova U1 Lite均达到同量级开源模型的SOTA（最先进水平）。仅凭8B-MoT的较小规格，就能达到甚至超越部分大型商业闭源模型。在通用图像生成测试中，其生成质量比肩Qwen-Image 2.0 Pro或Seedream 4.5等大型闭源模型，同时推理响应速度具有显著优势；在开源模型长期表现不佳的复杂信息图生成任务中，也展现出商业级水准。商汤科技表示，正沿着当前技术路径继续“规模化”，计划未来推出体量更大的模型。基于高效的原生架构，有望以远低于传统方案的计算成本达到国际顶尖模型水平。

凭借NEO-Unify架构，SenseNova U1在业内首个实现连续性的图文创作输出，并且仅需单次单模型调用即可完成。