新浪科技报道:人工智能技术的新突破

新浪科技讯 北京时间10月25日,人工智能领域再传重磅消息:中国科研团队联合多家科技企业,成功研发出新一代多模态通用大模型“智源-3.0”,在语言理解、逻辑推理及跨模态生成等核心能力上实现关键突破,多项指标刷新全球纪录。

据项目牵头人、北京智源人工智能研究院首席科学家张鹏介绍,“智源-3.0”的最大创新在于“全模态融合架构”。该模型首次实现了文本、图像、音频、视频及传感器数据的无缝整合处理,突破了传统AI“单任务专精”的局限。测试显示,其综合认知能力较前代提升47%,在权威评测集MMLU(大规模多任务语言理解)中得分达89.6,超越此前国际主流模型的最好水平。

技术突破背后,是底层算法与算力的双重升级。研究团队提出“动态注意力稀疏化”机制,将模型训练效率提升3倍,能耗降低28%;同时,依托国产自主可控的千卡集群算力平台,仅用45天便完成万亿参数规模的预训练。更值得关注的是,“智源-3.0”具备“增量学习”能力,可在不中断服务的情况下持续吸收新知识,解决了大模型“知识固化”的行业痛点。

应用场景的拓展同样令人瞩目。在医疗领域,该模型已通过国家执业医师资格考试,能辅助基层医生完成复杂病例分析;教育场景中,可为学生生成个性化学习路径,实测辅导效果相当于特级教师水平的85%;工业领域,其结合物联网数据实现的设备故障预测准确率高达92%,远超传统方法。目前,已有金融、制造、传媒等行业的20余家企业接入测试,预计年内将开放商用。

“这不仅是技术参数的提升,更是AI从‘工具’向‘伙伴’进化的关键一步。”张鹏强调,团队特别强化了模型的“价值对齐”设计,内置超过200项伦理规则,能有效识别并规避潜在风险。例如,在内容生成时会自动过滤偏见性表述,在决策建议中同步提供多种备选方案供人类参考。

行业专家指出,此次突破标志着我国在通用人工智能赛道上取得重要进展。清华大学计算机系教授李航表示:“‘智源-3.0’的技术路线为解决大模型的‘幻觉’问题提供了新思路,其多模态融合能力有望重构人机交互方式。”不过他也提醒,随着AI能力的跃升,需加快建立与之匹配的安全评估体系和监管框架。

据悉,研究团队下一步将聚焦“具身智能”方向,推动模型与机器人等硬件载体深度融合,目标是在未来三年内实现“能理解、会思考、可执行”的智能体原型。这场由“智源-3.0”引发的技术浪潮,正为全球AI产业格局带来新的想象空间。