北京商报讯(记者 魏蔚)3月29日,智源研究院院长王仲远在未来人工智能先锋论坛上,分享了智源研究院在具身智能领域的思考。
“大语言模型和多模态大模型的发展,进一步推动机器人从1.0时代向2.0时代发展。人工智能与机器人有了交汇点。机器人2.0时代,具身智能就是最重要的特征”,肯定大模型发展的同时,王仲远没有避讳问题,“当前具身智能的发展遇到很多瓶颈,首先硬件依然不够成熟,成本比较高,阻碍具身智能进入更多场景落地应用。同时具身数据比较缺乏,导致模型的能力偏弱。在应用上,模型能力不足,又导致落地困难,形成了具身智能发展的循环悖论。要破解这些挑战,需要每个环节都去突破”。
他进一步说,当前具身大模型存在几个很明显的问题,不好用、不易用、不通用。不好用是指现在的具身智能大模型没有到“ChatGPT时刻”,不易用是指部署具身大模型时和本体的适配难度比较高。不通用指的是一些具身模型只能在一种本体或同一品牌的本体使用,这阻碍了更多的机器人公司和硬件公司享受大模型的赋能。
针对上述问题,智源研究院当天发布首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain。
作为面向多机器人系统的跨本体具身大小脑协作框架,RoboOS专为解决当前具身智能落地过程中的通用性适配与多机调度难题而设计。
RoboBrain由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T-LoRA模块。在推理时中国股票配资,模型首先感知视觉输入,并将输入指令分解为一系列可执行的子任务,然后执行可操作区域感知和轨迹预测。RoboBrain采用多阶段训练策略,使其具备长历史帧记忆和高分辨率图像感知能力,进而提升场景感知和操作规划的能力。