NVIDIA本周在德国慕尼黑举行的年度机器人学习大会上推出了这些新工具,大会重点关注了机器人技术和机器学习的交叉领域。
其中,包括现已上市的机器人学习框架NVIDIA Isaac Lab;6个用于Project GR00T的新人形机器人学习工作流程,以支持AI机器人大脑开发;以及用于视频处理的新开发人员工具。
观察和理解世界对于机器人技术发展至关重要。这就必须要分解来自摄像头的视频,以便AI模型可以处理这些视频。NVIDIA宣布Cosmos开源标记器现在已经全面上市,为开发者提供了高质量的标记功能,具有极高的压缩率,运行速度比当前的标记器快12倍,与NeMo Curator相结合可以优化和理解输入内容。
这也使开发者能够构建更好的“世界模型”(即世界的AI表示),可以预测机器人执行动作时物体和环境将如何响应。
例如,当机器人夹持器靠近香蕉时会发生什么?成熟的香蕉很软,因此机器人夹持器不能快速或用力靠近,否则会破碎、变形并造成混乱。一张纸呢?必须以不同的方式抓取纸。不管是哪一种情况,都涉及视频数据的高质量编码和解码。
人形机器人初创公司1X Technologies的AI副总裁Eric Jang解释说,Cosmos标记器帮助他的公司实现了高数据压缩,同时仍保持极高的视觉质量。他说:“这使我们能够以更高效的方式训练具有长视界视频生成的世界模型。”
并非所有机器人AI大脑都可以在现实世界中训练,因此NVIDIA发布了Isaac Lab,这是一个基于Omniverse数字孪生模拟平台的开源机器人学习框架。
Omniverse是一个实时3D图形协作和模拟平台,让艺术家、开发者和企业使用完全实现的物理学构建工厂、城市和其他空间的逼真的3D模型和场景,这使其成为模拟虚拟环境以训练机器人的一款强大工具。
开发者可以使用Isaac Lab训练机器人并大规模调整策略,以了解性能和安全性。这个框架适用于任何框架和机器人化身,包括手臂、人形机器人、四足动物和群体。
NVIDIA表示,全球有很多商用机器人制造商和研究团体已经把Isaac Lab纳入他们的工作流程中,包括Agility Robots、Boston Dynamics、1X、Galbot、Fourier、Mentee Robotics和Berkeley Humanoid。
Project GR00T和更多人形机器人工作流程
构建和开发先进的人形机器人是一项艰巨的挑战,因为人类可以轻松完成的行走、感知和采取行动需要大量的硬件工程、AI训练和AI计算,才能让机器人完成看似简单的任务。
Project GR00T是NVIDIA的一项计划,为开发者提供通用人形机器人的AI基础模型、软件库和数据管道,帮助开发者快速制作原型并更快展开构建。
为了帮助开发者构建先进的人形机器人,NVIDIA宣布推出了6个新的Project GR00T工作流程蓝图,帮助他们在机器人中开发新的功能。
GR00T-Gen让开发者可以打造逼真的模拟环境,以训练机器人在其中移动、操纵物体和执行其他任务。它使用大型语言模型和3D生成式AI模型来创建视觉多样化的场景和随机场景,帮助创建强大的训练环境。
GR00T-Mimic让机器人可以向人类老师学习。使用这种工作流程,人类演示者可以远程操作机器人并以与人类相同的方式执行操作,例如在仓库中走动、从货架上拉出箱子并将箱子放在推车上,让机器人在相同的环境中也可以模仿相同的动作。NVIDIA表示,这个方法使用物理世界中有限数量的人类演示,使用扩展现实例如Apple Vision Pro,然后缩放运动数据以帮助机器人自己产生更有机的运动。
GR00T-Dexterity和GR00T-Control为人形机器人提供了一套精细的灵巧操作和广泛的身体控制模型和策略。Dexterity将帮助开发者使用具有执行器和指关节高度灵巧的手的机器人,并处理未抓握、抓握力和其他抓握动作。GR00T-Control将有助于为整个身体进行运动规划,以便行走、移动四肢或执行任务。
GR00T-Mobility为开发者提供了一套模型,帮助人形机器人行走和绕过障碍物,旨在实现基于学习的方法,快速推广到新环境中。
最后,GR00T-Perception增加了高级软件库和人机交互基础模型,帮助机器人“记住”事件的长期历史。为此,NVIDIA为Perception添加了恰如其名的ReMEmbR,为机器人提供个性化人类互动的记忆,并提供背景和空间意识,以提供更好的感知、认知和适应能力。
好文章,需要你的鼓励
面对全球气候挑战,美国NOAA数据显示近年来每年发生至少10起损失超10亿美元的天气灾害。Tomorrow.io公司开发了微波探测卫星星座,采用多光谱成像、高分辨率成像、无线电掩星、合成孔径雷达等五种数据技术,构建首个商业化大气3D研究架构。该项目旨在解决全球覆盖数据不足问题,提供更精确的天气预报和灾害预警能力。
加州大学圣克鲁兹分校研究团队创建了包含150万高质量样本的GPT-IMAGE-EDIT-1.5M图像编辑数据集,通过利用GPT-4o优化现有数据质量,使开源AI模型在多项测试中达到接近GPT-4o的性能水平,在GEdit-EN测试中获得7.24分的突破性成绩,显著缩小了开源与商业模型的差距,为AI图像编辑技术的民主化奠定了基础。
本文深入分析OpenAI新发布的ChatGPT学习模式背后的自定义指令机制。学习模式通过教育专家协作制定的自定义指令,引导AI采用循序渐进的教学方式,而非直接给出答案。文章将自定义指令分为五个部分:总体目标、严格规则、行动指南、语调方法和重点强调。这些指令体现了优秀的提示工程技巧,可应用于其他AI场景。作者强调自定义指令的强大功能,建议用户通过分段结构化方式制定指令,并进行充分测试和调试以确保效果。
这项由清华旗下奇虎科技等机构联合开发的研究,提出了ForCenNet前景中心网络来解决手机拍摄文档变形问题。与传统均匀处理方法不同,该系统重点关注文档中的关键信息区域如文字和表格线条,采用创新的前景分割、掩码引导和曲率一致性优化技术,在四个主流数据集上达到最优性能,为移动文档数字化提供了高效解决方案。
爷爷的妹妹叫什么 | 绿杨春属于什么茶 | st什么意思 | 主管护师是什么职称 | 梦见什么是怀孕的征兆 |
陆地上最重的动物是什么 | 倾向是什么意思 | 关节炎用什么药 | 党费什么时候开始交 | 十二年义务教育什么时候开始 |
au750是什么材质 | 翘首以盼是什么意思 | 钧什么意思 | 神经性皮炎用什么药膏 | 形态是什么意思 |
mini是什么车 | 夏天吃什么好 | 无名指和小指发麻是什么原因 | 健康证是什么样的 | 黄芪最佳搭配是什么 |
运字是什么结构hcv9jop7ns3r.cn | 纤维素纤维是什么面料hcv9jop7ns5r.cn | 花甲炒什么配菜好吃inbungee.com | kenzo是什么牌子hcv7jop5ns4r.cn | 前列腺增大伴钙化灶是什么意思hcv8jop4ns0r.cn |
o型rhd阳性是什么意思hcv8jop2ns4r.cn | 鸡蛋花的花语是什么hcv8jop1ns6r.cn | 1927年属什么生肖hebeidezhi.com | 小腿出汗是什么原因hcv8jop1ns6r.cn | 湿肺是什么意思hcv9jop2ns2r.cn |
6月22是什么星座yanzhenzixun.com | 喝酒对身体有什么影响hcv9jop3ns4r.cn | 面部痉挛吃什么药hcv8jop7ns4r.cn | 董字五行属什么hcv8jop9ns0r.cn | 中秋节送什么好hcv8jop1ns9r.cn |
汗蒸和桑拿有什么区别hcv8jop0ns4r.cn | 90年属什么生肖hcv8jop0ns2r.cn | 鸡蛋价格为什么这么低hcv7jop9ns6r.cn | 用什么药膏能拔去粉瘤xscnpatent.com | 巩固是什么意思bjhyzcsm.com |