OpenAI大模型上身机器人,原速演示炸场!

标签: 资讯 首页轮播 OpenAI 具身智能 | 发表时间:2024-03-14 05:34 | 作者:明敏
出处:https://www.qbitai.com

编辑部 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI大模型加持的机器人,深夜来袭!

名曰 Figure 01,它能听会说,动作灵活。

OpenAI大模型上身机器人,原速演示炸场!

能和人类描述眼前看到的一切:

我在桌子上看到了一个红色的苹果,沥水架上面还有几个盘子和一个杯子;然后你站在附近,手放在桌子上。

OpenAI大模型上身机器人,原速演示炸场!

听到人类说“想吃东西”,就马上递过去苹果。

OpenAI大模型上身机器人,原速演示炸场!

而且对于自己做的事有清楚认知,给苹果是因为这是桌上唯一能吃的东西。

还顺便把东西整理,能 同时搞定两种任务

OpenAI大模型上身机器人,原速演示炸场!

最关键的是,这些展示都 没有加速,机器人本来的动作就这么迅速。

(也没人在后面操纵)

这下网友坐不住了,立马@波士顿动力:

老伙计们,这家伙是真来劲儿了。咱得回实验室,让以前的机器人(波士顿动力)多跳点舞了。

OpenAI大模型上身机器人,原速演示炸场!

也有网友看在OpenAI卷完大语言模型、文生视频之后,又狙击机器人后感慨道:

这是一场激烈的竞争;与OpenAl合作,苹果可能会超越特斯拉。

但硬件方面,擎天柱看起来更美观,Figure 01仍然需要一些“整容手术”。(doge)

OpenAI大模型上身机器人,原速演示炸场!

接下来,我们继续来看下Figure 01的细节。

OpenAI视觉语言大模型加持

根据创始人的介绍,Figure 01通过端到端神经网络,可以和人类自如对话。

基于OpenAI提供的视觉理解和语言理解能力,它能完成快速、简单、灵巧的动作。

模型只说是一个视觉语言大模型,是否为GPT-4V不得而知。

OpenAI大模型上身机器人,原速演示炸场!

它还能规划动作、有短期记忆能力、用语言解释它的推理过程。

OpenAI大模型上身机器人,原速演示炸场!

比如对话里说“你能把它们放在那里吗?”

“它们”、“那里”这种模糊表述的理解,就体现了机器人的短期记忆能力。

它使用了OpenAI训练的 视觉语言模型,机器人摄像头会以10Hz拍下画面,然后神经网络将以200Hz输出 24自由度动作(手腕+手指关节角度)。

具体分工上,机器人的策略也很像人类。

复杂动作交给AI大模型,预训练模型会对图像和文本进行常识推理,给出动作计划;

简单动作如抓起塑料袋(抓哪里都可以),机器人基于已学习的视觉-动作执行策略,可以做出一些“下意识”的快速反应行动。

同时全身控制器会负责保持机身平衡、运动稳定。

OpenAI大模型上身机器人,原速演示炸场!

机器人的语音能力则基于一个文本-语音大模型微调而来。

OpenAI大模型上身机器人,原速演示炸场!

除了最先进的AI模型,Figure 01背后公司——Figure的创始人兼CEO还在推文中提到,Figure方面整合了机器人的所有关键组成。

包括电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。

据了解,这家机器人初创公司在2周前才正式宣布和OpenAI的合作,但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。

OpenAI大模型上身机器人,原速演示炸场!

由此,具身智能领域又有一颗新星走到了聚光灯下。

“将人形机器人带进生活”

说到Figure,这家公司创立于2022年,正如前文所言,再次引爆外界关注,就在十几天前——

官宣在新一轮融资中筹集6.75亿美元,估值冲到26亿美元,投资方几乎要集齐半个硅谷,包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。

更重要的是,OpenAI同时公开了与Figure更进一步合作的计划:将多模态大模型的能力扩展到机器人的感知、推理和交互上,“开发能够取代人类进行体力劳动的人形机器人”。

用现在最热的科技词汇来说,就是要一起搞 具身智能

OpenAI大模型上身机器人,原速演示炸场!

彼时,Figure 01的最新进展是酱婶的:

通过观看人类的示范视频,仅需10小时端到端训练,Figure 01就能学会用胶囊咖啡机泡咖啡。

OpenAI大模型上身机器人,原速演示炸场!

Figure与OpenAI的合作一公开,网友们就已经对未来的突破充满了期待。

OpenAI大模型上身机器人,原速演示炸场!

毕竟Brett Adcock,可是把“唯一的重点是以30年的视角建立Figure,以积极影响人类的未来”这样的话都写在个人主页上了。

但可能没人能想得到,仅仅两周左右的时间,新进展就来了。

如此之快,如此之远。并且还能持续泛化、扩展规模。

OpenAI大模型上身机器人,原速演示炸场!

值得一提的是,与炸场demo同时发布的,还有Figure的招聘信息:

我们正在将人形机器人带进生活。加入我们。

OpenAI大模型上身机器人,原速演示炸场!

参考链接:
[1]https://twitter.com/figure_robot/status/1767913661253984474?s=46&t=HBob6gxh8cOfZTIbieKeSA
[2]https://twitter.com/adcock_brett/status/1767913955295744449
[3]https://twitter.com/coreylynch/status/1767927194163331345

相关 [openai 模型 上身] 推荐:

OpenAI大模型上身机器人,原速演示炸场!

- - 量子位
量子位 | 公众号 QbitAI. OpenAI大模型加持的机器人,深夜来袭. 名曰 Figure 01,它能听会说,动作灵活. 能和人类描述眼前看到的一切:. 我在桌子上看到了一个红色的苹果,沥水架上面还有几个盘子和一个杯子;然后你站在附近,手放在桌子上. 听到人类说“想吃东西”,就马上递过去苹果.

如何评价OpenAI的超级对话模型ChatGPT? - 知乎

- -
有幸参与ChatGPT训练的全过程. RLHF会改变现在的research现状,个人认为一些很promising的方向:在LM上重新走一遍RL的路;如何更高效去训练RM和RL policy;写一个highly optimized RLHF library来取代我的. dataset的质量、多样性和pretrain在RLHF的比重很重要.

国产大模型推理能力已超GPT-3.5!冲进OpenAI评测榜第一梯队

- - 量子位
量子位 | 公众号 QbitAI. OpenAI开源的数学数据集,中国厂商新成绩一举冲到最前列. 就在9月16日,国产大模型在权威推理评测集GSM8K中,首次达到了80%正确率,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%). 而且这家厂商在大模型榜单上刷新全球纪录,已经不是第一次了.

OpenAI团队成员都是谁

- -
「OpenAI团队成员都是谁,出乎意料吗. 」 新版 GPT-4 就要来了,据说很强大. 附图是ChatGPT的创建者OpenAI团队:(左起)首席执行官萨姆·奥特曼,首席技术官米拉·穆拉蒂,总裁格雷格·布罗克曼,以及首席科学家伊利亚·苏茨科弗. 首席执行官萨姆·奥特曼(Samuel H. Altman):1985年出生于芝加哥,犹太人,他十岁时出柜为男同性恋,他曾在斯坦福大学学习计算机科学,2005年退学创业.

基于OpenAI的代码编辑器:Cursor

- - 程序猿DD
最近随着OpenAI的一系列大动作,把软件领域搅的天翻地覆. 各行各业各领域,都出现了大量新产品. 开发工具领域首当其冲,各种新工具层出不穷,今天TJ就给大家推荐一个全新的开发工具:Cursor. 从官网介绍可以看到,Cursor基于OpenAI实现,继承了最新的GPT-4模型,支持Mac、Windows、Linux三大平台.

OpenAI关于Kubernetes集群近万节点的生产实践

- - Indagate
OpenAI已经将Kubernetes集群规模扩展至7500个节点,为大型神经网络模型(如GPT-3,CLIP和DALL·E)及小型实验性研究提供了可扩展的基础架构. 很少将单个Kubernetes集群扩展到如此规模,为此进行了一些必要的改进,但好处是单一的基础架构使我们的机器学习研究团队可以在不修改代码的前提下,快速扩展以缩短实验时间、加速研发进度.

ChatGPT实火!微软正洽谈100亿美元增持OpenAI

- - TechWeb 今日焦点 RSS阅读
【TechWeb】1月10日消息,据国外媒体报道,最近爆火的AI聊天机器人ChatGPT所有者OpenAI在日前传出打算以要约形式出售股票后,今日又传出了与微软更进一步投资合作的消息. 知情人士称,周二,微软正在与OpenAI就100亿美元的入股事宜进行谈判. OpenAI此次融资对象还包括其他风险投资公司在内.

ChatGPT的前世今生:OpenAI的技术“执拗”与“豪赌”

- - 新浪科技滚动新闻
本文全方位地介绍了 ChatGPT 的能力特征、发展历程以及 OpenAI 一路走来所坚守的技术路线,并对 ChatGPT 出现之后 NLP 领域的范式转换进行了展望,即 ChatGPT 开启‘文本生成 + 指令’的范式.   1、ChatGPT,不再‘愚蠢’的人工智能.   ChatGPT 的相关话题应该算是继 AlphaGo 以来,最出圈的人工智能热点了.

使用 OpenAi Api 在本地搭建一个 ChatGPT 网页版

- - SaltyLeo 的博客
之前 ChatGPT 在网络上大火,由于很多开发者使劲薅羊毛,OpenAi 也撑不住了,对于新注册账号只有5美刀的免费额度了,网页版也各种限制. OpenAi 使用了 CloudFlare 的防火墙,而我使用的 IP 是美西的机房,没有任何意外地被屏蔽了. 为了方便我继续使用,我在移动端设备使用 baye 大佬开发的.

OpenAI 发布 GPT-4,有哪些技术上的优化或突破?

- - 知乎每日精选
在这个历史性的时刻,回答个问题,留下自己作为历史见证人的足迹. GPT4的技术报告里很明确地指出了三个新的方向:. 第一,LLM最前沿研究的封闭化或小圈子化. 技术报告里说了,出于竞争以及安全等方面的考虑,未公布模型规模等技术细节. 从GPT 2.0的开源,到GPT 3.0的只有论文,再到ChatGPT连论文也没有,直到GPT 4.0的技术报告更像效果评测报告.