使用 GPT-3 模型，研究人員研發(fā)出能聽懂英語(yǔ)指令并執(zhí)行家務(wù)的機(jī)器人

發(fā)布日期：2023-05-15 來源：IT之家作者：遠(yuǎn)洋瀏覽次數(shù)：217

核心提示：這款機(jī)器人可以根據(jù)用戶的喜好，自動(dòng)完成如分類洗衣服、撿起地上的垃圾、收拾玩具等任務(wù)。

IT之家 5 月 14 日消息，普林斯頓大學(xué)、斯坦福大學(xué)和谷歌的一組研究人員，利用 OpenAI 的 GPT-3 Davinci 模型，研發(fā)出了一款能聽懂英語(yǔ)指令并執(zhí)行家務(wù)的機(jī)器人，名為 TidyBot。這款機(jī)器人可以根據(jù)用戶的喜好，自動(dòng)完成如分類洗衣服、撿起地上的垃圾、收拾玩具等任務(wù)。

GPT-3 Davinci 模型是一種深度學(xué)習(xí)模型，屬于 GPT 模型系列的一部分，可以理解和生成自然語(yǔ)言。該模型具有強(qiáng)大的總結(jié)能力，可以從大量的文本數(shù)據(jù)中學(xué)習(xí)復(fù)雜的對(duì)象屬性和關(guān)系。研究人員利用這種能力，讓機(jī)器人根據(jù)用戶提供的幾個(gè)示例對(duì)象放置位置，如“黃色襯衫放在抽屜里，深紫色襯衫放在衣柜里，白色襪子放在抽屜里”，然后讓模型總結(jié)出用戶的一般偏好規(guī)則，并應(yīng)用到未來的交互中。

研究人員在論文中寫道：“我們的基本見解是，LLM（大型語(yǔ)言模型）的總結(jié)能力與個(gè)性化機(jī)器人的泛化需求非常匹配。LLM 展示了通過總結(jié)實(shí)現(xiàn)泛化的驚人能力，利用從海量文本數(shù)據(jù)集中學(xué)習(xí)到的復(fù)雜對(duì)象屬性和關(guān)系。”

他們還寫道：“與需要昂貴的數(shù)據(jù)收集和模型訓(xùn)練的傳統(tǒng)方法不同，我們展示了 LLM 可以直接開箱即用地實(shí)現(xiàn)機(jī)器人領(lǐng)域的泛化，利用它們從海量文本數(shù)據(jù)中學(xué)習(xí)到的強(qiáng)大的總結(jié)能力。”

研究人員在論文網(wǎng)站上展示了一個(gè)機(jī)器人，它能夠?qū)⑾匆路譃闇\色和深色，回收飲料罐，扔掉垃圾，收拾包和餐具，將散落的物品放回原處，并將玩具放入抽屜。

研究人員首先測(cè)試了一個(gè)基于文本的基準(zhǔn)數(shù)據(jù)集，其中輸入了用戶偏好，并要求模型創(chuàng)建個(gè)性化規(guī)則來確定物品歸屬。模型將示例總結(jié)為一般規(guī)則，并使用總結(jié)來確定新物品的放置位置�；鶞�(zhǔn)場(chǎng)景定義在四個(gè)房間中，每個(gè)房間有 24 個(gè)場(chǎng)景。每個(gè)場(chǎng)景包含兩到五個(gè)放置物品的地方，并且有相同數(shù)量的已見和未見物品供模型分類。他們寫道，這個(gè)測(cè)試在未見物品上達(dá)到了 91.2% 的準(zhǔn)確率。

當(dāng)他們將這種方法應(yīng)用到真實(shí)世界的機(jī)器人 TidyBot 時(shí)，他們發(fā)現(xiàn)它能夠成功地收拾 85% 的物體。TidyBot 在八個(gè)真實(shí)場(chǎng)景中進(jìn)行了測(cè)試，每個(gè)場(chǎng)景有一組十個(gè)物品，并在每個(gè)場(chǎng)景中運(yùn)行機(jī)器人 3 次。據(jù)IT之家了解，除了 LLM，TidyBot 還使用了一個(gè)叫做 CLIP 的圖像分類器和一個(gè)叫做 OWL-ViT 的物體檢測(cè)器。

佐治亞理工學(xué)院交互計(jì)算學(xué)院的助理教授徐丹飛（Danfei Xu）在談到谷歌的 PaLM-E 模型時(shí)表示，LLM 使機(jī)器人具有更多的問題解決能力。“以前的任務(wù)規(guī)劃系統(tǒng)大多依賴于一些形式的搜索或優(yōu)化算法，這些算法不太靈活，也很難構(gòu)建。LLM 和多模態(tài) LLM 使這些系統(tǒng)能夠從互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)中受益，并輕松地用于解決新問題。”他說。

關(guān)鍵詞：服務(wù)機(jī)器人 GPT-3 模型聽懂英語(yǔ)指令并執(zhí)行家務(wù)的機(jī)器人

工博士工業(yè)品商城聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點(diǎn)，也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑，請(qǐng)立即與商城(adidas666.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
聯(lián)系電話：021-31666777
新聞、技術(shù)文章投稿QQ：3267146135 投稿郵箱：syy@gongboshi.com

相關(guān)閱讀