智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

機器人能自學會走了

來源:智匯工業

點擊:1411

A+ A-

所屬頻道:新聞中心

關鍵詞:機器人 學習技術

    通過深度強化學習,Google研究人員的一項新研究取得了重大進展,機器人可以在沒有人工干預的情況下學習走路。在幾個小時內,依靠對當前最先進算法的微調,機器人學會了完全獨立的向前走和向后走,以及左右轉彎。



    加州大學伯克利分校和佐治亞理工學院的研究人員在ArXiv預印服務器上發表了這篇論文,描述了一種統計AI技術,也是他們能用來產生這個成就的原因,即深度強化學習。他們開發了一個系統,用于以最少的人力在現實世界中以深度RL學習腿式運動策略。機器人學習系統的主要困難是自動數據收集和安全性。通過開發多任務學習程序,自動重置控制器和受安全限制的RL框架,他們克服了這兩個挑戰。


    研究人員在學習如何在三種不同地形上行走的任務上測試了這個系統:平坦的地面,柔軟的床墊和帶有縫隙的門墊。我們的系統無需人工干預,即可在Minitaur機器人上自動高效地學習運動技能。


    這項工作建立在一年前的研究基礎上,當時研究團隊首次發現了如何讓機器人在現實世界中學習,此前,大多數強化學習部署都在計算機模擬的環境中進行。但是,Rainbow Dash使用此技術來學習在實際物理環境中行走。而且,它能夠在沒有專門的教學機制的情況下進行操作,例如人工指導或帶有標簽的培訓數據。最終,Rainbow Dash成功地在多個表面上行走,包括柔軟的泡沫床墊和帶有明顯凹口的門墊。


    此前,強化學習通常會這樣在模擬環境中進行:機器人的虛擬分身在模擬的環境中走來走去,直到算法足夠完善,可以使其安全運行為止。然后將其導入真正的機器人。


    這種方法有助于避免機器人在反復實驗過程中對周圍環境的損傷,但也需要一個易于建模的環境。在機器人腳下模擬自然散落的沙礫或者彈簧床墊需要很長時間,根本不值得。


    基于這種狀況,研究人員從一開始就決定通過在真實世界中訓練來避免困難的環境建模。他們設計了一種更高效的算法,可以使學習的試驗次數變少一點,并在兩個小時內讓機器人站起來行走。由于實際環境中會有自然變化,機器人也能夠快速適應其他相似的環境,如斜坡、臺階以及有障礙的平地。


    于是他們開始解決這個新問題。首先,他們限定了機器人可以探索的地形,并讓它一次性進行多重動作訓練。如果機器人在學習如何向前走的同時到達了限定地形的邊緣,它就會改變方向,開始學習如何向后走。


    其次,研究人員還限制了機器人的訓練動作,讓它能夠謹慎一些,最大限度地減少反復摔倒帶來的傷害。當機器人不可避免地摔倒時,他們還添加了另一個硬編碼算法來幫助它站起來。


    通過這些調整,機器人學會了如何在幾個不同的環境中自主行走,包括平地、記憶泡沫床墊和有縫隙的門墊。這項實驗給未來的某些應用帶來了可能性,有些情況可能需要機器人在沒有人類的情況下在坎坷和未知的地形中行走。


    機器人使用的深度強化學習技術包括一種機器學習技術,其中通過代理服務器與環境交互以反復試驗來學習。一般而言,機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。科學團隊一開始就專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能,它是人工智能的核心,是使計算機具有智能的根本途徑,原先,大多數強化學習用例都涉及計算機游戲,例如在數字特工中學習如何取得勝利,本次應用也是谷歌對于人工智能算法的一次極好嘗試。


    而在機器人身上的所謂深度強化學習,指的是當計算機正確完成一項任務時,它將獲得指導其學習過程的獎勵。盡管以“先驗知識”算法概述了任務的步驟,但是如何準確地執行這些步驟卻沒有。當機器人擅長執行某個步驟時,其獎勵會增加,從而創建一種反饋機制,促使機器人學習最佳方法,例如將熱狗放在面包上。


    這種形式的機器學習與傳統的有監督或無監督學習明顯不同,在傳統的有監督或無監督學習中,機器學習模型需要標記的訓練數據來學習。深度強化學習將強化學習方法與深度學習相結合,傳統的機器學習的規模隨著強大的計算能力而大大擴展。


    斯坦福大學助理教授Chelsea Finn表示:“這項工作令人感到非常興奮。” 芬恩也為谷歌工作,但沒有參與這項研究。“讓這個過程不再出現人工干預真的很難。機器人能夠更自主地學習,就更有可能在我們生活的現實世界中學習,而不是在實驗室里。”但她也提醒到,目前的設置依賴于機器人上方的動作捕捉系統來確定其位置。這在現實世界中是不可能的。


    盡管研究團隊將Rainbow Dash的學習能力歸功于自己,但人為干預仍在實現該目標方面發揮了重要作用。例如研究人員必須創建邊界,機器人可以在該邊界內學習走路,以防止機器人離開該區域。他們還必須設計特定的算法來防止機器人摔倒,其中一些算法集中在限制機器人的運動上。為了防止諸如墜落損壞之類的事故,通常在數字環境中進行機器人強化學習,然后再將算法轉移到物理機器人上以保持其安全性。


    接下來,研究人員希望他們的算法能適用于不同種類的機器人,或適用于多個機器人在同一環境中同時進行學習。譚杰相信,破解機器人的運動能力將是解鎖更多有用機器人的關鍵。“很多地方都是為人類建造的,我們都用腿來走路,” 他說,“如果機器人學不會使用腿,它們就不能在人類世界中行走。”


    這確實是機器人自主行動的重要一步了,距離機器人自己自主行動也并不遙遠,到時候,我們到底是該恐懼還是興奮呢?

    (審核編輯: 智匯婷婷)

    聲明:除特別說明之外,新聞內容及圖片均來自網絡及各大主流媒體。版權歸原作者所有。如認為內容侵權,請聯系我們刪除。

    主站蜘蛛池模板: 康明斯柴油发电机厂家-康明斯发电机(深圳)有限公司 | 苏州新闻网_苏州最权威资讯| 生物安全柜检测,GMP设备确认,仪器性能确认,洁净厂房检测,仓储温湿度检测-上海熙迈 | 首页--南京俊全科技有限公司,环保监测无人机,大疆无人机,农用无人机,植保无人机,巡检无人机,无人机环境监测仪,消防,无人机,航拍测绘,固定翼无人机,无人机电力巡检,四旋翼无人机 | 旋风铣_数控旋风铣整机_旋风铣头|定制生产厂家【腾创机械厂官网】 | 清尼龙滤膜-清洁度检测设备-清洁度分析仪-清洁度萃取机-优昂(百科) | 液压尾管悬挂器,机械式尾管悬挂器价格,石油套管扶正器厂家,连续油管悬挂器,高压双塞水泥头,免钻塞注水泥分级箍,单塞套管水泥头价格,弹性套管扶正器,铸铝钢性扶正器,钢性套管扶正器厂家 | 拉丝机_拔丝机_拉丝设备_丝网机械 - 安平县泰煌拉丝机厂家 | 鑫金牛建设工程(苏州)有限公司 | 平邑衡器厂--临沂衡器--电子汽车衡 -- 十佳知名品牌企业 | 聚丙烯酰胺,聚合氯化铝,重金属捕捉剂,污泥调理剂,活性氧化铝,生石灰,反渗透阻垢剂,工业葡萄糖,硫酸铝,果壳活性炭,柱状活性炭,蜂窝活性炭,石英砂,锰砂-北京雁归来环保科技有限公司-以真诚为立足之本,以质量为生存之本,愿与海内外同仁共创双赢。雁归来人一路走来,气贯长虹,勇锐盖过怯弱,进取压倒苟安!我们紧扣时代脉搏,专注水处理、继往开来! | 惠声电子、广州市惠声电子科技有限公司、VBS、VBS惠声电子、VBS公共广播生产厂家、VBS广播功放生产厂家、VBS会议系统设备批发、VBSIP网络对讲系统厂家、VBS会议系统厂家、VBS智能中控厂家、VBS专业扩声厂家 | 莫非传媒官网-江西知名的网络营销推广服务平台南昌网络公司,专业网络公关,品牌危机处理,网站SEO优化,微信朋友圈广告,网站建设,南昌莫非文化传媒有限公司 | 气体检测仪,多功能气体检测仪,四合一检测仪,氯气检测仪,有机挥发气体检测仪,气体报警器-南京诺邦电子科技有限公司 | 激光切管机_等离子切管机_相贯线切管机厂家|服务为先-山东美峰智能设备有限公司 | 梦想加空间 - 一个程序猿的个人博客网站 | 营口新北方制糖有限公司| 无锡防爆墙-无锡泄爆墙_江苏鑫立轩装饰工程有限公司 | 气体灭火安装,气体灭火系统安装,七氟丙烷灭火系统安装,消防气体灭火控制系统 | 中空吹塑-PETG吹塑加工-吹塑玩具-东莞市鹏美塑胶五金有限公司 | 噪声治理,消声器,隔声屏障,隔声罩,噪声控制,降噪,空调降噪,水泵噪声治理,冷却塔噪声治理-北京华清恒业环保设备有限公司 | 思达测试|山东思达高科机械设备有限公司 | 太原门禁系统_太原车牌识别_山西人脸识别系统-山西元一智能科技有限公司 | 木屑烘干机|酒糟烘干机|果渣烘干机_郑州东鼎机械 | 智齿科技-智齿客服 | 在线客服_呼叫中心_客户联络中心方案 | 水热反应釜厂家_水热反应釜价格_水热合成反应釜批发-仪贝尔仪器 - 水热釜,水热反应釜,水热反应釜厂家,水热反应釜价格,水热反应釜型号,水热反应釜内衬,水热反应釜25ml,水热反应釜50ml,水热反应釜100ml,水热合成反应釜 | 山东亮化工程_亮化公司_亮化资质-山东星汇照明工程有限公司 | 全地形消防摩托车_背负式细水雾_全氟己酮灭火装置「斯库尔消防」 | 液体粉末包装机_颗粒粉剂自动包装机-上海巧慈自动化设备有限公司 | 健力普医疗-半导体激光治疗仪,红外偏振光治疗仪,近红外线治疗仪-独家功能,光疗典范 | 专业护工_医院护工_护工陪护_住家护工- 心陪护| 全自动高速点胶机,锡膏喷印机系列,点胶阀核心配件厂家-博宁 | 上海希喆机械有限公司-Schunk雄克,雄克卡盘, 雄克机械手, B+R贝加莱, ELCIS编码器,艾西斯编码器, TWK编码器,Nexen,Joyce dayton升降机,Thomson汤姆森,TPG减速机,INA导轨。 | 呼吸家官网|肺功能检测仪生产厂家|国产肺功能仪知名品牌|肺功能检测仪|肺功能测试仪|婴幼儿肺功能仪|弥散残气肺功能仪|肺功能测试系统|广州红象医疗科技有限公司|便携式肺功能仪|大肺功能仪|呼吸康复一体机|儿童肺功能仪|肺活量计|医用简易肺功能仪|呼吸康复系统|肺功能仪|弥散肺功能仪(大肺)|便携式肺功能检测仪|肺康复|呼吸肌力测定肺功能仪|肺功能测定仪|呼吸神经肌肉刺激仪|便携式肺功能 | 江西省力速数控机械有限公司丨火花机丨龙门加工中心丨镜面火花机丨卧式加工中心 | 天津市力豹润滑科技有限公司 | 注塑加工,无锡塑料件加工,注塑模具加工厂家-无锡富立康精密模塑有限公司 | 碳化硅微粉_超细碳化硅微粉_潍坊凯华碳化硅微粉有限公司 | 企业微信注册_CRM客户管理系统_SCRM解决方案_私域流量运营_腾讯企点服务_企业QQ-腾辉网络 | 实验升降炉-箱式管式炉- 台车真空炉-熔块旋转炉-推板隧道窑-洛阳鲁威窑炉有限公司 | 自动超声波清洗机_五金超声波清洗机厂家_超声波模具价格_东莞劲荣自动化 |