日韩一区二区三区精品,欧美疯狂xxxxbbbb牲交,热99re久久免费视精品频,人妻互换 综合,欧美激情肉欲高潮视频

歷史上的今天

今天是:2025年01月10日(星期五)

正在發(fā)生

2020年01月10日 | 解決機(jī)器人控制問題 能很好的處理離散和連續(xù)動作空間

發(fā)布者:幸福的家園 來源: 中國機(jī)器人網(wǎng)作者: Lemontree 手機(jī)看文章 掃描二維碼
隨時隨地手機(jī)看文章

機(jī)器人技術(shù)的基本問題既涉及離散變量(比如控制模式或齒輪切換的選擇),又涉及連續(xù)變量(比如速度設(shè)定點和控制增益)。通常來說,由于算法或控制策略并不總是適合的,因此這些問題很難解決。這就是為什么谷歌母公司Alphabet的Deepnd的研究人員最近提出了一種技術(shù):連續(xù)-離散混合學(xué)習(xí),即可以同時優(yōu)化離散和連續(xù)動作,以其本來的形式處理混合問題。

在預(yù)印本服務(wù)器Arxiv.org上發(fā)表的一篇論文詳細(xì)介紹了他們的工作,這篇論文也在去年10月日本大阪的第三屆機(jī)器人學(xué)習(xí)會議上被人接受。寫道:“許多先進(jìn)的方法都進(jìn)行了優(yōu)化,它們能很好處理離散的或是連續(xù)的動作空間,但是卻很少有方法能同時處理。能夠使用同一算法強(qiáng)大地處理離散和連續(xù)動作空間,使我們能夠針對任何給定問題都能選擇最自然的解決方案策略,而不是讓算法上的便利性來決定做出哪種選擇?!?p style="text-indent: 2em;"> 團(tuán)隊研發(fā)的無模型算法,是指利用強(qiáng)化學(xué)習(xí)或者獎勵實現(xiàn)目標(biāo)的自主代理人的培訓(xùn)技術(shù),通過連續(xù)和離散動作空間來解決控制問題,并通過受控和自主切換來解決混合最優(yōu)控制問題。此外,這種算法通過使用“元動作”或其他類似方案來擴(kuò)大動作空間(分別定義了代理人可能感知和采取的狀態(tài)和動作的范圍),從而為解決現(xiàn)有的機(jī)器人問題提供了新穎的解決方案,并使策略可以解決類似人工智能訓(xùn)練期間的機(jī)械磨損等挑戰(zhàn) 。

研究人員在一系列模擬和現(xiàn)實基準(zhǔn)中驗證了他們的方法,包括Rethink Robocs公司的Sawyer機(jī)器人手臂。據(jù)稱,基于給定的到達(dá)、抓取和拿起魔方的任務(wù),其中獎勵是三個子任務(wù)的總和,因此他們的算法要優(yōu)于無法解決任務(wù)的現(xiàn)有方法。

那是因為到達(dá)魔方需要代理人打開手臂的抓具,而抓取方塊需要關(guān)閉抓具。作者寫道:“一開始,基線將大部分概率集中在較小的動作值上,因此很難移動抓具的手指來看到任何獎勵,從而解釋了學(xué)習(xí)曲線上的平穩(wěn)期。另一方面,這個算法能始終以全速操作抓具,因此改進(jìn)了探查性,使機(jī)器人可以完全完成任務(wù)?!?p style="text-indent: 2em;"> 在一個單獨的實驗中,團(tuán)隊將其算法設(shè)置為參數(shù)化動作空間馬爾可夫決策過程(PAMDP)或一個分層問題,其中,代理人首先選擇離散動作,然后為該動作選擇一組連續(xù)的參數(shù)集。在這種情況下,代理人的任務(wù)是操縱機(jī)器人手臂,以便將釘子插入孔中,然后根據(jù)孔的位置和運動學(xué)來計算獎勵。

研究人員表示,他們的方法比精細(xì)方法和粗略方法獲得了更大的回報,并且這種算法將來可以作為基礎(chǔ)應(yīng)用到更多的混合強(qiáng)化學(xué)習(xí)中。論文中寫道:“對于專業(yè)設(shè)計師而言,事先選擇合適的模式可能很困難。而我們的方法是很有用的,因為它只需要一個實驗,而別的方法都需要通過消融來進(jìn)行驗證?!?

引用地址:解決機(jī)器人控制問題 能很好的處理離散和連續(xù)動作空間

上一篇:優(yōu)必選大型仿人服務(wù)機(jī)器人離家庭已更近了一步
下一篇:美企推出比薩餅機(jī)器人 可以最大程度節(jié)省人力

推薦閱讀

集微網(wǎng)消息,聯(lián)發(fā)科技今日宣布推出支持高動態(tài)范圍成像(HDR)的4K超高清(UHD)電視芯片MT5598,其采用業(yè)界尖端規(guī)格,可支持最新以及未來的超高畫質(zhì)電視與電影內(nèi)容。?MT5598內(nèi)建聯(lián)發(fā)科技人工智能技術(shù),將語音控制與觀眾、環(huán)境及內(nèi)容感知等新功能帶到未來的智能電視之上。采用MT5598的智能電視將可判斷觀看電視者的身份及其觀看的內(nèi)容,在影像質(zhì)量及電視頻...
據(jù)外媒報道,全球領(lǐng)先的自動駕駛送貨車公司Udelv將在2019年CES展上推出其最新自動駕駛送貨車(ADV)車型。該車將采用最先進(jìn)技術(shù),并且該公司還與沃爾瑪(Walmart)、百度(Baidu)、日本丸紅商事株事會社(MarubeniCorporation)等建立了戰(zhàn)略合作伙伴關(guān)系。百度在2019CES展推出了其阿波羅開源自動駕駛平臺3.5版本,Udelv最新的牛頓(Newton?)車型就是搭...
“2020年是泛在電力物聯(lián)網(wǎng)建設(shè)的攻堅年,要繼續(xù)以新能源消納、電網(wǎng)質(zhì)效提升、多元要素互聯(lián)共享、互聯(lián)網(wǎng)運營為主線,持續(xù)加大電網(wǎng)關(guān)鍵環(huán)節(jié)裝置、電網(wǎng)穩(wěn)定技術(shù)、5G、區(qū)塊鏈、人工智能等兩網(wǎng)融合核心技術(shù)攻關(guān),為提升公司互動感知、數(shù)據(jù)價值融合、綜合能源服務(wù)和新業(yè)態(tài)拓展能力提供技術(shù)支撐。”1月7日,在國網(wǎng)能源互聯(lián)網(wǎng)技術(shù)研究院行動計劃研討會上,中國電...
從無到有,由淺入深,我國載人深潛事業(yè)不斷實現(xiàn)新跨越。2020 年 11 月 10 日,由我國自主研制的“奮斗者”號載人潛水器,成功坐底全球海洋最深處——西太平洋馬里亞納海溝中的“挑戰(zhàn)者深淵”,深度達(dá) 10909 米,創(chuàng)下中國載人深潛新的深度紀(jì)錄。隨后,“奮斗者”號獲得中國船級社頒發(fā)的萬米潛水器入級證書,這標(biāo)志著我國第一臺擁有自主知識產(chǎn)權(quán)的全...

史海拾趣

問答坊 | AI 解惑

英菲尼迪M35行駛動力充沛

行駛——動力充沛,車身沉穩(wěn)巡航系統(tǒng)成亮點    由于環(huán)境的限制,我只是在普通公路上對M35進(jìn)行了短距離的體驗。留下印象最深的就要算是VQ發(fā)動機(jī)的動力和扎實沉穩(wěn)的整車感受。帶有CVTCS連續(xù)可變氣門正時控制系統(tǒng)的3.5L VQ35DE鍍鉬發(fā)動機(jī)在6200rpm ...…

查看全部問答∨

DfuSeDemo是什么程序?

新手問:它屬于哪里的?是MDK的?還是J-LINk里的?…

查看全部問答∨

用keil仿真是有些程序段編譯執(zhí)行!

寫了一段程序,編譯沒有錯,但是在用keil進(jìn)行仿真時,有的程序段直接跳過不執(zhí)行了,百思不得其解! #include<reg52.h>#define uchar unsigned char#define uint unsigned intsbit d_q=P1^1;sbit d_h=P1^0;sbit d_z=P1^3;sbit d_y=P1^2;sbit fe ...…

查看全部問答∨

新春快樂,萬事如意

新春快樂,萬事如意…

查看全部問答∨

君正CPU的問題

誰做過君正的處理器啊 請教下如何用USB燒錄程序…

查看全部問答∨

請問單片機(jī)的多任務(wù)實現(xiàn)和Linux操作系統(tǒng)多任務(wù)的實現(xiàn)有什么區(qū)別?

單片機(jī)也可以實現(xiàn)多任務(wù),那么和操作系統(tǒng)實現(xiàn)的方法有什么區(qū)別那? …

查看全部問答∨

請高手回答:VC6的一個界面程序移植到EVC4.0+SP4中報錯!

Compiling resources... Compiling... StdAfx.cpp C:\\Program Files\\Windows CE Tools\\wce400\\STANDARDSDK\\mfc\\include\\afxdisp.h(72) : fatal error C1189: #error :  \"Can\'t build MFC OLE projects using static MFC libr ...…

查看全部問答∨

天然氣報警之上位機(jī)的建立

       天然氣報警之上位機(jī)的建立        這兩天才匆匆忙忙把上位機(jī)調(diào)試完,有很多不完善的地方,界面也比較難看,等有時間的時候好好整理下。這個界面是用VB建立的,模仿的是eZ430- ...…

查看全部問答∨

[hanker]UCOS移植

把UCOS的移植在M4上,可以直接用M3的版本。M4比起M3多了浮點,如果要加入浮點運算,就得在M3版本的UCOS上改寫。 由于任務(wù)就是點燈,就不放視頻圖片了。 在附件中,Jensway的教程已經(jīng)寫得非常詳細(xì)了,我就不多廢話了。    …

查看全部問答∨

F28035工程設(shè)置

想做一個模板工程,將所有的外設(shè)驅(qū)動支持函數(shù)放到工程下面的一個文件夾中(雖然可能有些不會用到),這樣會不會大量浪費芯片資源啊?…

查看全部問答∨
小廣播
最新機(jī)器人文章

 
EEWorld訂閱號

 
EEWorld服務(wù)號

 
汽車開發(fā)圈

 
機(jī)器人開發(fā)圈

About Us 關(guān)于我們 客戶服務(wù) 聯(lián)系方式 器件索引 網(wǎng)站地圖 最新更新 手機(jī)版

站點相關(guān):

詞云: 1 2 3 4 5 6 7 8 9 10

北京市海淀區(qū)中關(guān)村大街18號B座15層1530室 電話:(010)82350740 郵編:100190

電子工程世界版權(quán)所有 京ICP證060456號 京ICP備10001474號-1 電信業(yè)務(wù)審批[2006]字第258號函 京公網(wǎng)安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved