完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:225個(gè) 瀏覽:11844次 帖子:1個(gè)
DeepMind開源了一個(gè)內(nèi)部強(qiáng)化學(xué)習(xí)庫(kù)TRFL
TRFL庫(kù)包含實(shí)現(xiàn)經(jīng)典RL算法以及更前沿技術(shù)的許多函數(shù)。這里提供的損失函數(shù)和其他操作是在純TensorFlow中實(shí)現(xiàn)的。它們不是完整的算法,而是在構(gòu)建功...
2018-10-19 標(biāo)簽:智能體強(qiáng)化學(xué)習(xí)DeepMind 5.4k 0
基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛預(yù)測(cè)控制技術(shù)
隨著外部傳感、運(yùn)動(dòng)規(guī)劃和車輛控制等方面取得顯著的成果,自動(dòng)駕駛汽車的自主創(chuàng)新能夠很好地幫助車輛在預(yù)先設(shè)定的場(chǎng)景下獨(dú)立運(yùn)行。
2018-10-08 標(biāo)簽:自動(dòng)駕駛強(qiáng)化學(xué)習(xí) 6.9k 0
南大AI用分層強(qiáng)化學(xué)習(xí),一天時(shí)間單機(jī)訓(xùn)練擊敗《星際爭(zhēng)霸2》內(nèi)置AI
并且在以往的研究中,重點(diǎn)往往放在對(duì)游戲局部信息的處理上,主要分為微操和宏操。例如在游戲開局前,預(yù)先設(shè)定好雙方兵力的數(shù)量,只需對(duì)這些兵力進(jìn)行把控,便可取得...
2018-09-28 標(biāo)簽:AI強(qiáng)化學(xué)習(xí) 1.0萬(wàn) 0
在AI技術(shù)的幫助下,讓滑翔機(jī)學(xué)會(huì)這項(xiàng)非凡的本事
在我們可以真正使用AI控制的熱氣流滑翔機(jī)進(jìn)行實(shí)際應(yīng)用之前,還有很多工作要做。這只是鳥類輔助自身飛行的氣流中的一種。換句話說(shuō):僅僅因?yàn)锳I可以駕馭熱氣流,...
2018-10-04 標(biāo)簽:AI機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 2.6k 0
一種能和OpenAI gym相比的環(huán)境,用來(lái)訓(xùn)練Unity模擬器中的Donkey Car
Donkey Car是一種為模型車開源的DIY自動(dòng)駕駛平臺(tái),它利用一個(gè)帶有相機(jī)的樹莓派單片機(jī),讓模型車可在賽道上自動(dòng)駕駛,Donkey Car會(huì)學(xué)習(xí)你的...
2018-09-16 標(biāo)簽:計(jì)算機(jī)視覺(jué)自動(dòng)駕駛強(qiáng)化學(xué)習(xí) 7.8k 0
用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí)
按照以往的做法,如果研究人員要用強(qiáng)化學(xué)習(xí)算法對(duì)獎(jiǎng)勵(lì)進(jìn)行剪枝,以此克服獎(jiǎng)勵(lì)范圍各不相同的問(wèn)題,他們首先會(huì)把大的獎(jiǎng)勵(lì)設(shè)為+1,小的獎(jiǎng)勵(lì)為-1,然后對(duì)預(yù)期獎(jiǎng)勵(lì)...
2018-09-16 標(biāo)簽:人工智能智能體強(qiáng)化學(xué)習(xí) 6.2k 0
AutoML模型壓縮技術(shù),利用強(qiáng)化學(xué)習(xí)將壓縮流程自動(dòng)化
“Cloud AutoML 產(chǎn)品設(shè)計(jì)讓機(jī)器學(xué)習(xí)的過(guò)程變得更簡(jiǎn)單,讓即便沒(méi)有機(jī)器學(xué)習(xí)經(jīng)驗(yàn)的人也可以享受機(jī)器學(xué)習(xí)帶來(lái)的益處。盡管AutoML有很大的進(jìn)步,這...
2018-09-24 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 5.7k 0
基于目標(biāo)圖像的視覺(jué)強(qiáng)化學(xué)習(xí)算法,讓機(jī)器人可以同時(shí)學(xué)習(xí)多個(gè)任務(wù)
強(qiáng)化學(xué)習(xí)是一種訓(xùn)練主體最大化獎(jiǎng)勵(lì)的學(xué)習(xí)機(jī)制,對(duì)于目標(biāo)條件下的強(qiáng)化學(xué)習(xí)來(lái)說(shuō)可以將獎(jiǎng)勵(lì)函數(shù)設(shè)為當(dāng)前狀態(tài)與目標(biāo)狀態(tài)之間距離的反比函數(shù),那么最大化獎(jiǎng)勵(lì)就對(duì)應(yīng)著最...
2018-09-24 標(biāo)簽:機(jī)器人算法強(qiáng)化學(xué)習(xí) 7.5k 0
在強(qiáng)化學(xué)習(xí)的表示空間中引入規(guī)劃能力的思路
在涉及計(jì)算路徑的每一個(gè)步驟(不管是在r-空間還是在s-空間),我們都可以使用范圍廣泛的技術(shù),包括基于優(yōu)化的技術(shù)(TrajOpt),基于搜索的技術(shù)(RRT...
2018-09-06 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯強(qiáng)化學(xué)習(xí) 2.9k 0
深度強(qiáng)化學(xué)習(xí)將如何控制機(jī)械臂的靈活動(dòng)作
直接的強(qiáng)化學(xué)習(xí)方法很有吸引力,它無(wú)需過(guò)多假設(shè),而且能自動(dòng)掌握很多技能。由于這種方法除了建立函數(shù)無(wú)需其他信息,所以很容易在改進(jìn)后的環(huán)境中重新學(xué)習(xí)技能,例如...
2018-09-05 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)機(jī)械臂強(qiáng)化學(xué)習(xí) 1.1萬(wàn) 0
基于TensorFlow的開源強(qiáng)化學(xué)習(xí)框架 Dopamine
對(duì)于新的研究人員來(lái)說(shuō),能夠根據(jù)既定方法快速對(duì)其想法進(jìn)行基準(zhǔn)測(cè)試非常重要。因此,我們?yōu)?Arcade 學(xué)習(xí)環(huán)境支持的 60 個(gè)游戲提供四個(gè)智能體的完整培訓(xùn)...
2018-08-31 標(biāo)簽:智能體強(qiáng)化學(xué)習(xí)TensorFlow 5.3k 0
盤點(diǎn)新一代人工智能領(lǐng)域十大最具成長(zhǎng)性技術(shù)
近日,中國(guó)電子學(xué)會(huì)依據(jù)國(guó)家出臺(tái)的《新一代人工智能發(fā)展規(guī)劃》、《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020年)》等一系列政策規(guī)劃。
2018-08-29 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能強(qiáng)化學(xué)習(xí) 3.9k 0
使用新的機(jī)器學(xué)習(xí)技術(shù), 通過(guò)減少治療膠質(zhì)母細(xì)胞瘤過(guò)程中毒性化療和放療的劑量
然而,研究人員還必須確保該模型不僅僅為了最大療效而給出最大的劑量。任何時(shí)候模型選擇給予全部劑量時(shí),它就會(huì)受到懲罰,因此它會(huì)選擇更少、更小的劑量。 “如果...
2018-08-24 標(biāo)簽:模型機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 2.9k 0
強(qiáng)化學(xué)習(xí)和監(jiān)督式學(xué)習(xí), 非監(jiān)督式學(xué)習(xí)的區(qū)別
而這時(shí),強(qiáng)化學(xué)習(xí)會(huì)在沒(méi)有任何標(biāo)簽的情況下,通過(guò)先嘗試做出一些行為得到一個(gè)結(jié)果,通過(guò)這個(gè)結(jié)果是對(duì)還是錯(cuò)的反饋,調(diào)整之前的行為,就這樣不斷的調(diào)整,算法能夠?qū)W...
2018-08-21 標(biāo)簽:機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 2.2萬(wàn) 0
強(qiáng)化學(xué)習(xí)“好奇心”模型:訓(xùn)練無(wú)需外部獎(jiǎng)勵(lì),全靠自己
我們的思路是,將內(nèi)在獎(jiǎng)勵(lì)表示為預(yù)測(cè)agent在當(dāng)前狀態(tài)下的行為后果時(shí)出現(xiàn)的錯(cuò)誤,即agent學(xué)習(xí)的前向動(dòng)態(tài)的預(yù)測(cè)誤差。我們徹底調(diào)查了54種環(huán)境中基于動(dòng)力...
2018-08-20 標(biāo)簽:agent強(qiáng)化學(xué)習(xí) 1.3萬(wàn) 0
分類問(wèn)題訓(xùn)練的GAP-CNN在目標(biāo)定位方面的能力
在最早提出GAP層的網(wǎng)中網(wǎng)(Network in Network)架構(gòu)中,最后的最大池化層的輸出傳入GAP層,GAP層生成一個(gè)向量,向量的每一項(xiàng)表示分類...
2018-08-20 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)圖像分類強(qiáng)化學(xué)習(xí) 7.8k 0
2018-08-18 標(biāo)簽:智能體強(qiáng)化學(xué)習(xí) 4.1k 0
虛擬到現(xiàn)實(shí)的翻譯網(wǎng)絡(luò)如何滿足自動(dòng)駕駛要求?
虛擬到現(xiàn)實(shí)的翻譯網(wǎng)絡(luò),可以將虛擬駕駛模擬器中生成的虛擬場(chǎng)景翻譯成真實(shí)場(chǎng)景,來(lái)進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練。
2018-08-16 標(biāo)簽:自動(dòng)駕駛強(qiáng)化學(xué)習(xí) 5.4k 0
總結(jié)可微圖像參數(shù)表示的最新進(jìn)展
可微圖像參數(shù)表示邀請(qǐng)我們提出了這樣一個(gè)問(wèn)題:“反向傳播通過(guò)的是什么樣的圖像生成過(guò)程?”答案是相當(dāng)多樣的過(guò)程,其中一些奇異的可能性,可以創(chuàng)造多種多樣的有趣...
2018-08-16 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)圖像強(qiáng)化學(xué)習(xí) 4.3k 0
一種利用強(qiáng)化學(xué)習(xí)來(lái)設(shè)計(jì)mobile CNN模型的自動(dòng)神經(jīng)結(jié)構(gòu)搜索方法
具體來(lái)說(shuō),我們提出一種用于設(shè)計(jì)移動(dòng)端的CNN模型的自動(dòng)神經(jīng)結(jié)構(gòu)搜索方法,稱之為Platform-Aware神經(jīng)結(jié)構(gòu)搜索。圖1是Platform-Awar...
2018-08-07 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)集強(qiáng)化學(xué)習(xí) 4.4k 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |