完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標簽 > 強化學(xué)習(xí)
文章:225個 瀏覽:11845次 帖子:1個
最基礎(chǔ)的 Seq2Seq模型 包含了三個部分, Encoder、Decoder 以及連接兩者的中間狀態(tài)向量 C,Encoder通過學(xué)習(xí)輸入,將其編碼成一...
2020-08-28 標簽:模型文本強化學(xué)習(xí) 6.9k 0
本節(jié)概述機器學(xué)習(xí)及其三個分類(監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強化學(xué)習(xí))。首先,與機器學(xué)習(xí)相關(guān)的術(shù)語有人工智能(Artificial Intelligence,A...
2020-08-14 標簽:人工智能機器學(xué)習(xí)強化學(xué)習(xí) 2.5萬 0
基于PPO強化學(xué)習(xí)算法的AI應(yīng)用案例
Viet Nguyen就是其中一個。這位來自德國的程序員表示自己只玩到了第9個關(guān)卡。因此,他決定利用強化學(xué)習(xí)AI算法來幫他完成未通關(guān)的遺憾。
2020-07-29 標簽:算法AI強化學(xué)習(xí) 3.3k 0
復(fù)雜應(yīng)用中運用人工智能核心 強化學(xué)習(xí)
近期,有不少報道強化學(xué)習(xí)算法在 GO、Dota 2 和 Starcraft 2 等一系列游戲中打敗了專業(yè)玩家的新聞。強化學(xué)習(xí)是一種機器學(xué)習(xí)類型,能夠在電...
2020-07-27 標簽:人工智能機器學(xué)習(xí)強化學(xué)習(xí) 1.1k 0
毫不夸張地說,2019年人工智能的現(xiàn)狀就是強化學(xué)習(xí)回歸的一年。簡單介紹一下強化學(xué)習(xí),它是機器學(xué)習(xí)中的一個領(lǐng)域,強調(diào)如何基于環(huán)境而行動,以取得最大化的預(yù)期...
2020-07-11 標簽:人工智能強化學(xué)習(xí) 5.6k 0
下圖來自莫煩Python的視頻,其中對比了兩種神經(jīng)進化的策略,一種是不固定網(wǎng)絡(luò)的結(jié)構(gòu),通過神經(jīng)網(wǎng)絡(luò)間的交叉配對形成下一代的網(wǎng)絡(luò),另一組是固定結(jié)構(gòu),每一代...
2020-04-17 標簽:神經(jīng)網(wǎng)絡(luò)梯度強化學(xué)習(xí) 2.7k 0
強化學(xué)習(xí)(RL)是現(xiàn)代人工智能領(lǐng)域中最熱門的研究主題之一,其普及度還在不斷增長。 讓我們看一下開始學(xué)習(xí)RL需要了解的5件事。
2020-05-04 標簽:人工智能強化學(xué)習(xí) 4.1k 0
借助機器學(xué)習(xí)、大數(shù)據(jù)尋找新冠肺炎最佳療法
在COVID-19出現(xiàn)之前,Angus和廣泛的國際合作者已經(jīng)開發(fā)了一個平臺,稱為REMAP-Community Acquired Pneumonia (...
2020-04-15 標簽:人工智能強化學(xué)習(xí) 1.9k 0
神經(jīng)網(wǎng)絡(luò)修剪技術(shù)可以將經(jīng)過訓(xùn)練的網(wǎng)絡(luò)的參數(shù)數(shù)量減少90%以上,減少存儲需求并提高推理的計算性能,而不會影響準確性。但是,當代的經(jīng)驗是,修剪產(chǎn)生的稀疏架構(gòu)...
2020-04-09 標簽:神經(jīng)網(wǎng)絡(luò)AI強化學(xué)習(xí) 2k 0
Facebook應(yīng)用人工智能研究負責(zé)人Srinivas Narayanan(如圖)今天上午在圣何塞會議上說,這是大規(guī)模擴展人工智能工作量的一部分,鑒于訓(xùn)...
2020-03-28 標簽:Facebook人工智能強化學(xué)習(xí) 2.5k 0
如何切實地設(shè)計實現(xiàn)現(xiàn)實世界中的強化學(xué)習(xí)
對于騎自行車的人來說,這十分不便,并且要花費數(shù)百萬美元來管理運營,也不劃算。不久前,筆者在紐約大學(xué)的團隊任務(wù)是提供人工智能解決方案,將人工干預(yù)降到最小,...
2020-02-06 標簽:人工智能強化學(xué)習(xí) 2.4k 0
一種旨在幫助患者和臨床醫(yī)生更輕松裝配假肢的全新技術(shù)
利用虛擬現(xiàn)實和強化學(xué)習(xí),美國北卡羅來納州和亞利桑那州的研究人員正在演示一種旨在幫助患者和臨床醫(yī)生更輕松裝配假肢的全新技術(shù)
2019-09-20 標簽:算法vr強化學(xué)習(xí) 2.6k 0
微軟亞洲研究院開發(fā)的麻將AI系統(tǒng)Suphx成為首個在國際知名專業(yè)麻將平臺“天鳳”
2019-09-13 標簽:微軟AI強化學(xué)習(xí) 4.1k 0
包括DeepMind在內(nèi)的世界頂尖AI團隊也在攻堅《星際爭霸II》。其背后擁有一個共同的終極目標——進一步拓展AI邊界,并為最終達到通用人工智能(AGI...
2019-09-13 標簽:AI強化學(xué)習(xí)DeepMind 3.4k 0
博士生David Abel詳細整理了一份87頁的ICML大會筆記
很多博士生可能覺得論文眼花繚亂看都不看不過來,更不要說整理出一份詳細的筆記。而對很多還沒有機會參加 ICML 這樣頂級大會的人來說,顯然,David A...
2019-07-18 標簽:計算機科學(xué)機器學(xué)習(xí)強化學(xué)習(xí) 3.5k 0
樹枝也能制造機器人?日本創(chuàng)新機器人自主學(xué)會走路
近日,日本研究人員公開了一種使用樹枝制造而成的機器人,可以通過強化學(xué)習(xí),學(xué)會自主移動。
2019-07-09 標簽:機器人強化學(xué)習(xí) 3k 0
谷歌AI發(fā)布足球游戲強化學(xué)習(xí)訓(xùn)練環(huán)境“足球引擎”
該強化學(xué)習(xí)環(huán)境的核心是一種先進的足球游戲模擬,稱為“足球引擎”,它基于一個足球游戲版本經(jīng)大量修改而成。根據(jù)兩支對方球隊的輸入動作,模擬了足球比賽中的常見...
2019-06-15 標簽:谷歌AI強化學(xué)習(xí) 4.7k 0
人工智能知識樹 v1.0是整理了從零到一的學(xué)習(xí)內(nèi)容
這份人工智能知識樹 v1.0 是整理了從零到一的學(xué)習(xí)內(nèi)容,主要包括統(tǒng)計機器學(xué)習(xí)、深度學(xué)習(xí)、時間序列、機器視覺、圖嵌入/圖的表示學(xué)習(xí)、自然語言處理、強化學(xué)...
2019-06-07 標簽:人工智能強化學(xué)習(xí)自然語言處理 6.4k 0
如何將強化學(xué)習(xí)用于火箭發(fā)動機引擎研發(fā)的創(chuàng)新解決方案中
機器學(xué)習(xí)(ML)在各個行業(yè)以及眾多的應(yīng)用軟件中產(chǎn)生了令人難以置信的影響,其中包括個性化電視推薦和順風(fēng)車應(yīng)用中的動態(tài)價格模型等。
2019-04-29 標簽:火箭發(fā)動機強化學(xué)習(xí) 2.9k 0
不可否認,深度學(xué)習(xí)的熱度已經(jīng)大大下降,贊美深度學(xué)習(xí)作為AI終極算法的推文少得多了,而且論文正在變得不那么“革命”,現(xiàn)在大家換了個詞,叫:進化。
2019-04-29 標簽:人工智能自動駕駛強化學(xué)習(xí) 3.6k 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
| 電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
| 伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |