亚洲熟妇色自偷自拍另类55_手机av妹子在线看片_极品成人无码视频在线_午夜无码精品一区二区三区_国产精品爽爽VA无码视频

首頁  ?  科學  ?  科學探索

無需調控而勝任不同任務 這種AI更接近人類思考方式

2019-12-04 08:47:42

來源: 科技日報

  紐約大學心理學與認知科學教授馬庫斯最近和人工智能企業(yè)“深層思維”(DeepMind)杠上了。繼前不久在推特(Twitter)上質疑美國通用人工智能研究組織OpenAI的解魔方機械手之后,近日他又對“深層思維”新推出的《星際爭霸2》智能體“阿爾法星”(AlphaStar)進化版提出六大質疑。此次,他的質疑點并不是游戲表現(xiàn)本身,而是指向了更高的層面:未來通用智能研究的意義。

  近年最酷成果都來自深度強化學習

  此次OpenAI推出的解魔方機器手,并不是像以往一樣使用專業(yè)算法來解決某一個特定任務(如果換一個任務,還需要重新編程),而是通過某種學習方法,對機器人進行訓練,讓機械手具備類人手的解決問題的能力。但馬庫斯卻認為這個成果描述有誤導,更恰當?shù)拿枋鰬撌恰坝脧娀瘜W習操縱魔方”或者是“用靈巧的機器人手操縱物體的進展”。

  “馬庫斯過于強調‘用強化學習操縱魔方’有點挑剔字眼,其實OpenAI魔方機器手和‘深層思維’發(fā)布的《星際爭霸2》智能體‘阿爾法星’進化版都使用了深度強化學習技術。深度強化學習是目前公認的在現(xiàn)有技術中最有可能實現(xiàn)通用人工智能的技術?!碧旖虼髮W智能與計算學部軟件學院副教授郝建業(yè)解釋說,目前機器學習有三大分支,監(jiān)督學習、非監(jiān)督學習和強化學習,深度學習屬于監(jiān)督學習里目前最主流的一類技術。深度強化學習是深度學習與強化學習的融合,是將深度神經(jīng)網(wǎng)絡整合到強化學習框架當中。

  “近幾年,深度強化學習發(fā)展迅猛,它在處理復雜、多方面和決策問題方面顯示出巨大的潛力。目前深度強化學習技術主要應用在一些游戲、比賽中?!焙陆I(yè)介紹,2016年,谷歌的“阿爾法圍棋”(AlphaGo)擊敗了世界頂級圍棋選手李世石、柯潔,轟動一時,成為人工智能領域的一個里程碑。“阿爾法圍棋”的核心就在于使用了深度強化學習算法,使得計算機能夠通過自對弈的方式不斷提升棋力。此后又有臉書(Facebook)在DOTA2游戲中打敗了頂級職業(yè)選手;CMU團隊研發(fā)的德州撲克AI冷撲大師輕松擊敗頂級玩家。

  此外,“深層思維”還運用深度強化學習優(yōu)化了數(shù)據(jù)中心的耗能;谷歌則利用深度強化學習完成深度神經(jīng)網(wǎng)絡的自動架構搜索,提出了AutoML服務,借此將機器學習作為一種服務推廣到千家萬戶。在我國,對于深度強化學習技術的應用也不少,阿里、騰訊、百度等國內(nèi)團隊將深度強化學習應用到搜索、推薦、營銷、派單和路徑規(guī)劃等實際問題的決策中。

  最有可能實現(xiàn)通用人工智能的技術

  人工智能發(fā)展到現(xiàn)在的高度,技術上較大的功臣應該屬于深度學習算法。深度學習利用多層神經(jīng)網(wǎng)絡,從海量的數(shù)據(jù)中學習,從而實現(xiàn)對未來的預測,并使人工智能系統(tǒng)越來越智能。目前我們應用的安防監(jiān)控、自動駕駛、語音識別、百度地圖等都是深度學習技術在圖像視覺、語音識別、自然語言理解等領域的應用。

  而強化學習也是目前機器學習領域的熱門技術,與基于已知標簽訓練模型的監(jiān)督學習不同,強化學習能夠在沒有計算機的明確指示下,像人一樣實現(xiàn)自主學習。當達到一定的學習量之后,強化學習系統(tǒng)就能夠預測出正確的結果。“強化學習的基本思想是,學習在不同環(huán)境和不同狀態(tài)下,哪種行為能夠使得預期利益最大化?!焙陆I(yè)介紹,新版“阿爾法星”智能體就采用了強化學習的自對戰(zhàn)技術,其學習過程不需要數(shù)據(jù)標注,而是由獎勵函數(shù)進行主導。智能體獲得獎勵得分或贏得一場比賽,它會得到積極的反饋,智能體就會根據(jù)對戰(zhàn)的成績好壞,來調整行為動作。這猶如嬰兒學走路,會根據(jù)產(chǎn)生的結果好壞來調整行為動作。

  目前對通用人工智能的定義主要有兩個特點,一是端對端的學習,二是任務自適應,?無需人類參與調控而勝任不同的任務。深度強化學習可以將深度學習的感知能力和強化學習的決策能力相結合,直接根據(jù)輸入的信息進行控制,是一種更接近人類思維方式的人工智能技術。在與世界的正?;舆^程中,強化學習會通過試錯法利用獎勵來學習,這跟自然學習過程非常相似。比如單手解魔方機器手,它可能需要利用深度學習的識圖技術等看到魔方,而后還需強化學習的模型讓機器手在不斷的試錯過程中自主學習。在強化學習中,可以使用較少的訓練信息,這樣做的優(yōu)勢是信息更充足,而且不受監(jiān)督者技能限制。深度強化學習朝構建對世界擁有更高級理解的自主系統(tǒng)又邁出了一步,這也是為什么說深度強化學習是目前公認的在現(xiàn)有技術中最有可能實現(xiàn)通用人工智能的技術。

  未來通用人工智能還需依托腦科學發(fā)展

  “雖然說深度強化學習技術最有可能實現(xiàn)通用人工智能,但是并不能說就一定能夠實現(xiàn),我們離真正的通用人工智能還是有很大差距的?!焙陆I(yè)表示,深度學習和強化學習結合的時候,對現(xiàn)實情況的枚舉就變成首先需要對現(xiàn)實情況進行模式識別,然后進行有限模式的枚舉,從而減少計算的壓力,但是所需的數(shù)據(jù)將比其他機器學習算法要大得多。如果將場景擴展到多智能體的深度強化學習,那么需要的數(shù)據(jù)和算力是呈指數(shù)級上升的,目前還沒有平臺能夠提供強化學習所需要的海量數(shù)據(jù),無法窮舉現(xiàn)實中可能遇到的種種復雜情況。這種數(shù)據(jù)需求在很多現(xiàn)實領域中都是無法實現(xiàn)的。

  舉例說明,比如強化學習需要大量的試錯,如果把單手解魔方機器手應用到做飯的現(xiàn)實場景,那么它可能會把食材弄一地,也可能把一整袋鹽倒到鍋中,還有可能引起火災。因此通過試錯學習的模式,在現(xiàn)實場景中是無法實現(xiàn)的。

  此外,深度學習和強化學習都是機器學習領域中最難調試成功的,它的成功案例其實不算很多,但是一旦推出,都會引起轟動。并且,這是一個連隨機種子都會大大影響學習效果的模型框架。同樣的模型,訓練10次可能7次是失敗的,3次是成功的。還有一點,深度強化學習極其容易過擬合到智能體當前交互的環(huán)境中,所以環(huán)境稍有改變,之前看起來表現(xiàn)出色的智能體,很可能就會犯低級錯誤。

  “人類認識事物的時候,一般都是通過數(shù)據(jù)進行因果推理和判斷,才得出相應的解決方案。而目前的人工智能系統(tǒng)卻并不能實現(xiàn)這種因果推導?!焙陆I(yè)表示,可能未來通用人工智能的發(fā)展,還需要依托于腦科學的發(fā)展,目前我們對人腦的認知還處于非常初級的階段。大腦對事物的認知過程、解決問題的過程以及思考的能力等機制還都不清楚,因此,目前人工智能的發(fā)展,離這種真正能模擬人類智能思考的通用人工智能還有很長的路要走。

  • 相關閱讀
  • 中國科學家獲得亞洲科學大獎

      記者從微尺度物質科學國家研究中心獲悉,12月6日,日本仁科紀念基金會在東京會館召開仁科芳雄獎項的頒獎典禮和晚宴,基金會理事長、諾貝爾物理學獎得主小林誠宣布,將2019年度“仁科芳雄亞洲獎”授予中國科學...

    時間:12-10
  • 應用場景勤落地 城市管理更智慧

      作為國家首批智慧城市試點,中新天津生態(tài)城加快實施“生態(tài)+智慧”雙輪驅動發(fā)展戰(zhàn)略,著力打造生態(tài)城市升級版和智慧城市創(chuàng)新版。日前,中新天津生態(tài)城華為濱?;赝度脒\營,27個智能產(chǎn)業(yè)項目“牽手”落戶,將...

    時間:12-10
  • “鵲橋”又有新動作 三根天線探秘宇宙黑暗時代

      自順利著陸月球背面以來,嫦娥四號著陸器和玉兔二號月球車的一舉一動都備受關注。事實上,我們能得知它們的動態(tài),多虧“鵲橋”號中繼星架起的通信橋梁。   在提供通信中繼服務的同時,“鵲橋”號中繼星還肩...

    時間:12-10
  • “量子壓縮”升級LIGO 每周都能發(fā)現(xiàn)新引力波

      2015年9月,位于美國的激光干涉重力波觀測儀(LIGO)首次探測到引力波,驗證了愛因斯坦提出的“百年猜想”,人類天文學開啟了“引力波時代”。   日前,來自麻省理工學院、加州理工學院、澳大利亞國立大學...

    時間:12-10
  • 個人信息泄露 APP默認勾選問題最嚴重

      “數(shù)據(jù)顯示,在受訪者遇到的APP個人信息保護問題中,最多的是默認勾選問題,占64.69%?!比涨?,在由南方都市報大數(shù)據(jù)研究院·南都個人信息保護研究中心主辦的“2019啄木鳥數(shù)據(jù)治理論壇”上,南都個人信息保護...

    時間:12-10
  • X射線自由電子激光器可引發(fā)核聚變

      根據(jù)核物理的理論,控制受控核聚變需要高能量。但是,利用X射線的最新自由電子激光器提供的能量和電磁場,可以在較低能量下引發(fā)核聚變,德國德累斯頓—羅森多夫亥姆霍茲中心(HZDR)科學家在《物理評論》雜志...

    時間:12-10
  • “i深圳”區(qū)塊鏈電子證照平臺上線

      深圳市統(tǒng)一政務服務APP“i深圳”區(qū)塊鏈電子證照應用平臺9日正式上線發(fā)布,實現(xiàn)居民身份證等24類常用電子證照上鏈,在個人隱私得到最大程度保護的基礎上,企業(yè)市民攜帶紙質證明辦事的不便將大大減少,辦事有望...

    時間:12-10
  • 打破科技創(chuàng)新體制壁壘

      最近,2019年中國工程院院士增選結果揭曉,共產(chǎn)生了75位院士和29位外籍院士。值得關注的是,本次當選的75位院士中,有兩名院士來自民營企業(yè),王堅院士更是被稱為“民企院士第一人”。   前不久,科技部公布...

    時間:12-10
  • 人工智能發(fā)展之路還很長

      人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅動力量,正在對經(jīng)濟發(fā)展、社會進步、國際政治經(jīng)濟格局等方面產(chǎn)生重大而深遠的影響。我國人工智能發(fā)展起步較晚,要努力在理論、方法、工具、系統(tǒng)等方面取得變革性...

    時間:12-10
  • 電力數(shù)據(jù)動腦 千家萬戶受益

      輸入關鍵詞,電網(wǎng)扶貧、用電情況、上網(wǎng)電量等數(shù)據(jù)一目了然;線路故障、區(qū)域停電可預測預警;實時采集“供能—用能”全過程數(shù)據(jù),為用能企業(yè)建立能耗智慧管理體系,指導企業(yè)能源使用更合理、更經(jīng)濟;為全省30...

    時間:12-10
免責聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網(wǎng)站轉載圖片、文字之類版權申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。