熱門文章
監督人工智能的成長
發布時間:2018-09-27 分類:交通百科
當蘋果在2011年發布其軟件應用Siri時,iPhone用戶對他們的智能個人助理抱有很高的期望。然而,盡管Siri的性能令人印象深刻且不斷增長,但它經常犯錯誤。該軟件的不完善突出了當前人工智能的明顯局限性:當今的機器智能無法理解人類生活中變化多樣的需求和偏好。
然而,隨著人工智能系統的發展,專家們相信智能機器最終并且很快將比人類更好地了解這個世界。雖然很容易理解Siri是如何以及為什么會犯錯的,但要弄清楚為什么一個超級人工智能做出了這樣的決定,將是一項更大的挑戰。
如果人類不能理解和評估這些機器,他們將如何控制它們?
保羅·克里斯蒂是加州大學伯克利分校計算機科學專業的博士生,他一直致力于解決這個問題。他相信,為了確保ai人工智能的安全和有益,研究人員和操作人員必須學會衡量智能機器在多大程度上做著人類想要做的事情,即使這些機器超越了人類智能。
半監督學習
監督人工智能系統發展的最明顯,最恰當并且最艱難的方法,正如克里斯蒂亞諾解釋的那樣:“人類交流自己想要的東西的一種方式,就是花大量時間深入研究(人工智能)做出的一些小決定,并嘗試評估這個決定有多好?!?
但是,盡管這在理論上是可能的,但人類研究人員永遠沒有時間或資源來評估人工智能做出的每一個決定?!叭绻阆胱鲆粋€好的評估,你可以花幾個小時分析機器在一秒內做出的決定,”克里斯蒂亞諾說。
對研究者來說,幸運的是,他們不需要評估人工智能做出的每一個決定,就能對它的行為充滿信心。相反,研究人員可以選擇機器上最有趣和信息最豐富的決定,在這些決定中獲得反饋將最大限度地減少我們的不確定性。
主動學習過程是人類訓練人工智能的有效方法,但是當人類需要評估超出人類智力的人工智能時會發生什么呢?
試想一臺掌握國際象棋的電腦,如果一個人還沒有掌握國際象棋,他怎么能給計算機適當的反饋呢?人可能會批評計算機的一個舉動,但后來才意識到機器是正確的。隨著智能手機和電腦的日益普及,類似的問題肯定會出現。最終,我們需要處理人工智能系統在幾乎所有方面都超越人類性能的情況。
使用認可機構評估更智能的人工智能S
當用戶撥打電話時,用戶對這一決定的反應對于確定該電話是否會在未來的電話通話中斷用戶至關重要。但是,如果一臺更先進的機器比人類用戶更能理解中斷的后果,那么問人類‘手機是否應該立即打斷你’可能是個壞主意。人可能會對中斷表示惱怒,但機器可能會更清楚地認識到,為了使用戶的生活平穩地運行,這種煩惱是必要的。
在這種情況下,建議人類評價者使用其他智能機器來完成評估人工智能決策的繁重工作。實際上,能力較弱的系統1負責評估能力較強的系統2盡管系統2更聰明,但系統1可以快速處理大量信息,并且可以理解系統2應該如何修改其行為。人力培訓員仍將提供投入并監督這一過程,但他們的作用將是有限的。
這一培訓過程將幫助谷歌了解如何創建一個更安全和更智能的人工智能系統3,然后人類研究人員可以使用系統2進行培訓。這些智能機器就像為人類執行任務的小代理一樣,Siri已經有了這種有限的能力來接受人類的輸入并弄清楚人類想要什么,但隨著人工智能技術的進步,機器將學會執行人類無法完全理解的復雜任務。
我們能確保人工智能擁有人類的價值嗎?
隨著谷歌和其他科技公司在每次評估中不斷改進智能機器,人力培訓師將發揮更小的作用。理想情況下,每次你建立一個更強大的機器,它有效地模擬了人類的價值,并做了人類想要的,但當這些機器超越人類智慧時,它們可能會偏離人類的價值觀。用人類的話來說:一個復雜的智能機器就像一個龐大的人類組織。如果組織所做的任務太復雜,任何人都無法理解,那么它就可能追求人類不喜歡的目標。
為了解決這些控制問題,克里斯蒂亞諾正致力于“對這種機器學習過程的端到端描述,充實似乎最相關的關鍵技術問題”。他的研究將有助于加深對人類如何使用人工智能系統來評估更先進的人工智能系統行為的理解。如果他的研究成功,這將是在建立可信賴的人工智能方面邁出的重要一步。