熱門文章
人工智能如何才能學會安全?
發布時間:2018-09-28 分類:交通百科
隨著人工智能的發展,機器很快將具備超越人類的智能和實用能力。機器不僅會比人更有能力,而且還能使自己變得更好。也就是說,這些機器將了解他們自己的設計和如何改進它,或者他們可以創造出全新的甚至更有能力的機器。ai人工智能的人類創造者必須能夠相信這些機器能夠保持安全和有益,即使它們自我完善和適應現實世界。
遞歸自我改進
這種自治代理對自己的代碼進行越來越好的修改的想法稱為遞歸自我改進,通過遞歸的自我改進,機器可以適應新的環境,學會如何處理新的情況。在某種程度上,人腦也能做到這一點。當一個人養成并重復新的習慣時,他們大腦中的聯系就會改變。隨著時間的推移,這種聯系會變得更強、更有效,從而使新的、期望的動作更容易執行(例如改變飲食習慣或學習一門新的語言)。然而,在機器中,這種自我改進的能力要強烈得多。
人工智能系統代理處理信息的速度比人類快得多,如果它不能正確理解自己的行為如何影響人們,那么它的自我修改可能很快就會與人類的價值觀脫節,解決這個問題是實現安全和有益人工智能的關鍵一步。
在復雜世界中構建人工智能
由于世界是如此復雜,許多研究人員開始人工智能項目,通過在精心控制的環境中的開發人工智能。然后,他們創造數學證明,可以保證他們的人工智能在這個特定的空間將取得成功。
但這種方法讓設計師承擔了太多的責任,而且過于相信證明,尤其是在處理那些可以通過遞歸自我改進學習的機器時。我們無法準確地描述環境的所有復雜性,我們也無法預見代理將在未來發現自己的環境;一個代理將沒有足夠的資源(能量、時間、投入)來做最優的事情。
如果機器遇到了不可預見的情況,那么設計者在受控環境中所依賴的證據可能就不適用了,這樣就不能保證人工智能的安全行為了。
基于經驗的人工智能
取而代之的是使用了一種基于經驗的人工智能的方法?;诮涷灥娜斯ぶ悄苁且环N自我完善的系統,它可以進行試探性的、可加性的、可逆的、非常細粒度的修改,而不需要事先進行自我推理;相反,自我修改會隨著時間的推移根據經驗證據進行測試,并在證明正確時緩慢地逐步實施,或者在被偽造時被駁回。
研究人員可以通過在復雜的、不可預見的環境中對機器進行教學和測試,挑戰其功能和目標,從而確保人工智能能夠發展出安全的行為,而不是只相信數學證明。
有了基于經驗的人工智能,人工智能機器將從交互經驗中學習,因此監控它們的生長周期是至關重要的。研究人員可以通過類似的、漸進的基于經驗的學習過程來確保人工智能的安全。人工智能僅僅是從一小部分特定于設計師的代碼一顆種子開始構建的,就像孩子一樣,這臺機器剛開始的時候,它的能力和智力都會下降,但隨著時間的推移,它會自我完善,因為它會從老師和現實世界的經驗中學習。
基于經驗的人工智能的未來
基于經驗的人工智能不需要在計算機上制作一個證明支持的最優學習算法的智力工作,而是需要與機器進行大量的面對面工作,以便像孩子一樣教它。創造安全的人工智能可能更多地被證明是一個教學和成長的過程,而不是創造完美的數學證明的功能。雖然這樣的責任轉移可能更費時,但它也可能有助于在人工智能被發布到現實世界之前建立對它的更全面的理解。以超越代理實現級別,開發教學和測試方法,使我們能夠提高代理對道德價值觀的理解,并確保代理被迫保護和遵守這些價值觀,這一過程令人望而生畏,但它不像人工智能安全出錯的后果那樣令人望而生畏。