熱門文章
微軟沈向洋:技術也有偏見,如何打造負責任的人工智能
發布時間:2019-09-03 分類:趨勢研究 來源:澎湃新聞
微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋
“大部分人都高估了自己在一年里能做到的事情,同時卻低估了自己能在10年里取得的成就?!痹?019世界人工智能大會,AI FOR ALL“二十一世紀的計算”學術研討會上,微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋用這句話表明微軟在人工智能領域里的投入和專注。
在當天的演講中,沈向洋介紹了在過去的一年時間里,全球各地的微軟研究院取得的成就。例如,微軟開發出了第一個能將數據編碼存儲到DNA中的方法,能夠將一座倉庫那么大的數據中心,壓縮到只有幾個骰子大??;微軟的Project Natick項目,在大洋深處的海底,建成了一座數據中心;微軟還開發了一套能夠解釋機器學習的開源方案,幫助人們開啟人工智能的黑箱;同時,微軟還創造了一套叫做Code Jumper的工具,利用不同形狀的模塊,幫助視力障礙的孩子們,學會如何編程。
當下,以人工智能為代表的一系列技術正在讓很多不可思議的事情成為現實。但在推動技術進步的同時,如何解決技術帶來的社會影響,以及人類將要共同面對的前瞻挑戰?如何避免人工智能技術發展帶來的偏見和歧視?也應該是科技公司需要關注的問題。
在當天的演講中,沈向洋就舉了一個例子。微軟的研究團隊,利用稱為“單詞嵌入”的自然語言處理工具,解決了文本搜索中的性別偏見的問題。
所謂單詞嵌入,是一種用來將單詞轉換為向量數字的算法,它能夠以來自新聞數據或者網頁數據的海量文本數據為依據,為每個單詞賦予一個對應的向量數字。通過在向量坐標系中,比對常見詞匯與“他”、“她”這兩個性別代詞之間的關聯度,研究人員發現了一些明顯的特征,例如“sassy(刁蠻)”、“knitting(編織)”這樣的詞更靠近女性,而“hero(英雄)”、“genius(天才)”更靠近男性。算法之所以會為這些詞匯賦予性別特征,原因在于訓練算法用的基準數據集——通常是來自新聞和網頁的數據——本身,就存在著由語言習慣造成的“性別偏見”,算法也自然“繼承”了人類對這些詞匯理解的性別差異。
其結果就是,當微軟用試驗算法,根據梅林達·蓋茨的 LinkedIn 信息推測其職業時,得到了“教師”的判斷,但只要將人稱代詞換成“他”,蓋茨夫人的職業就會變為“律師”。
為了解決這個問題,微軟的研究員提出了一個簡單易行的方案:在單詞嵌入中,刪除區分“他”和“她”的判斷維度。
除此之外,據沈向洋介紹,微軟早在2016年就開始關注技術帶來的道德倫理問題。2016 年,微軟 CEO 薩提亞·納德拉發表了一篇關于人工智能共同責任的專欄文章,幾個月后,第一次公開提出了微軟的人工智能準則:公平、可靠和安全、隱私和保障、包容、透明、責任。
2017年,微軟出版了《計算未來》一書,對人工智能發展過程中可能引發的道德、法律思考和社會影響,進行了全面詳實的探討。此外,微軟成立了AETHER(“工程與科研中的人工智能道德”的縮寫)人工智能倫理道德委員會,這個委員會由微軟公司領導、工程師、科研人員、律師等組成,負責對微軟內部與人工智能倫理道德相關的事宜,進行探討和評估。