熱門文章
業務福音!IBM將為企業梳理人工智能數據
發布時間:2018-11-16 分類:趨勢研究
隨著人工智能的興起,使得市面上出現了一系列的具備AI的產品,為此也有分析人士表示,人工智能未來將成為我們不可缺少的生活方式之一。但對于企業來說,人工智能似乎難以駕馭,因為人工智能還沒有做好處理“業務流程”的準備。
近日,IBM Watson和Almaden研究中心的科學家們在本周發表的一篇國際商業機器研究論文表示,關于企業如何數據人工智能數據,科學家提供了一些建議。IBM的研究人員的建議是,很多機器學習階段需要考慮仔細,包括一個經理該如何“設定目標”的神經網絡模型中,“數據管道”應該如何構建的示例作為神經網絡的輸入,以及如何不斷“迭代”人工智能模型來改進它。
特別關注的是受監管行業所關心的問題,比如數據的“血統”:使用數據的“合法性”是什么?人工智能對企業的挑戰在于機器學習編程和傳統軟件編程之間的本質區別,IBM表示:“盡管傳統軟件應用程序是確定性的,但機器學習模型是概率的?!贝送?,神經網絡是使用“混亂的數據”開發的,這一事實并不十分適合企業。IBM還推出檢測人工智能公平性、偏見和開放源代碼的工具沒有人對此做過任何事情,IBM說:“關于機器學習建模的學術文獻未能解決如何讓機器學習模型為企業工作的問題?!?
為了達到一種更適合企業使用的成熟度,IBM的科學家們建議將機器學習引入“應用生命周期管理”之類的大量文獻中,同時擴展這些術語的含義,以適應人工智能的新特性。具體來說,研究人員借鑒了沃茨·漢弗萊(Watts Humphrey)的工作,他在上世紀80年代為軟件定義了“能力成熟度模型”。CMM是軟件在組織中運行的各個階段的一種映射。它從“不成熟”的階段開始,當公司無法控制它在一個程序中做什么,并以一個組織能夠不斷“優化”一個程序的快樂階段結束。
這項工作最原始的貢獻是研究人員的建議,神經網絡的開發應該著眼于特定行業的特殊性。他們寫道,要找出人工智能的“業務用例”,可能需要一家公司“根據行業、領域和用例特定數據定制通用機器學習模型,以使它們在特定情況下更準確?!?
IBM正冒險涉足這篇論文的棘手問題。機器學習有許多方面,特別是在其深度學習的化身中,這些方面很難與能力成熟度模型的簡潔規范相協調。
例如,IBM提議在公司內部設立一個“人工智能服務數據主管”,在工作開始時,在反饋給機器的數據上附加什么樣的“地面真相”標簽。但在神經網絡的設計中,很多“無監督”的機器學習都試圖脫離基本事實。
在IBM看來,最令人畏懼的可能是企業應該負責確保神經網絡沒有偏見,這是整個人工智能領域都在絞盡腦汁解決的問題。負責開發神經網絡的“產品經理”的職責之一是“確保模型不受不良偏見的影響,公平、透明”。