男男19禁啪啪无遮挡免费,国产免费AV片一级大片免费观看,16初次破初视频在线播放,人妻AV中文系列

首頁 / 資訊中心 / 趨勢研究/信息流的未來與人工智能的機會

信息流的未來與人工智能的機會

發布時間:2019-07-26 分類:趨勢研究

在當今社會,尤其是融合了社交內容的移動互聯網時代,如何更好地連接人與信息,已成為人類社會的一個重要基礎命題。個性化的信息流已經成為一種新的連接方式,人與信息、萬物互聯。

那么,在信息流產品平臺與服務這個領域里,如何高效地處理、分析、挖掘、理解和組織海量文字、圖片(視頻),更好地連接人與信息呢?并根據對用戶的深度理解,來進行信息的智能推送呢?無疑,人工智能具有巨大的潛力。從內容創作、過濾、分發、消費以及互動的每個環節,我們都可以使用大規模機器學習,包括文本分析、自然語言理解、計算機視覺和數據挖掘等技術,向用戶進行智能推送。同時,我們還可以基于信息流豐富多樣的應用場景和用戶,持續累積大量的訓練樣本和數據,讓機器學習系統形成閉環,不斷地改善和進化,在機器人輔助內容創作、自動視頻分析與理解,個性化推薦和問答等方面發展人工智能核心技術。本文將分享筆者對人工智能發展前景的一些看法,包括人工智能的本質、近幾年重要的技術發展,以及企業應該如何建立人工智能的核心戰略競爭力。

15.jpg

連接人與信息:從結繩記事到超級智能

自古以來,人類社會一個最重要的基礎需求,就是人與信息的連接。最早的信息傳遞用的是“結繩記事”技術。那時候還沒有語言,有大的事情就結一個大的結,小的事情就結一個小的結。公元100年左右,蔡倫發明了紙,后來有了書。11世紀40年代,畢昇發明了活字印刷術,為印書提供了便利,讓書實現了比較廣泛的傳播。在很長一段時間內,書和紙是人類社會傳播信息的主要工具。20世紀90年代,數字圖書館出現,美國開始把全國的圖書數字化,開始出現搜索、管理、影像分析等。在互聯網時代,網站成為紙張之外的另一個主要信息來源。但人只能定點于個人電腦(PC)上。雖然有了搜索引擎和相對應的廣告引擎,但大部分搜索還受限于它的不能移動性。當我們走路或者外出時,往往還會隨身攜帶雜志或報紙。

最近十年,移動互聯網與智能手機不再受限于固定的地理位置,這讓紙制印刷品進一步減少。尤其在近幾年,這一趨勢明顯,很多傳統媒體、傳統出版社都轉型為網絡媒體。

在PC互聯網時代,搜索引擎可以借著爬蟲軟件在網頁上抓取信息,但到了移動互聯網時代,很多信息都藏在應用里面,雖然不能利用搜索引擎將每個App里的信息輕松“爬出”,但是在這股潮流中涌現出一些新的應用,讓我們能夠重新定義信息的源頭。例如今日頭條有“頭條號”。我們可以與很多信息供應商、內容提供商、媒體創作者一起來構建新的內容平臺和生態系統。以前我們需要做很多信息抽取的工作,現在可以直接拿到結構化的數據。

到了今天,更多的公司開始大規模使用人工智能做個性化推薦。因為人們使用智能手機有了很多碎片化時間,產生了學習、娛樂等需求。這些需求也產生了各式各樣的應用場景。我們發現,在推薦引擎領域有了一個將人與信息相連接的新機會。搜索引擎里所有的排序算法、內容分析等技術,都可用于進一步的個性化精準推薦,從而變成信息流?!靶畔⒘鳌笔且环N新的、更智能的方式,讓人能夠隨時隨地在需要時得到所需要的信息。人工智能不但能夠做個性化推薦,還能夠不受地域限制享受服務。我們的目標就是——用無所不在的超級機器智能幫助人類創作、發現、使用、分發信息,并進行社交場景的互動。

隨著技術的進一步發展,會出現超級智能,人工智能與人可以互相幫助,從而讓彼此變得更聰明。人工智能需要很多標注數據和訓練樣本,在信息流的場景,人們有更多機會拿到更多標注數據以及更細顆粒度的標注,來幫助人們做自然語言理解、自然語言生成、圖像視頻理解和圖像視頻生成。人將與人工智能進一步共同進化。這是一個非常值得期待的未來。

人工智能的本質是軟件產業革命

在過去五年,人工智能快速發展。之前,人工智能雖然有機器學習,但往往受限于傳統思維?,F在,研究人員不再受限過去20年的經驗和成就,而是更大膽地開始創新。

今天人工智能的本質其實是軟件產業的革命。軟件正在改變全世界(Software is eating the world),而軟件產業本身正在被人工智能的發展所顛覆。越來越多的軟件開發不再只是依靠軟件工程師的想法、邏輯和認知,而這些軟件的核心已變成非常大的模型,有上千億的參數,有各式各樣的大數據。通過訓練各種各樣的模型,包含統計模型、符號、邏輯、知識表達,軟件產業已被人工智能化。

今天,視頻、圖像、文字都已經被數字化,下一個階段就是語義化,比如圖像理解。在數字原始表達空間,計算機很難做語義理解,我們需要深度學習模型來學習非線性的轉化。機器跟人的思維方式不一樣,機器算得快,任何問題只要能表達,使用加減乘除就能完成得很好。今天的人工智能的本質其實是軟件產業的革命,借由大數據、大計算和機器學習來訓練大模型,“編寫”越來越智能的軟件。

從數據學習機器能理解的語義表達

我們已經到了這樣一個時代,有了更好的技術,能夠直接從數據中學習機器能理解的表達方式。使用深層神經網絡從數據本身直接學習機器能夠“理解”的語義表達空間。輸入是原始的數據空間,是信息化和數字化之后的結果,例如數字圖片和它的語義標注,在輸入的數字化原始數據空間里,它們的向量表達和分布一般是非常復雜的。

但借由深度學習,我們可以學到所需要的非線性轉換函數來把它們變換或映射到一個機器能理解的新的語義表達空間里。在這個新的空間里,機器能借著計算來處理許多需要人類智能的復雜工作。數據量越大,學習出來的表達方式越好,從而帶來更高的識別精度。這將構成一個正向循環。

我們希望能訓練更大、更深的網絡。但這也帶來一定的挑戰,因為需要更大的數據和更大的計算平臺,這也讓分布式機器學習的平臺變得非常重要。盡管今天的大部分應用還依賴于監督學習,但是也還有很多研究,比如對抗學習(GAN),是生成模型與辨別模型互相對抗,在博弈論的框架里面彼此學習。這就好像訓練兩個模型,一個是學生模型,一個是教練模型,教練不斷出更好、更難的題目來測試學生,學生也借由這些更難的題目被訓練得更好。學生的進步又使得教練必須不斷加強他的能力。

例如,一個花樣滑冰選手在大部分的場景都跳得很好,但是三周跳需要改善動作,教練就需要有好的生成模型來產生更多的這方面的訓練樣本。學生在進行大量的針對性的訓練之后,才能不斷進步。另外,非監督學習、弱監督學習,還有人機互動學習也是一個很重要的新方向。

<蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>