熱門文章
2019全球AI人才報告
發布時間:2019-04-24 分類:趨勢研究
摘要
一些有力的證據表明,AI頂級人才供不應求。但是對于人才的稀缺度和集中度卻缺少精確的信息。為此,element.ai團隊連續第二年對全球AI人才的范圍和廣度進行調查。其研究主要依賴3個數據來源。1)AI領域21個領先的科學會議的出版物,分析其作者的概況。2)分析若干LinkedIn定向搜索的結果,看看有多少人自稱是博士并且具備相應的必須技能的。3)外部報告及其他二手來源,幫助尋找相關背景,并更好地理解迅快變化的全球AI版圖中的人才情況。
報告發現,2018年有22400人在一或多個機器學習的頂級會議上發表了論文,比2015年提升了36%,比去年也漲了19%。同行評審的出版物數量也比2015年提高了25%,比去年提高了16%。不過在這些會議上發表文章的研究人員當中,女性僅占18%,顯得名額不足。報告還發現,全球的AI人才池是高度流動的,大概有1/3的研究人員的雇主所在國家與其獲得博士學位所在國家是不一樣的。報告的分析表明,在21種刊物上發表過作品的作者當中有18%(約4000人)對有著重大影響的研究(以過去2年被引用數為衡量)做出過貢獻。而擁有高影響力研究人員最多的國家依次是美國、中國、英國、澳大利亞以及加拿大。
對LinkedIn簡歷的輔助調查表明,有36524人符合自稱的AI專家資格,這比2018年的報告數字增加了66%。
此次調查的發現表明,無論是自我報告的AI專家數量,還是作者和在AI會議上發表的科學論文數量,均有了顯著的提升和拓展,這反映出該領域的活力和國際化。
介紹
對AI專家的需求空前高漲,自學習的算法預計可讓公司更好地駕馭發展性,獲取重要但此前不可見的信號,提供實時洞察,幫助員工更好地完成工作。
去年的第一次全球AI人才調查確認了一個AI業界的普遍假設:即有人工智能經驗的博士很難找。今年的調查將學術會議的樣本從3個提高到21個。同時還細分了性別、人才流動以及影響力指數情況。同時,報告還收集了LinkedIn上面的簡歷情況來評估自我報告的AI專家趨勢。最后,報告還將發現與外部報告和來源的數據進行關聯。
女性在AI會議出版物作者中的占比依舊不足
我們去年跟《連線》合作分析了人才池的情況,試圖弄清楚女性在機器學習研究人員的占比。我們的評估認為目前這個領域的性別平衡問題依然非常嚴重:去年調查的3個領先的AI學術會議里面,我們發現只有12%的作者是女性。
今年的調查范圍擴大到了21個學術會議,結果發現雖占比有所提升,但這個群體的女性名額依然不足,比例為18%左右。根據我們的調查,AI存在的這種性別不平衡體現在了產業和學術兩方面:我們的數據表明學術界 19% 的會議作者為女性,而產業界的女性作者占比為16%。
考慮到機器學習潛在的廣泛社會影響,女性在AI開發和部署方面的參與度是個重要問題。Facebook AI研究實驗室負責人Joelle Pineau教授闡明了要增加本領域女性數量的理由:“相對于其他領域我們肩負著更多的科學責任,因為我們正在開發會影響很大一部分比例人口的技術?!監penAI的CEO Sam Altman也提出了類似的觀點,稱機器學習在博士畢業生的性別方面是“目前我所知道的最扭曲的領域”,同時又是“對我們未來所生活的世界會產生最大影響的領域”。
據斯坦福大學發布的2018年AI指數報告,女性在學習AI和機器學習課程的大學生當中的占比也不足:學習斯坦福2017年的《AI導論》課程的 74%為男性學生,加州大學伯克利分校的比例則是73%。報讀《機器學習導論》的女性占比甚至更低,斯坦福大學這門課程男學生占到了 76%,而加州大學伯克利分校同樣課程的男學生占比更是高達79%。同一份報告還發現,美國絕大部分AI職位的申請者都是男性(71%)。
此次調查的數據表明,不同國家/地區之間的性別差距各不相同。女性作者占比高于18%的平均水平的國家/地區包括西班牙(26%)、臺灣(23%)、新加坡(23%)、中國大陸(22%)、澳大利亞(22%)、美國(20%)、瑞士(19%)。在絕對數量上,美國的女性作者數量最多,其后是中國、英國、德國、加拿大、法國、澳大利亞、印度、意大利與新加坡。
培養出頂級AI專家的國家在雇用人才方面也領先
來自美國、中國、英國、德國、加拿大的作者占了72%
我們的會議研究人員數據讓我們得以觀察論文作者是在哪里接受培訓的。首先,在培養AI人才方面,美國繼續領先優勢:在這份調查的會議作者樣本中,44%的作者的博士學位是在美國獲得的。而在中國受訓的作者占到了約11%,其后是英國(6%),德國(5%)以及加拿大、法國和日本(均為4%)。
雇用數據也顯示出了類似的地理分布特征。我們的調查表明,美國雇主繼續吸引研究人員前往工作,樣本數據中46%的人替美國的雇主工作,中國排名第二,占比為11%,第三的英國占比為7%。加拿大、德國、日本各占樣本的4%。排名前18的國家就占到了作者總量的94%。而排名前5的國家美國、中國、英國、德國、加拿大的占比達到了72%。
會議樣本絕大部分都是學術界的(77%),23%在產業界工作。盡管業界一些最大的私營公司仍繼續吸引人才入駐其總部,但我們也看到很多公司開始招聘專家讓他們在母國的辦公地點工作。這份報告也把這些人看成是為公司總部所在國工作。比如說,某人是在法國修得博士然后在Google的法國分公司工作,報告會把此人看成是在法國受訓為美國公司工作。所以在統計方面美國受益是最大的。
為他人做嫁衣——培養博士的國家未必總是受益
人才流動情況
本次的會議數據還分析了研究人員在完成博士學業后去到了哪里工作??傮w而言,我們發現在樣本當中將近有1/3(27%)的研究人員工作的雇主所在國家跟他們接受培訓所在的國家是不一樣的。在作者數量至少在150以上的國家當中,這個比例甚至高達32%。這些人才流動的全球地圖很復雜,背后的故事當然是跟個人密切相關的。但無論如何,這一數據能讓我們對AI人才的跨境流動一探端倪。(編者注:從中國的人才流入和流出來看,我們還是凈流入的多;而美國流入流出的體量都很大)
首先,我們的數據表明,某些國家對機器學習領域的研究人員特別有吸引力??偛吭诿绹墓椭魑M馐苡栄芯咳藛T的幾率最高。中國是吸引在別國拿到博士學位的研究人員可能性第二大的國家,在吸引的研究人員數量上幾乎是美國的1/4。我們估計會有若干因素對此產生影響,其中就包括每個國家的相關職位情況。
其中人才流入大于流出的10個國家/地區是:中國臺灣、瑞典、韓國、西班牙、美國、瑞士、中國、日本、英國、澳大利亞。而在接受海外專家方面的贏家是瑞士和瑞典,外來人才占比分別達到了50%和49%。
不同國家人才流入流出情況對比
這一數據還可以讓我們對比每個國家/地區的人才流入流出情況。人才流入表示的是在x國/地區工作但是在y國/地區拿到博士學位的人數除以x國/地區的AI人才總數。這個指標可以用來衡量一個生態體系對人才的吸引力。
四象限:左上——錨定國;左下——生產國;右上——邀請國;右下:平臺國
另一方面,人才流出表示的是在x國/地區拿到博士學位但現在為y國/地區的雇主工作的人數,再除以x國/地區的AI人才總數。這個比例可以看出一個國家/地區留住人才的能力。
跟平均水平相比,澳大利亞、西班牙、中國臺灣的流入情況要大于流出。這意味著這些國家/地區在挽留自己培養的人才并吸引外來人才方面相對更加成功。這些生態體系我們稱之為邀請國。相反,法國、以色列這樣的國家屬于生產國,因為跟平均水平相比,其人才流出要高于人才流入,但是差距并不大。
美國的人才流入和流出情況都相對較少。這并不能反映出其人才庫的深度:就絕對數字而言,美國依然是全球領先的人才磁石。相反,它反映的是人才庫的相對穩定性。中國、德國、印度、意大利、日本和韓國也呈現出相同的模式。這類國家我們稱之為錨定國。
最后,還有好幾個國家的人才流入和流出都高于平均水平。這些國家成功地吸引了海外培養的人才,同時期研究生流動也高于平均水平。這些生態體系我們稱之為平臺國。,其中包括了加拿大、荷蘭、新加坡、瑞士以及英國。
我們的會議數據還發現一些國家之間的人才交流引人關注。中美之間的交流尤其突出,所以整體而言誰都沒有占太大的便宜:我們發現在我們的22400名研究人員數據集當中有約500位是在中國拿得到博士學位然后為美國雇主工作的,不過也有約500名字美國拿到博士學位的人為中國的雇主工作。美國與英國之間也有類似的現象。
重大影響研究:美國、中國、英國、澳大利亞、加拿大領先
今年的調查還發現在頂級國際學術會議上出現的作者數量比去年增加了19%。為了評估這些作者目前在領域內的影響力,報告分析了其 2017、2018兩年間出版物的被引用情況。其中有18%(約4000人)具有較為顯著的影響力。這些人也是致力于將理論付諸應用的團隊想要爭取的對象。
而具備高影響力的作者的國家也主要集中在幾個國家,分別是美國(1095)、中國(255)、英國(140)、澳大利亞(80)以及加拿大(45)。
不過如果分析高影響力作者在本地AI人才中的占比的話,情況會有所改變。這指標反映的是培養本地頂級人才的能力。這方面澳大利亞排名第一,18%的作者發表了具備重大影響的文章,其后是美國、英國和中國(均為13%),瑞士(11%)、新加坡(9%)、瑞典和西班牙(8%),以及以色列、加拿大與意大利(7%)。
總體而言,最具影響力的研究更有可能出自學術界而不是產業界。但是有些國家尤其如此。中國的高影響力研究是最有可能出自學術界的(90%),緊隨其后的是意大利(86%),美國(84%),德國(83%)以及中國臺灣(81%)。而來自產業界的占比最高的國家是法國(30%),其后是印度和以色列(29%),西班牙(28%)以及英國(27%)。
社交網絡數據表明更多人是自稱的AI專家
我們的會議研究人員數據表明在AI領域的21個頂級學術會議上發表論文的作者和論文數量均有了顯著提升。為了了解就業市場是否有同樣的情況,我們調查了全球使用最廣泛的職業社交網絡LinkedIn。
我們的研究對象是那些具備機器學習技術能力、若干工作經驗,并且能夠在交叉學科環境下寫作的職場人士。搜索包括了“數據科學家”、“研究科學家”、“機器學習工程師”、“機器學習研究人員”以及“數據分析師”,而且學歷必須是博士。最后檢索出36524名符合條件的人士。相比之下,去年的數據為22064,也就是說比去年增長了66%。
跟去年,今年的調查發現,LinkedIn上的AI專家主要集中在美國、英國、加拿大、法國以及德國。不過,增長率最快的國家是意大利、突尼斯、以色列、愛沙尼亞以及阿根廷。
從LinkedIn樣本分析來看,這些專家的主修專業各不一樣。其中計算機科學是占比最高的(28%)。而且在一些國家這個比例甚至還要大,比如法國(47%)和中國(44%)。類似地,一些國家其中一些學科的占比也比平均水平突出。比如物理專業的平均占比為9%,但在德國其占比卻高達28%。另一個例子是數學和統計。平均占比為18%,但以色列、美國這個數字就升到了27%,而俄羅斯更是高達35%。
不同國家的學科差異
計算機科學約占1/3,但不同國家差異很大
當然,利用LinkedIn分析有一些問題需要注意。首先是LinkedIn上面的信息都是用戶自述的。其次,LinkedIn的代表性對一些國家來說并不足。LinkedIn自稱有44%的美國人在上面有簡歷,加拿大的占比也有38%。但俄羅斯的占比比卻只有5%,而中國更是只有3%。
不過對于使用LinkedIn活躍的國家來說,LinkedIn上面的活動能夠為AI領域的人才規模和興趣改變提供洞察。就本次調查而言,我們發現機器學習專業出現了顯著的提升。這有可能是反映出一個日益重視AI技能與專業知識的市場推動了人才庫的擴張。
全球的AI人才熱點
中國
從會議作者數據看,約11%的會議作者是在中國培養的,也有相同比例的作者是為中國雇主工作。在樣本中中國占領女性作者的12%,其中有14%發表了最有影響力的研究。2018年在頂級會議上發表論文的作者當中,有13%屬于高影響力群體。
在AI方面,中國有著若干優勢。其中包括大規模的數據,具有活力的創業環境,政府支持等。根據清華大學 2018年6約發布的《中國人工智能發展報告》,中國在論文總量和高被引論文數量上都排在世界第一,中國已經成為全球人工智能專利布局最多的國家,風險投資上,中國人工智能領域的投融資占到了全球的60%,成為全球最“吸金”的國家。但是,在頂級AI人才這個關鍵方面占比較低(排名依次是美國、英國、德國、法國、意大利和中國)。而在人才總量,方面,該報告認為中國僅次于美國。但是有跡象表明中美之間的差距很快就會縮?。篈llen Institute for Artificial Intelligence(艾倫人工智能研究所)最近的一項研究發現,到2020年,中國的高影響力出版物就將超過美國。這也許就是中國的AI戰略將培養頂級人才列為優先事項的原因之一。
這項戰略的部分內容似乎是將海外工作的中國研究人員帶回中國。2008年,中國推出了“千人計劃”,旨在吸引著其他國家工作的外國和中國研究人才。在提供杰出研究崗位、獎金補貼的激勵下,千人計劃成功地吸引了成千上萬的研究人員將自己的工作帶到中國,其中絕大部分都是來自美國。與此同時,中國還建設了超過300座“創業園區”,讓海外學生和人員回國。
來自美國國家科學基金會的數據表明,相對于之前,稱學成后愿意留下來的在美國獲得數學或者計算機科學博士學位的中國博士生占比下降了。2012至2015年期間,中國學生占到了非美國籍的赴美留學博士生的42%,其中有87%的人說打算留下來,說絕對要留下來的比例也有57%。盡管表示學成后要留在美國的中國學生的占比仍高于世界平均水平,但相對于2004到07年期間,這兩個數字實際上是下降了,那段時間表達留下來意愿的占比為91%,說絕對會留下來的占到了65%。這些數據表明,在美國修完數學和計算機科學博士學位的海歸正在越來越多。
像千人計劃這樣的人才招募計劃,再加上AI領域空前的投資所帶來的商業機會,正在成為部分研究人員考慮將實驗室遷往中國的激勵因素。另一個考慮因素是所謂的“竹子天花板”:亞裔的STEM畢業生得到外國公司的雇用可能很容易,但是晉升卻不能像部分同事那么容易。2015年對Google、惠普、英特爾、LinkedIn以及Yahoo進行的一項雇用數據研究表明,盡管亞裔占到這些公司專業勞動力的27%,但主管的占比卻只有14%。
美國
在超過36500份LinkedIn簡歷的樣本里面,有將近一半(15747)是在美國的。其中很大一部分(約20%)目前或者之前在微軟(1077)、IBM(667)、Google(697)、Amazon(511)以及或者蘋果(393)工作。這些簡歷當中 87%都有至少6年的經驗,而且幾乎全都(97%)稱有至少3年的經驗。這個人才庫當中約有1/3都是在舊金山灣區工作。
在會議數據方面,美國幾乎在每一個指標的絕對數方面都是領先的。在美國受教育的人占到了樣本論文作者的將近一半(44%)。受雇美國公司或大學的占比達到了46%。在女性群體扎伊占比甚至更高:數據集的的4085名女性當中,有1960(48%)是為美國雇主工作的。在美國機構工作的高影響力(論文被引用數排名靠前)作者占到了60%。高影響力人才占到了美國AI人才的13%。其中學術家占領84%,產業界占16%。
美國在若干指標領先并不出奇。一方面,美國在基礎AI研究上依舊領先。據李開復的說法,美國致力于在未來30到40年維持“研究領導力”和研究生教育方面的全球領先優勢。
此外,美國公司和美國政府在AI研發方面的投入很大。Facebook、蘋果、微軟、Google和Amazon這些美國巨頭均在機器學習方面加倍下注。OECD 2018年12月發布的一份報告稱,無論是從交易額和交易數量來看,自從2011年以來,絕大部分的AI初創企業股權投資都流向美國公司。美國軍方也在積極投入AI研究:比方說DARPA在2018年11月就宣布未來5年投入20億美元用于“創造第三波AI技術潮的新老計劃”。
結論
我們的2019 全球AI人才報告表明,過去一年,AI領域的作者數、具有重大影響的科學論文數、以及自稱的AI專家數均有了顯著提升。不過女性的名額依舊不足,但有一些國家在性別均衡方面表現得更加出色。從人才分布的地緣情況看,美國在幾乎每一個指標的絕對數方面都是領導者。但這個領域無疑是非常國際化的,每一個本地生態體系都有獨特的優勢和戰略。專注于培養這一領域專業人士的國家正在幫助將AI人才庫的蛋糕做大,從而推動本領域向前發展。