人工智能近年來發(fā)展迅猛,也引起了很多其它領域研究者的關注。越來越多有關 AI+傳統(tǒng)領域的研究正出現(xiàn)在 Nature、Cell 等重要期刊上。然而隔行如隔山,對于其它行業(yè)的人們來說,AI 研究社區(qū)似乎并不如看起來那么友好。
近日,蒙特利爾 Jewish General Hospital 的生物統(tǒng)計學家 Alexia Jolicoeur-Martineau 在社交網(wǎng)絡中抱怨 AI 研究社區(qū)排外,吐槽 Yoshua Bengio 的言論引起了業(yè)內(nèi)人士的注意。AI 領域的學者 Ian Goodfellow 等人紛紛表示關注。眾所周知,人工智能領域能有今天的發(fā)展離不開開源、arXiv 分享精神的幫助,但這次討論給了我們從另外一個角度看待問題的機會。
值得一提的是,在成為醫(yī)療行業(yè)的科學家之前,Alexia 自己有計算機科學和統(tǒng)計學背景(她有數(shù)學和計算機學士學位,以及統(tǒng)計碩士學位)。
Alexia Jolicoeur-Martineau 的 Twitter 內(nèi)容如下:
我們需要討論一下這一問題。我把其他 AI 研究者(有的來自蒙特利爾,有的不是)也拉入了討論,因為我認為這個問題非常重要。
這個問題不止關乎蒙特利爾,還關乎整個 AI 生態(tài)。
除了詬病一些小的溝通問題,人們總是在贊美這個社區(qū)的偉大,但沒有人注意到這個社區(qū)有多么封閉、排外。
在小組討論中,我只聽 Yoshua Bengio 提過一次「NGO」(非政府機構),學界和業(yè)界是最常出現(xiàn)的兩個字眼,好像這個社區(qū)非此即彼。事實并非如此,NGO 是存在的,里面是一些因為不堪忍受學術界虐待/盤剝而出走的人。
或者僅僅是因為他們無法解決政治和環(huán)境問題(此類文章比比皆是)。因此,許多人像我一樣屢次嘗試申請讀博,但還是被拒之門外。
如果其他像我一樣有 10 篇統(tǒng)計學方面的論文(8 篇已發(fā),其中兩篇是第一作者)和 2 篇 AI 方向論文(未發(fā)表)的人也屢次遭拒,那么這說明一個問題:一大批才華橫溢的人才被攔在這個社區(qū)之外。
如果絕口不提這些人,也不考慮將其納入討論小組,那么我們相當于假裝他們并不存在。有人提到了這一漏洞百出的流程,說想要申請讀博非常困難,Joelle Pineau 的答復是這一問題將盡快得到解決。
Pineau 提到了另外的 20-40 個博士點。很抱歉這并不是問題的解決之道。她還提到有 300 人申請他們的 GAN 研究項目,她說,申請者或許應該轉(zhuǎn)向其它更有趣的項目。
這表明她不會再接收 GAN 方向的申請者。這點合情合理,因為決定接收誰做自己的學生是她的權利,但這表明這一領域門檻很高,僅僅增加幾個名額并不能解決問題。
在這 300 個對 GAN 感興趣的申請者之中,可能有 50 個天分極高的人才不得不停止該方面的研究,轉(zhuǎn)而投向其它不相關的崗位或產(chǎn)業(yè)。
我們失去了那么多樂意在學界之外進行科研(不計報酬)的人才。但在研討小組中我們連他們的存在都沒有提到,這更加重了 AI 社區(qū)生態(tài)的封閉、排外感。我們至少應該承認這一點!
我堅信,以后有了基本收入之后,這些研究人員即使不在學術界也會做研究;同時,還有很多 AI 的業(yè)余愛好者在空閑時間進行 AI 方面的研究,我們不應該因為這些人沒有華麗的頭銜而忽視他們。
我的建議是,在學界之外創(chuàng)建一些盡可能國際化的 AI 實驗室,里面沒有論資排輩,任何人都能提出項目,并/或成為一名 PI(不需要任何華麗的頭銜)。如果大家對這個主意感興趣,我很樂意繼續(xù)展開。
我沒有足夠的資金啟動這樣一個艱巨的項目,但我堅信這才是未來,我們需要停止維持這個社區(qū)一切都好的假象,不再假裝那些學界、業(yè)界之外的人不存在,或拒絕承認他們是「真正的研究者」(雖然沒在討論小組中聽到過,但之前聽到很多人這么說)。
Alexia 希望申請 GAN 方向的博士遇阻,她的遭遇引起了 GAN 發(fā)明者 Ian Goodfellow 的關注:
來自一家醫(yī)院的生物統(tǒng)計學家正在抱怨融入 AI 研究社區(qū)的困難,她既不屬于人工智能學界,也不屬于工業(yè)界。
其他人或許就沒有這么冷靜了,Alexia 的觀點在 Reddit 上引發(fā)了熱烈的討論,其中不乏對于機器學習界長篇大論的辯護。
BeatLeJuce 對此表示:
就我所知,機器學習是一個最為開放、包容的研究社區(qū)之一——但現(xiàn)在人們都被慣壞了,因而忽略了這一點。明確點說:幾十年來,人工智能社區(qū)一直在努力,所以我們的研究成果對每個人都是可望又可及的?,F(xiàn)在我們的大部分研究都在 arxiv 上免費分享,大部分代碼也都在 GitHub 上分享。ICLR 是第一批試圖通過創(chuàng)建 openreview.net 來公開進行審查的大會之一。
我們大部分書也是免費的,比如 Goodfellow、Mackay 和 Tibshirani 等人的書。第一批成功的 MOOC 是由機器學習者開設的,第一批高影響力的 MOOC 平臺也是由機器學習者創(chuàng)建的:吳恩達和 Koller 創(chuàng)辦了 Coursera,Thrun 創(chuàng)辦了 Udacity。你甚至可以在推特上給世界一流的研究人員發(fā)消息,并與之展開這樣的討論。所以,我認為機器學習站在了無障礙研究的前沿。
我們并沒有故意去孤立任何人,也沒有把任何參加科學領域活動的人排除在外。有人抱怨過因為沒有博士學位而不得參與高能物理研究社區(qū)嗎?或者計算機架構社區(qū)嗎?又或者其它任何研究領域嗎?如果你想寫一篇關于量子化學的論文,直接寫就好,沒人會阻止你。但如果你想?yún)⑴c該研究領域的討論,你得讓其他量子化學家相信你的研究有價值。就這么簡單,機器學習同樣如此。
對此,唯一的問題是:1)ML 非?;馃岱浅3?,每個人都想加入;2)在 ML 中,我們總是盡己所能地讓所有材料和信息對其他人開放,所以人們以為入學門檻很低,即使沒受過正規(guī)教育,他們也能實現(xiàn)這些。但事實是,大多數(shù)時候,人們確實缺少正規(guī)教育,因為有很多技能 MOOC 還沒有傳授:如何寫好 ML 論文,如何區(qū)分質(zhì)量高的論文和不怎么樣的論文。
理論上來說,你當然可以參與 AI 研究,即寫自己的論文。而如果它被拒收了,那說明有 3 個人看過并且都認為它不夠好。這很可能意味著這個想法或者研究方案不符合標準。的確,也許 5 或 10 年前,如果你在 CIFAR 或 MNIST 取得了好成績,一次沒有理論依據(jù)的簡單黑客攻擊可能會給你帶來一篇不錯的論文。但現(xiàn)在不會了,因為這個領域已經(jīng)成長了。所以,如果你讀了舊論文并認為「我本來可以這么做」,那你可能是對的。但要記住,情況已經(jīng)大不一樣了,這些論文中的大部分現(xiàn)在已沒法實現(xiàn)。
論文評審會要求清晰的解釋、誤差條和理論依據(jù)等等,因為我們要弄清楚什么是真正有效的,以及為什么有效。我們不是想刻薄,而是想徹底弄清楚。我們是科學界,這是我們的工作。雖然你不一定非得有博士學位才能成為科學家,但有個博士學位確實有用。即使有些科學家沒有博士學位,但請你明白!這些人是非常特殊的存在,在整個社區(qū)里占很小的比例。以 C. Olah 和 Dyson 為例子的人可以滾蛋了,因為這些人顯然不明白這二者是怎樣特別的存在。對于普通人來說,規(guī)則很簡單,且相當直接:如果你想成為科學家,那就接受對科學家的培訓——取得博士學位。
我知道,有些人抱怨說博士學位很難獲得,我也聽到了這樣的聲音。這個領域現(xiàn)在非常流行和熱門,所有一些有名氣的人會被博士申請洪流給淹沒。你聽得沒錯,洪流!所以,有時候進入一個好的研究所沒那么容易,因為我們既沒有時間也沒有資源來接受所有申請人。這意味著,有些人即使有實力,也可能不會被接受。這很糟糕,但對此我沒有任何解決辦法。
但要求我們「更包容」有點牽強。我認為我們已經(jīng)足夠包容了,而且我在開頭就提到了這一點。我們非常歡迎每一個社區(qū)之外的人向任何 ML 會議提交其研究報告。如果你的論文足夠好,你就能夠發(fā)表它。如果不是,那請你做得更好。很抱歉,我們沒時間教你如何寫好論文和進行適當?shù)膶嶒?,因為我們已?jīng)被學生給淹沒了。
john_8_32_表示:
這種想法太荒謬了,就相當于在說我的申請被拒了,所以整個博士申請系統(tǒng)都很糟糕。我很同情那些申請被拒的人,他們也是一心想成為科學家,但這一領域已經(jīng)被炒得太熱了,而且研究院名額有限,無法滿足這么大的需求。學術界確實有太多太多的問題存在,但除了研究院壓力過大使得研究人員精疲力竭之外,我不覺得她指出的問題戳中痛點。
如果其他像我一樣有 10 篇統(tǒng)計學方面的論文(8 篇已發(fā),其中兩篇是第一作者)和 2 篇 AI 方向論文(未發(fā)表)的人也屢次遭拒,那么這說明一個問題:一大批才華橫溢的人才被攔在這個社區(qū)之外。
統(tǒng)計學和機器學習是非常不同的領域,有著不同的目標和標準。我看了她的論文,看起來是挺不錯的統(tǒng)計學論文,但論文得以發(fā)表在另外一個領域并不能說明她的 ML 論文有多好。一些終身教授的論文也經(jīng)常被拒。很明顯,同行評審是有瑕疵的,但這種言論是相當奇怪的。同時也給一絲鼓勵:我認為被拒有助于寫出更好的論文,而不是世界末日。
這表明她不會再接收 GAN 方向的申請者。這點合情合理,因為決定接收誰做自己的學生是她的權利,但這表明這一領域門檻很高,僅僅增加幾個名額并不能解決問題。
確實,在資源有限的世界,即研究所里,「門檻」對于資源分配是有必要的。
我的建議是,在學界之外創(chuàng)建一些盡可能國際化的 AI 實驗室,里面沒有論資排輩,任何人都能提出項目,并/或成為一名 PI(不需要任何華麗的頭銜)。如果大家對這個主意感興趣,我很樂意繼續(xù)展開。
我沒有足夠的資金啟動這樣一個艱巨的項目,但我堅信這才是未來,我們需要停止維持這個社區(qū)一切都好的假象,不再假裝那些學界、業(yè)界之外的人不存在,或拒絕承認他們是「真正的研究者」(雖然沒在討論小組中聽到過,但之前聽到很多人這么說)。
處于學術界和工業(yè)界之外的人們的研究成果基本上沒有發(fā)表??茖W是讓人們分享知識的社區(qū),如果不能讀到你的論文,沒有人會感受到你的影響力。從科學的角度來說,你或多或少是不存在的。這點說起來很令人難過,但這就是我們積累知識的方式。
Alexia 的遭遇并不是罕見的例子,同樣投身醫(yī)療領域的 noelsusman 表示:
我是一名肄業(yè)博士生(提前退學了,目前擁有碩士學位),現(xiàn)在在一所醫(yī)院研究機器學習。
我認為學術界已經(jīng)遭到破壞,但不是因為原貼中提到的任何一個因素。從醫(yī)療界的角度來看,我們是有太多(而不是太少)的人在做研究。作為一個群體,我們并沒有好好利用那群涌入到 GAN 研究的人們的成果。
我所在的這家醫(yī)院仍然在使用簡單的啟發(fā)式方法來評估再入院風險。我們目前所處的階段,只要擬合一個 logistic 回歸到一些基礎的診斷數(shù)據(jù)就能顯著改善原來的狀況。但這并沒有發(fā)生,因為我們有太多這樣的問題需要解決,卻沒有足夠的人手。這是個很困難的問題,因為(a)醫(yī)院沒有用不完的資金;(b)我們的人力資源不足,因為薪資水平競爭不過技術公司。在街對面就有這樣一家公司,我能在那里做相同的事情并拿到多 20% 的薪水。
我確實希望有更簡單的方式讓外行人進入學術界。我現(xiàn)在在做的研究是新穎的、可發(fā)表的,并且我也樂意分享,但我不知道如何解決更大的問題。
人工智能現(xiàn)在已經(jīng)成為熱門學科,即使對于 AI 領域之內(nèi)的人來說,2019 年申請博士學位的難度也已大幅超過往日。相信隨著人工智能的發(fā)展,這樣的討論還會愈演愈烈。