《電子技術(shù)應用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 北大謝濤獲ASE 2021最有影響力論文獎,成為首位華人獲獎學者

北大謝濤獲ASE 2021最有影響力論文獎,成為首位華人獲獎學者

2021-07-29
來源:機器之心
關(guān)鍵詞: 謝濤 軟件工程

  一篇發(fā)表于 ASE 2007 的經(jīng)典論文,讓 ASE 2021 將「最有影響力論文」獎項頒給了北京大學教授謝濤和當時的博士生 Suresh Thummalapenta。

  近日,軟件工程國際頂級會議 ASE 2021 公布了「最有影響力論文」獎項(Most Influential Paper Award),北京大學計算機科學技術(shù)系講席教授謝濤和他早年指導的前北卡州立大學博士生 Suresh Thummalapenta 共同獲獎。

  ASE 是軟件工程領(lǐng)域的頂級國際會議,創(chuàng)辦于 1986 年。一般來說,年度 ASE 最有影響力論文獎是從之前 15 年左右(包括 14、15、16 年前)在 ASE 會議上所發(fā)表所有論文中選出最具影響力的論文。本次獲獎的論文是謝濤與 Suresh Thummalapenta 合作的 ASE 2007 年論文《PARSEWeb:A Programmer Assistant for Reusing Open Source Code on the Web》。

  論文鏈接:https://taoxiease.github.io/publications/ase07-parseweb.pdf

  這一研究是從 ASE 2006、ASE 2007、ASE 2008 三年 181 篇被錄用論文(三年共 713 篇投稿)中選出來的獲獎論文。

  在軟件工程三大國際頂會 ICSE、ESEC/FSE、ASE 的歷年最有影響力論文獎(ICSE MIP Award,ESEC/FSE Test of Time Award, ASE MIP Award)獲獎作者中,謝濤是三位華人之一(另外兩位是 Hongjun Zheng 和 Amy J. Ko),也是迄今獲得 ASE 最有影響力論文獎的唯一華人作者。

  在今年 11 月將線上舉行的 ASE 2021 會議中,謝濤教授和 Suresh Thummalapenta 博士將在特邀大會報告中對該論文及其影響力進行分享。

  獲獎論文介紹

  程序員通常重用現(xiàn)有的框架或者數(shù)據(jù)庫來減少軟件開發(fā)工作量,其中的常見問題是,程序員知道他們需要什么類型的對象,但不知道如何使用特定的方法序列獲得該對象。

  為了解決這個問題,謝濤和 Suresh Thummalapenta 開發(fā)了一種方法,以「 Source object type → Destination object type」形式的查詢作為輸入,并推薦常用的 Method-Invocation Sequence(MIS),MIS 可以將 Source 類型的對象轉(zhuǎn)換為 Destination 類型的對象。該方法使用代碼搜索引擎(CSE)來收集相關(guān)的代碼樣本,并對其進行靜態(tài)分析以提取所需的序列。由于代碼樣本是通過 CSE 按需收集的,因此該方法并不局限于任何特定框架或庫的查詢。

  他們使用一個名為 PARSEWeb 的工具實現(xiàn)了該方法。PARSEWeb 與 GCSE 協(xié)同,以搜索具有給定 Source 和 Destination 對象類型用法的代碼示例,并下載代碼示例結(jié)果以形成本地源代碼存儲庫。PARSEWeb 分析本地源代碼存儲庫,使用序列后處理器提取不同的 MIS,并聚集類似的 MIS。提取的 MIS 可以作為給定查詢的解決方案。PARSEWeb 使用幾個排序啟發(fā)式方法對最后一組 MIS 進行排序。此外,PARSEWeb 還使用一種叫做查詢分割的額外的啟發(fā)式方法,它有助于解決給定查詢的代碼示例被分割到不同源文件中的問題。

  在實驗階段,研究者進行了四種不同的評估,表明該方法在解決程序員的查詢需求方面是有效的,此外還證明了 PARSEWeb 比此前的相關(guān)工具(Prospector 和 Strathcona )表現(xiàn)更好。

  PARSEWeb 這項研究首次把數(shù)據(jù)挖掘和機器學習所用的軟件制品數(shù)據(jù)源從單個或幾個開源系統(tǒng)拓寬到整個互聯(lián)網(wǎng)上的軟件制品,成為大代碼、軟件大數(shù)據(jù)重要產(chǎn)業(yè)和學術(shù)方向的先驅(qū)「開荒者」。這個范圍的拓寬是基于代碼搜索和代碼挖掘的有機結(jié)合,有效地解決了在輔助軟件工程任務時相關(guān)數(shù)據(jù)點不足的問題。

  這篇獲獎論文也是數(shù)據(jù)驅(qū)動的智能化軟件開發(fā)領(lǐng)域的最早期經(jīng)典代表作之一,以大代碼挖掘的手段來實現(xiàn)智能「程序員助手」。其所貢獻的技術(shù)首次有效地解決了在一個特定軟件開發(fā)問題上的數(shù)據(jù)驅(qū)動軟件自動化:如何自動地合成方法調(diào)用序列來獲取一個給定類的對象。

  根據(jù) Google Scholar,該論文當前引用數(shù)超過 510 次。盡管該論文比其它歷年獲獎論文要發(fā)表得晚,該論文在歷年獲得 ASE 最有影響力論文獎的 13 篇論文之中引用數(shù)排名第 4。

  關(guān)于謝濤教授

  謝濤 1997 年本科畢業(yè)于復旦大學,2000 年在北京大學獲得計算機科學技術(shù)的碩士學位(師從梅宏教授),并于 2002 年和 2005 年在美國西雅圖華盛頓大學獲得計算機科學技術(shù)的碩士和博士學位(師從 David Notkin 教授),目前是美國伊利諾伊大學香檳分校有終身教職的正教授。之前他從 2010 年 8 月到 2013 年 6 月為美國北卡州立大學有終身教職的副教授 (提前一年晉升),2005 年 8 月到 2010 年 7 月為美國北卡州立大學助理教授。他曾在微軟亞洲研究院和微軟研究院(雷德蒙)擔任訪問研究員,并常年擔任微軟研究院和華為公司的咨詢顧問。

  謝濤是美國 AAAS Fellow、IEEE Fellow、ACM 杰出科學家、CCF 杰出會員,曾獲 2020 年科學探索獎,國家自然科學基金委海外杰出青年科學基金以及其延續(xù)資助、美國 NSF Faculty CAREER Award、ACM SIGSOFT 杰出服務獎、IEEE 計算機協(xié)會軟件工程技術(shù)委員會(TCSE)杰出服務獎等。

  謝濤的主要研究領(lǐng)域包括軟件工程,系統(tǒng)軟件,軟件安全,做出了一系列對軟件產(chǎn)業(yè)有高影響的研究工作,曾獲微軟研究院杰出合作者獎(全球 32 位獲獎教授之一)、微軟研究軟件工程創(chuàng)新基礎獎、谷歌教授研究獎、Facebook 研究獎、IBM Jazz 創(chuàng)新獎、IBM 教授獎等。

  獲獎論文的共同作者 Suresh Thummalapenta 現(xiàn)為微軟研究員。Suresh 在印度安得拉大學獲得學士學位,后在北卡羅來納州立大學獲得碩士學位,并于 2010 年獲得北卡羅來納州立大學計算機科學博士學位。在加入微軟之前,Suresh 在印度 IBM 研究院擁有三年的工作經(jīng)驗。

  


微信圖片_20210517164139.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。