《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 北大謝濤獲ASE 2021最有影響力論文獎,成為首位華人獲獎學者

北大謝濤獲ASE 2021最有影響力論文獎,成為首位華人獲獎學者

2021-07-29
來源:機器之心
關(guān)鍵詞: 謝濤 軟件工程

  一篇發(fā)表于 ASE 2007 的經(jīng)典論文,讓 ASE 2021 將「最有影響力論文」獎項頒給了北京大學教授謝濤和當時的博士生 Suresh Thummalapenta。

  近日,軟件工程國際頂級會議 ASE 2021 公布了「最有影響力論文」獎項(Most Influential Paper Award),北京大學計算機科學技術(shù)系講席教授謝濤和他早年指導(dǎo)的前北卡州立大學博士生 Suresh Thummalapenta 共同獲獎。

  ASE 是軟件工程領(lǐng)域的頂級國際會議,創(chuàng)辦于 1986 年。一般來說,年度 ASE 最有影響力論文獎是從之前 15 年左右(包括 14、15、16 年前)在 ASE 會議上所發(fā)表所有論文中選出最具影響力的論文。本次獲獎的論文是謝濤與 Suresh Thummalapenta 合作的 ASE 2007 年論文《PARSEWeb:A Programmer Assistant for Reusing Open Source Code on the Web》。

  論文鏈接:https://taoxiease.github.io/publications/ase07-parseweb.pdf

  這一研究是從 ASE 2006、ASE 2007、ASE 2008 三年 181 篇被錄用論文(三年共 713 篇投稿)中選出來的獲獎?wù)撐摹?/p>

  在軟件工程三大國際頂會 ICSE、ESEC/FSE、ASE 的歷年最有影響力論文獎(ICSE MIP Award,ESEC/FSE Test of Time Award, ASE MIP Award)獲獎作者中,謝濤是三位華人之一(另外兩位是 Hongjun Zheng 和 Amy J. Ko),也是迄今獲得 ASE 最有影響力論文獎的唯一華人作者。

  在今年 11 月將線上舉行的 ASE 2021 會議中,謝濤教授和 Suresh Thummalapenta 博士將在特邀大會報告中對該論文及其影響力進行分享。

  獲獎?wù)撐慕榻B

  程序員通常重用現(xiàn)有的框架或者數(shù)據(jù)庫來減少軟件開發(fā)工作量,其中的常見問題是,程序員知道他們需要什么類型的對象,但不知道如何使用特定的方法序列獲得該對象。

  為了解決這個問題,謝濤和 Suresh Thummalapenta 開發(fā)了一種方法,以「 Source object type → Destination object type」形式的查詢作為輸入,并推薦常用的 Method-Invocation Sequence(MIS),MIS 可以將 Source 類型的對象轉(zhuǎn)換為 Destination 類型的對象。該方法使用代碼搜索引擎(CSE)來收集相關(guān)的代碼樣本,并對其進行靜態(tài)分析以提取所需的序列。由于代碼樣本是通過 CSE 按需收集的,因此該方法并不局限于任何特定框架或庫的查詢。

  他們使用一個名為 PARSEWeb 的工具實現(xiàn)了該方法。PARSEWeb 與 GCSE 協(xié)同,以搜索具有給定 Source 和 Destination 對象類型用法的代碼示例,并下載代碼示例結(jié)果以形成本地源代碼存儲庫。PARSEWeb 分析本地源代碼存儲庫,使用序列后處理器提取不同的 MIS,并聚集類似的 MIS。提取的 MIS 可以作為給定查詢的解決方案。PARSEWeb 使用幾個排序啟發(fā)式方法對最后一組 MIS 進行排序。此外,PARSEWeb 還使用一種叫做查詢分割的額外的啟發(fā)式方法,它有助于解決給定查詢的代碼示例被分割到不同源文件中的問題。

  在實驗階段,研究者進行了四種不同的評估,表明該方法在解決程序員的查詢需求方面是有效的,此外還證明了 PARSEWeb 比此前的相關(guān)工具(Prospector 和 Strathcona )表現(xiàn)更好。

  PARSEWeb 這項研究首次把數(shù)據(jù)挖掘和機器學習所用的軟件制品數(shù)據(jù)源從單個或幾個開源系統(tǒng)拓寬到整個互聯(lián)網(wǎng)上的軟件制品,成為大代碼、軟件大數(shù)據(jù)重要產(chǎn)業(yè)和學術(shù)方向的先驅(qū)「開荒者」。這個范圍的拓寬是基于代碼搜索和代碼挖掘的有機結(jié)合,有效地解決了在輔助軟件工程任務(wù)時相關(guān)數(shù)據(jù)點不足的問題。

  這篇獲獎?wù)撐囊彩菙?shù)據(jù)驅(qū)動的智能化軟件開發(fā)領(lǐng)域的最早期經(jīng)典代表作之一,以大代碼挖掘的手段來實現(xiàn)智能「程序員助手」。其所貢獻的技術(shù)首次有效地解決了在一個特定軟件開發(fā)問題上的數(shù)據(jù)驅(qū)動軟件自動化:如何自動地合成方法調(diào)用序列來獲取一個給定類的對象。

  根據(jù) Google Scholar,該論文當前引用數(shù)超過 510 次。盡管該論文比其它歷年獲獎?wù)撐囊l(fā)表得晚,該論文在歷年獲得 ASE 最有影響力論文獎的 13 篇論文之中引用數(shù)排名第 4。

  關(guān)于謝濤教授

  謝濤 1997 年本科畢業(yè)于復(fù)旦大學,2000 年在北京大學獲得計算機科學技術(shù)的碩士學位(師從梅宏教授),并于 2002 年和 2005 年在美國西雅圖華盛頓大學獲得計算機科學技術(shù)的碩士和博士學位(師從 David Notkin 教授),目前是美國伊利諾伊大學香檳分校有終身教職的正教授。之前他從 2010 年 8 月到 2013 年 6 月為美國北卡州立大學有終身教職的副教授 (提前一年晉升),2005 年 8 月到 2010 年 7 月為美國北卡州立大學助理教授。他曾在微軟亞洲研究院和微軟研究院(雷德蒙)擔任訪問研究員,并常年擔任微軟研究院和華為公司的咨詢顧問。

  謝濤是美國 AAAS Fellow、IEEE Fellow、ACM 杰出科學家、CCF 杰出會員,曾獲 2020 年科學探索獎,國家自然科學基金委海外杰出青年科學基金以及其延續(xù)資助、美國 NSF Faculty CAREER Award、ACM SIGSOFT 杰出服務(wù)獎、IEEE 計算機協(xié)會軟件工程技術(shù)委員會(TCSE)杰出服務(wù)獎等。

  謝濤的主要研究領(lǐng)域包括軟件工程,系統(tǒng)軟件,軟件安全,做出了一系列對軟件產(chǎn)業(yè)有高影響的研究工作,曾獲微軟研究院杰出合作者獎(全球 32 位獲獎教授之一)、微軟研究軟件工程創(chuàng)新基礎(chǔ)獎、谷歌教授研究獎、Facebook 研究獎、IBM Jazz 創(chuàng)新獎、IBM 教授獎等。

  獲獎?wù)撐牡墓餐髡?Suresh Thummalapenta 現(xiàn)為微軟研究員。Suresh 在印度安得拉大學獲得學士學位,后在北卡羅來納州立大學獲得碩士學位,并于 2010 年獲得北卡羅來納州立大學計算機科學博士學位。在加入微軟之前,Suresh 在印度 IBM 研究院擁有三年的工作經(jīng)驗。

  


微信圖片_20210517164139.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。