《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 百度NLP十年:語言與知識全布局,重磅推出5款產(chǎn)品新發(fā)布、2大計劃

百度NLP十年:語言與知識全布局,重磅推出5款產(chǎn)品新發(fā)布、2大計劃

2020-08-25
作者: Synced
來源: 機器之心
關(guān)鍵詞: 百度 人工智能 深度學習

  深度學習潮起仿佛還在昨天,百度 NLP 已走過了十年。

  人工智能是一門新興學科嗎?當然不是。但能讓 AI 技術(shù)被上億人每天使用到的,一定是走在最前端的公司。

  在國內(nèi),百度就是這樣一家公司。在人工智能最具挑戰(zhàn)性的方向——自然語言處理(NLP)上,百度一直擁有著技術(shù)優(yōu)勢。8 月 25 日,在百度語言與知識技術(shù)峰會上,百度 CTO 王海峰向我們分享了這家公司在 NLP 領域的技術(shù)創(chuàng)新和產(chǎn)業(yè)實踐,同時也展望了未來的發(fā)展趨勢。

微信圖片_20200825134016.png

  在這個七夕,百度還向我們發(fā)布了不少 NLP「爆款」。

  「語言與知識技術(shù)是人工智能認知能力的核心。2010 年,百度成立自然語言處理部,十年間不斷發(fā)展壯大,」王海峰表示,「在百度語言與知識技術(shù)的布局和發(fā)展中,我們始終注意把握兩個趨勢,即技術(shù)發(fā)展趨勢和產(chǎn)業(yè)發(fā)展的趨勢,并力爭引領趨勢?!?/p>

  隨后,王海峰全面分享了百度語言與知識技術(shù)的完整布局和最新成果。

  十年堅守,一路領先

  經(jīng)過了十余年的發(fā)展,百度已形成了完整的 NLP 技術(shù)布局,包括知識圖譜、語言理解與生成技術(shù),以及應用系統(tǒng)等。知識圖譜包含概念圖譜、實體圖譜等不同類型的圖譜,以及知識挖掘、索引、存儲到知識推理計算的一整套知識相關(guān)的技術(shù)和平臺。語言理解包括基礎的詞法分析和句法分析技術(shù),也包括篇章理解、對話理解、情感分析和語義理解等技術(shù)。而語言生成則覆蓋了從句子、摘要到篇章各種類型的生成技術(shù),以及語言風格轉(zhuǎn)換技術(shù)。

  全球最大知識圖譜

  首先是知識圖譜。知識圖譜是以結(jié)構(gòu)化的形式描述真實世界中的實體、屬性、關(guān)系等,是機器認知世界的重要基礎。百度很早看到了知識圖譜蘊含的潛力,王海峰等人也在自然語言處理部成立之后不久就敲定了在知識圖譜技術(shù)上的研發(fā)投入。2013 年,百度 NLP 就已經(jīng)開發(fā)出了垂類知識圖譜。

  知識圖譜的搭建依賴大量數(shù)據(jù),而百度搜索引擎所蘊含的多源異構(gòu)大規(guī)模數(shù)據(jù)為知識圖譜的發(fā)展提供了天然土壤。此外,百度還創(chuàng)建了一整套構(gòu)建知識圖譜的方法,包括無標簽大數(shù)據(jù)開放知識挖掘技術(shù)、知識體系自擴展的知識圖譜自學習技術(shù)以及融合多源異構(gòu)數(shù)據(jù)的知識補全和知識挖掘技術(shù)。

  基于這些技術(shù),百度創(chuàng)建了世界上最大規(guī)模的知識圖譜。這個知識圖譜擁有超過 50 億實體和 5500 億個事實。

  除了在百度搜索等各類產(chǎn)品中的使用之外,百度的知識圖譜還開放給金融、能源、媒體、政務、教育、司法等各行各業(yè)使用,每天的調(diào)用量已超過 400 億次。

  語言理解領跑全球 NLP 領域

  有了知識之后,下一個問題就是如何基于知識實現(xiàn)語言理解的增強。

  首先是基礎的語義表示。百度提出的知識增強語義理解框架 ERNIE 以知識增強和持續(xù)學習為核心創(chuàng)新點,在深度學習的基礎上融入了知識,通過持續(xù)學習技術(shù)不斷吸收海量數(shù)據(jù)中的詞匯、結(jié)構(gòu)、語義等方面的知識。在最具影響力的 NLP 評測基準 GLUE 上,ERNIE 在 10 個任務中的平均得分首次突破 90,刷新了榜單最高分,超越了人類水平。

  再來看持續(xù)學習的效果。在基線系統(tǒng)的基礎上,百度通過持續(xù)學習機制為 ERNIE 系統(tǒng)增加了百科知識、對話知識、篇章結(jié)構(gòu)知識等,使得模型性能得以持續(xù)提升。

  有了知識圖譜和語義表示之后,下一步就可以做語言理解。以下圖紅框中一句話為例,如何利用這段話推斷出「但使龍城飛將在,不教胡馬度陰山」這首詩的作者?這段話包含兩個名字(「李廣」和「王昌齡」),如果隨機選擇一個作為答案,正確率只有 50%。為了找到正確答案,百度 NLP 將知識作為背景信息融入文本語義表示,增強了模型的語義推理能力。這項閱讀理解技術(shù)在 EMNLP-MRQA 2019 評測中獲得冠軍,取得了 10 項任務的第一名。

  除了文本閱讀理解之外,對話可能是更為常見的一種自然語言理解任務。如何做好對話理解呢?百度 NLP 提出的方法是:先從大規(guī)??缛蝿諏υ捴R中學習通用的語義表示,再利用小樣本學習快速提高新任務的對話理解能力。小樣本學習可以解決新領域語料數(shù)據(jù)不足的難題。

  人認知世界的時候不僅僅是用自然語言,往往是多模態(tài)的語音、視覺、語言,各種信號都會有輸入。因此,百度 NLP 的研究也從自然語言擴展到跨模態(tài)的語義理解。突破跨模態(tài)語義理解技術(shù)面臨兩大難題:一是不同模態(tài)的信息相互獨立,彼此缺乏關(guān)聯(lián);二是不同模態(tài)的信息異構(gòu),語義空間難以融合。

  針對這些難題,百度 NLP 提出了知識增強的跨模態(tài)深度語義理解方法,一是從多源異構(gòu)大數(shù)據(jù)中構(gòu)建大規(guī)模知識圖譜,作為關(guān)聯(lián)跨模態(tài)信息的橋梁;二是語言可以描述不同模態(tài)信息的語義,通過知識增強的自然語言語義表示方法,解決不同模態(tài)語義空間的融合表示難題,從而突破跨模態(tài)語義理解的技術(shù)瓶頸。

  這些技術(shù)突破為人們接觸最多的百度搜索引擎帶來了很多變化?!競鹘y(tǒng)的搜索引擎通過關(guān)鍵詞進行簡單的需求理解,其核心是排序。而近年來,百度搜索已經(jīng)完全進化成了智能搜索引擎?!雇鹾7逭f道。

  現(xiàn)在,你的輸入不僅可以是一個詞、一句話,也可以是語音、圖片。這涉及到語言理解和跨模態(tài)理解,還需要將互聯(lián)網(wǎng)上大量的內(nèi)容與其連接起來,而搜索結(jié)果的排序現(xiàn)在也是基于深度學習和語義表示融合的方法。

  在結(jié)果的呈現(xiàn)上,很多時候搜索引擎給出的答案圖文并茂,這背后則是知識圖譜技術(shù)的支撐。

  語義理解之外,最近 NLP 領域發(fā)展較快的方向是語言生成。基于預訓練模型等技術(shù),百度提出了基于多流機制的語言生成預訓練方法,兼顧詞、短語等不同粒度的語義信息,顯著提升了生成效果。百度也探索了多文檔摘要生成,通過圖結(jié)構(gòu)語義表示,引入篇章知識,新的模型解決了跨文檔領域關(guān)系建模難題。在單文檔和多文檔摘要上,都取得了很大的效果提升。

  從內(nèi)到外的 AI 技術(shù)滲透

  有了知識、語言理解和生成,我們就可以實現(xiàn)自然的人機對話。在基于知識的對話框架下,基于知識,理解對話意圖,規(guī)劃對話路徑。同時,基于用戶的反饋,機器可以學習和積累知識,不斷提高對話的體驗和效率;百度提出了知識圖譜驅(qū)動的對話控制技術(shù),利用知識圖譜提供的語義內(nèi)容和關(guān)聯(lián)信息,幫助對話系統(tǒng)自動規(guī)劃話題路徑,知識之間的關(guān)聯(lián)使得話題可以自然切換,顯著提高對話流暢度和邏輯性。

  在對話生成方面,百度研發(fā)了首個基于隱空間的大規(guī)模開放域?qū)υ捘P?,借助隱空間建模不同的對話回復方式,在對話合理性、內(nèi)容豐富度、吸引力等方面效果突出,中英文效果上都超越了業(yè)內(nèi)最佳的模型和系統(tǒng)。

  「在基于知識的對話框架里,我們實現(xiàn)了在線交互學習,通過主動向用戶發(fā)起交互,機器可以利用用戶的反饋學習新知識,持續(xù)優(yōu)化對話效果,」王海峰說,「整合上述技術(shù),我們研制了智能對話定制與服務平臺,可以幫助開發(fā)者高效構(gòu)建智能對話系統(tǒng),實現(xiàn)規(guī)?;瘧谩!?/p>

  人工智能和 NLP 的經(jīng)典難題——翻譯問題,百度也在不斷打磨。

  百度自 2010 年開始研發(fā)大規(guī)?;ヂ?lián)網(wǎng)機器翻譯,在大規(guī)模翻譯知識獲取、翻譯模型、多語言翻譯、同聲傳譯等方面創(chuàng)新突破,研發(fā)了領先的互聯(lián)網(wǎng)翻譯系統(tǒng),率先上線互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡機器翻譯,實現(xiàn)了機器翻譯的大規(guī)模產(chǎn)業(yè)化應用。在機器翻譯技術(shù)方面,百度提出了多智能體聯(lián)合學習等多項創(chuàng)新技術(shù),效果領先,并在國際評測中獲得第一。

  AI 同聲傳譯方面,百度首次提出了基于語義單元的同傳模型,結(jié)合全局話題及上下文信息進行翻譯,實現(xiàn)了高質(zhì)量低延時的同聲傳譯系統(tǒng),達到了與人類翻譯相當?shù)乃?。針對很多語種數(shù)據(jù)稀缺的問題,百度提出了稀缺語種分組混合訓練算法和多語言聯(lián)合編碼框架,實現(xiàn)了 200 多種語言之間的翻譯。截至目前,百度的翻譯系統(tǒng)已支持 200 多種語言,每天響應超過千億字符的翻譯請求,支持超過 40 多萬家第三方應用。

  「復雜知識表示和快速構(gòu)建技術(shù),知識與深度學習進一步的融合,融合感知與認知的跨模態(tài)語義理解技術(shù),模型可解釋性和魯棒性等方面,仍有很多技術(shù)難題需要研究和解決,」王海峰表示?!傅覀儗ξ磥沓錆M信心,百度會繼續(xù)探索讓機器掌握知識、理解語言、擁有智能的能力。」

  5 款產(chǎn)品新發(fā)布、2 大計劃

  除了這些技術(shù)的總結(jié)和展望之外,在這次活動中,百度還一口氣發(fā)布了文心、TextMind、AI 同傳會議解決方案 3 款新產(chǎn)品,智能創(chuàng)作平臺面向媒體的 3 個場景方案,智能對話定制與服務平臺 UNIT 的 3 項全新升級以及數(shù)據(jù)共建和算力共享計劃。

  語義理解技術(shù)與平臺「文心」

  首先是 NLP 的核心語義理解。目前使用機器做文本處理的需求廣泛存在,通用算法 API 已無法滿足一些場景,而傳統(tǒng)深度學習處理特定任務的方法則需要專業(yè)人員花費大量時間打造。文心基于深度學習平臺飛槳打造,其目標是幫助企業(yè)開發(fā)者更低成本、更方便地將最新的語義理解技術(shù)應用于自己的場景。

  今天所說的「文心」,「是以刷新各項 NLP 任務記錄的 ERNIE 核心技術(shù)為依托,集成優(yōu)秀的預訓練模型、全面的 NLP 算法集、端到端開發(fā)套件和平臺,提供一站式 NLP 開發(fā)與服務。」百度集團副總裁吳甜表示。

  使用這個工具有多方便?吳甜現(xiàn)場以一個情感分析任務為例,將標注好的 100 條商品評論傾向性數(shù)據(jù)導入到平臺(文心也提供智能標注能力),隨后選擇預訓練模型和算法,點擊任務提交,模型開始訓練。訓練結(jié)束后,平臺會對模型效果進行自動評估。最后,訓練好的模型可一鍵發(fā)布,開發(fā)者可通過 API 服務直接進行調(diào)用。

  文心全面降低 NLP 定制開發(fā)成本,將減少開發(fā)者 90% 數(shù)據(jù)標注量、90% 算力投入、85% 模型開發(fā)時長。

  百度表示,文心在各類真實場景中淬煉,已具備領先的工業(yè)級應用實力。目前,文心廣泛用于百度產(chǎn)品中,累計支持業(yè)界開發(fā)者超過 2 萬名,應用場景覆蓋金融、通信、教育、電商等各行各業(yè),顯著提升企業(yè) NLP 應用效果和效率。

  智能文檔分析平臺 TextMind

  有可供開發(fā)定制模型的平臺,也有普通人直接可以上手的 AI 辦公套件。百度發(fā)布的 TextMind 是一款企業(yè)文檔分析平臺,目前已提供包括文檔解析、文檔比對、文檔審核在內(nèi)的一站式解決方案。

  這款工具的特點簡單說來就是「多快好省」:它支持多達 20 類文檔、6 種格式;可以讓之前需要 3-5 個工作日的工作 1 分鐘完成;預置文檔解析能力,企業(yè)開箱即用,實現(xiàn)零門檻定制;在文檔規(guī)范化解析應用之后,公司相應的人力成本可以降低 80% 以上。

  除了語言理解,還有可以生成內(nèi)容的產(chǎn)品。2019 年初,百度智能創(chuàng)作平臺上線,目前在媒體等行業(yè)已有很多應用。本次平臺的升級面向媒體推出 3 個場景方案,可以讓 AI 幫媒體人更好地進行創(chuàng)作。

  智能創(chuàng)作平臺

  此前,百度的智能創(chuàng)作平臺已具備豐富的輔助創(chuàng)作和自動創(chuàng)作能力,廣泛服務于內(nèi)容創(chuàng)作機構(gòu)與個人。在上線之后的 4 個多月里,圖文轉(zhuǎn)視頻功能已被 7000 多家用戶使用,自動創(chuàng)作短視頻超過 15 萬條,相當于一個人 100 年的工作量。一年多以來,AI 的自動創(chuàng)作文章也已累計超過 200 萬篇。

  具體來說,百度的創(chuàng)作工具已得到了 20 多家媒體的應用,包括人民日報,央視網(wǎng)等。在合作的過程中,百度積累了更多經(jīng)驗,本次推出的新版本包含智能策劃、智能采編和智能審校 3 大場景方案。

  智能對話定制與服務平臺 UNIT

  對話方面,智能對話定制與服務平臺 UNIT 推出三大升級,進一步降低任務式對話、智能問答的定制成本,并融合通用對話能力,提升交互體驗。

  UNIT 任務式對話理解,通過升級了小樣本意圖理解能力,并新增了詞槽值口語化同義詞的自動推薦、詞槽修飾關(guān)系的自動識別,數(shù)據(jù)標注成本進一步降低了 30% 以上。

  表格問答能力,讓開發(fā)者只需要上傳業(yè)務數(shù)據(jù)表格,「只需 1 分鐘的自動分析,UNIT 生成的問答機器人就可以準確回答大部分事實型問題。再進行 1 小時左右的人工調(diào)優(yōu),問答機器人可以達到以往至少通過 2 周人工整理 FAQ 建設才能達到的問答系統(tǒng)水平?!箙翘鹫f道。UNIT 不僅集成了業(yè)界領先的通用對話技術(shù) PLATO,還推出新一代融合任務式對話和通用對話的引擎,讓對話系統(tǒng)不僅干練辦事,還能順暢交互。

  AI 同傳會議解決方案

  與其他公司需要一些專業(yè)設備的方式不同,百度的 AI 同傳可以讓你只用一臺電腦,一部手機,就快速搭建起一套同傳服務。

  「無論線上遠程會議室還是線下會議,主題演講還是多人討論,使用百度的解決方案,每一場會議都能做到讓人彼此聽懂,」吳甜介紹道?!冈谘麥y期間,這項技術(shù)已經(jīng)支持了上百場會議,覆蓋數(shù)十個領域,是一套經(jīng)過了實踐檢驗、成熟可靠的解決方案?!?/p>

  在會議的每一個環(huán)節(jié),百度的服務都不缺席。在會議開始前,百度同傳可以根據(jù)會議涉及的特定領域進行術(shù)語定制,以應對專業(yè)議題中獨有的釋義,提高準確度。在會議中,百度的工具支持雙語字幕投屏和手機邊聽邊看。而且在正在進行的講話中,人們也可以隨時進行術(shù)語釋義修改,結(jié)果實時生效。在會議結(jié)束后,系統(tǒng)還會自動生成會議記錄,并保存到網(wǎng)盤中。

  百度不僅提供成型的工具,也歡迎開發(fā)者在算法等組件的基礎上自行開發(fā)——AI 同傳中使用的技術(shù),已經(jīng)同步面向所有人開放。

  數(shù)據(jù)共建與算力共享計劃

  除產(chǎn)品新發(fā)布之外,百度技術(shù)委員會主席吳華在峰會上公布了千言數(shù)據(jù)共建計劃和百度語言與知識算力共享計劃。

  百度聯(lián)合中國計算機學會、中國中文信息學會發(fā)起全球最大中文自然語言處理數(shù)據(jù)共建計劃——千言,解決數(shù)據(jù)稀缺問題。千言一期由來自國內(nèi) 11 家高校和企業(yè)的數(shù)據(jù)資源研發(fā)者共同建設,已涵蓋開放域?qū)υ?、閱讀理解等 7 大任務,20 余個中文開源數(shù)據(jù)集。百度技術(shù)委員會主席吳華表示,“我們計劃在未來 3 年,面向 20 多個任務,收集和建設不少于 100 個中文自然語言處理數(shù)據(jù)集,覆蓋語言與知識技術(shù)全部領域?!?/p>

  吳華還發(fā)布了百度語言與知識技術(shù)算力助力計劃,通過百度 AI STUDIO 平臺提供算力支持,讓廣大開發(fā)者破除算力桎梏,專注于技術(shù)創(chuàng)新。

  百度 NLP 強大的技術(shù),離不開過硬的人才支撐。在這十多年的時間里,百度 NLP 聚集了一大批兼具扎實技術(shù)實力和實踐經(jīng)驗的 AI 人才。在這次活動中,百度首次向業(yè)內(nèi)介紹了這家公司 NLP 十年的「代表人物」。

  百度 NLP 十年十人

  2010 年 1 月,自然語言處理領域知名專家王海峰博士加盟百度,成立了「自然語言處理部」?!噶⒆惆俣?,扎根中國,胸懷世界,成為有豐富產(chǎn)出及廣泛影響力的國際一流自然語言處理研發(fā)團隊」是當時立下的愿景。

  十年征程,百度語言與知識技術(shù)發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會上,百度推出以王海峰為代表的百度 NLP“十年十人”,他們是:

  王海峰,百度首席技術(shù)官,ACL 主席(2013),AACL 創(chuàng)始主席,ACL Fellow,中國中文信息學會副理事長。

  Kenneth Church,Baidu Research Fellow,ACL 主席(2012),ACL Fellow,EMNLP 創(chuàng)始人。

  呂雅娟,百度高級科學家知識圖譜技術(shù)負責人、中國計算機學會中文信息技術(shù)專委會副主任(2015-2019)。

  吳華,百度技術(shù)委員會主席,ACL Program Chair(2014)。

  黃亮,百度杰出架構(gòu)師、IDL(美國)主任,ACL Area Chair (2012, 2014, 2018, 2019)。

  吳甜,百度集團副總裁。

  趙世奇,百度 MEG 用戶產(chǎn)品策略平臺負責人,ACL 秘書長(2016-2020)。

  田浩,百度研究院首席架構(gòu)師。

  何中軍,百度人工智能技術(shù)委員會主席。

  于佃海,百度飛槳平臺總架構(gòu)師。

  十年堅守,他們堅持技術(shù)信仰,勇攀技術(shù)高峰,致力于讓機器掌握知識、理解語言、擁有智能,更好地服務于人們的生產(chǎn)、生活。以他們?yōu)榇淼陌俣日Z言與知識技術(shù)團隊取得了豐碩的成果,獲得包括國家科技進步獎在內(nèi)的 20 多個獎項,30 多項國際競賽冠軍,發(fā)表學術(shù)論文超過 300 篇,申請專利 2000 多項?!甘陙?,我們始終如一,用技術(shù)上的持續(xù)突破創(chuàng)新和應用上的碩果累累,踐行了我們的使命,實現(xiàn)了我們的愿景?!雇鹾7灞硎尽?/p>

  讓我們期待百度大腦語言與知識能力帶來更多驚喜,為技術(shù)和社會進步做出更大貢獻。

編輯:澤南、張倩

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。