《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > 谷歌開源學(xué)習(xí)框架如此受歡迎?下載次數(shù)已超 4100萬

谷歌開源學(xué)習(xí)框架如此受歡迎?下載次數(shù)已超 4100萬

2019-06-12
關(guān)鍵詞: 谷歌 AI TensorFlow.Text PIP

  谷歌今天介紹了TensorFlow.Text,一個使用TensorFlow預(yù)處理語言模型的庫。由谷歌Brain團(tuán)隊(duì)創(chuàng)建的開源機(jī)器學(xué)習(xí)框架已經(jīng)被下載了4100多萬次。

  TensorFlow.Text可以使用PIP安裝,并附帶使用記號來拆分和分析文本(如單詞、數(shù)字和標(biāo)點(diǎn)符號)的功能。

  在啟動時(shí),TensorFlow.Text可以識別空白、unicode腳本和預(yù)先確定的單詞片段序列,比如谷歌調(diào)用的后綴或前綴。單詞通常用于BERT之類的方法中,BERT是去年秋季為谷歌開源語言模型提供的一種預(yù)培訓(xùn)技術(shù)。

5cff5ad3adae7-thumb.jpg

  根據(jù)媒體發(fā)布的消息,該庫還附帶用于標(biāo)準(zhǔn)化的ops、n-grams和用于標(biāo)記的序列限制。

  TensorFlow.Text的標(biāo)記器使用RaggedTensors,這是一種新的文本識別張量。谷歌工程師Mark Omernick在今年早些時(shí)候的TensorFlow開發(fā)峰會上首次詳細(xì)介紹了RaggedTensors和Unicode對TensorFlow的支持。

  這一消息是在TensorFlow 2.0 beta版發(fā)布幾天后公布的。谷歌的開源框架的最新版本是在3月份的TensorFlow開發(fā)峰會上以alpha版本發(fā)布的。TensorFlow 2.0使用更少的APIs、更深層次的Keras integration以及對運(yùn)行時(shí)的改進(jìn),以實(shí)現(xiàn)快速執(zhí)行。

  TensorFlow.Text是谷歌在過去幾個月推出的最新專用庫,用于幫助人們完成機(jī)器學(xué)習(xí)的特定任務(wù)。上個月發(fā)布的TensorFlow Graphics旨在為圖形和3D模型帶來更多的深度學(xué)習(xí)。

  谷歌在今年早些時(shí)候表示,也許最受歡迎的是用于嵌入式設(shè)備的TensorFlow Lite,目前有超過20億臺設(shè)備在使用它。谷歌使用TensorFlow Lite支持GBoard上的語音檢測和谷歌照片中的邊緣檢測等功能。

  今年3月,谷歌推出了TensorFlow Privacy和TensorFlow Federated,這是一種能更好地保護(hù)用戶隱私的設(shè)備內(nèi)置機(jī)器學(xué)習(xí)方法。該公司將其視為開發(fā)人員優(yōu)先考慮隱私的一種方式。面向JavaScript和iOS開發(fā)人員的框架版本TensorFlow.js和TensorFlow Swift今年春季也得到了升級。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。