国产精品一区理论片,国产亚洲精品久久久久的角色,丁香伊人五月综合激激激

既保護(hù)隱私又快速訓(xùn)練，F(xiàn)acebook開源Opacus庫(kù)，利用差分隱私訓(xùn)練PyTorch模型

日期： 2020-09-01

來(lái)源：機(jī)器之心

關(guān)鍵詞： 隱私保護(hù) 機(jī)器學(xué)習(xí) Facebook

　　隱私保護(hù)是機(jī)器學(xué)習(xí)領(lǐng)域的重要倫理問(wèn)題之一，而差分隱私（DP）是行之有效的隱私保護(hù)手段。那么，如何方便地使用差分隱私來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型呢？近日，Facebook 開源了 Opacus 庫(kù)，支持以這種方式訓(xùn)練 PyTorch 模型。

　　近日，F(xiàn)acebook 開源了一個(gè)新型庫(kù) Opacus，它支持使用差分隱私來(lái)訓(xùn)練 PyTorch 模型，擴(kuò)展性優(yōu)于目前的 SOTA 方法。同時(shí)，Opacus 庫(kù)支持以最少代碼更改來(lái)訓(xùn)練模型，且不會(huì)影響訓(xùn)練性能，并允許在線跟蹤任意給定時(shí)刻的隱私預(yù)算。

　　Opacus 庫(kù)開源地址：https://github.com/pytorch/opacus

　　Opacus 庫(kù)的目標(biāo)受眾主要為以下兩類人群：

　　機(jī)器學(xué)習(xí)從業(yè)者：可以使用該庫(kù)輕松了解如何利用差分隱私訓(xùn)練模型，該庫(kù)支持以最少代碼更改來(lái)訓(xùn)練模型；

　　差分隱私科學(xué)家：Opacus 庫(kù)易于實(shí)驗(yàn)和修復(fù)，這允許他們專注于更重要的事。

　　差分隱私是一個(gè)具備數(shù)學(xué)嚴(yán)謹(jǐn)性的框架，可用于量化敏感數(shù)據(jù)的匿名化。Facebook 在相關(guān)博客中表示，希望 Opacus 庫(kù)能為研究人員和工程師提供一條更簡(jiǎn)單的途徑，以便在 ML 中使用差分隱私，并加快該領(lǐng)域的 DP 研究。

　　Opacus 庫(kù)提供了什么？

　　通過(guò)這個(gè)開源的高速庫(kù) Opacus，你可以得到：

　　速度：利用 PyTorch 中的 Autograd hook，Opacus 能夠批量化計(jì)算每個(gè)樣本的梯度。與依賴 microbatching 的現(xiàn)有 DP 庫(kù)相比，Opacus 實(shí)現(xiàn)了一個(gè)數(shù)量級(jí)的加速。

　　安全性：Opacus 對(duì)其安全關(guān)鍵代碼使用密碼學(xué)安全偽隨機(jī)數(shù)生成器 CSPRNG，在 GPU 上對(duì)整批參數(shù)進(jìn)行高速處理。

　　靈活性：基于 PyTorch，工程師和研究人員可以通過(guò)將 Opacus 代碼與 PyTorch 代碼和純 Python 代碼進(jìn)行融合和匹配，快速為其 idea 構(gòu)建原型。

　　生產(chǎn)效率：Opacus 庫(kù)附帶教程、在訓(xùn)練開始前提示不兼容層的輔助函數(shù)，以及自動(dòng)重構(gòu)機(jī)制。

　　交互性：Opacus 可以追蹤用戶在任意給定時(shí)間所花費(fèi)的隱私預(yù)算（DP 的核心數(shù)學(xué)概念），從而實(shí)現(xiàn)早停和實(shí)時(shí)監(jiān)控。

　　Opacus 通過(guò)引入 PrivacyEngine abstraction 定義了一個(gè)輕量級(jí)的 API，它既可以追蹤隱私預(yù)算，也能夠處理模型梯度。該 API 無(wú)需直接調(diào)用，只需將其連接至標(biāo)準(zhǔn) PyTorch 優(yōu)化器。該 API 在后臺(tái)運(yùn)行，這使得利用 Opacus 進(jìn)行模型訓(xùn)練變得非常簡(jiǎn)單。用戶只需在訓(xùn)練代碼開頭添加以下代碼即可：

　　model = Net（）

　　optimizer = torch.optim.SGD（model.parameters（）， lr=0.05）

　　privacy_engine = PrivacyEngine（

　　model,

　　batch_size=32,

　　sample_size=len（train_loader.dataset），

　　alphas=range（2,32），

　　noise_multiplier=1.3,

　　max_grad_norm=1.0,）

　　privacy_engine.attach（optimizer）# That's it! Now it's business as usual

　　訓(xùn)練結(jié)束，即得到一個(gè)標(biāo)準(zhǔn)的 PyTorch 模型，并且它沒有部署私有模型的額外步驟或障礙：如果今天就想部署模型，你可以在使用 DP 訓(xùn)練模型后進(jìn)行部署，且無(wú)需更改一行代碼。

　　Opacus 庫(kù)還包括預(yù)訓(xùn)練和微調(diào)模型、針對(duì)大型模型的教程，以及為隱私研究實(shí)驗(yàn)而設(shè)計(jì)的基礎(chǔ)架構(gòu)。

　　如何使用 Opacus 實(shí)現(xiàn)高速隱私訓(xùn)練？

　　Opacus 旨在保留每個(gè)訓(xùn)練樣本的隱私，同時(shí)盡量不影響最終模型的準(zhǔn)確率。Opacus 通過(guò)修改標(biāo)準(zhǔn) PyTorch 優(yōu)化器來(lái)實(shí)現(xiàn)這一點(diǎn)，以便在訓(xùn)練過(guò)程中實(shí)現(xiàn)（和度量）差分隱私。

　　具體來(lái)說(shuō)，Opacus 的重點(diǎn)是差分隱私隨機(jī)梯度下降（DP-SGD）。該算法的核心思想是：通過(guò)干預(yù)模型用來(lái)更新權(quán)重的參數(shù)梯度來(lái)保護(hù)訓(xùn)練集的隱私，而不是直接獲取數(shù)據(jù)。通過(guò)在每次迭代中向梯度添加噪聲，該庫(kù)可以防止模型記住訓(xùn)練樣本，同時(shí)還可以實(shí)現(xiàn)在 aggregate 中的學(xué)習(xí)。在訓(xùn)練過(guò)程的多個(gè)批次中，（無(wú)偏）噪聲自然會(huì)被抵消。

　　但是，添加噪聲需要一種微妙的平衡：噪聲過(guò)多會(huì)破壞信號(hào)，過(guò)少則無(wú)法保證隱私。為了確定合適的規(guī)模，我們需要查看梯度范數(shù)。限制每個(gè)樣本對(duì)梯度的影響非常重要，因?yàn)楫惓Ｖ档奶荻却笥诖蟛糠謽颖?。但是異常值的隱私也需要得到保護(hù)，因?yàn)樗鼈儤O有可能被模型記住。

　　因此，開發(fā)者計(jì)算 minibatch 中每個(gè)樣本的梯度。開發(fā)者分別對(duì)每個(gè)梯度進(jìn)行梯度裁剪，將其累積到一個(gè)梯度張量，然后再將噪聲添加其中。

　　基于每個(gè)樣本的計(jì)算是構(gòu)建 Opacus 的最大障礙之一。PyTorch 的典型操作是利用 Autograd 計(jì)算整個(gè)批次的梯度張量，因?yàn)檫@對(duì)其他機(jī)器學(xué)習(xí)用例都有意義，并且可以優(yōu)化性能。與之相比，基于每個(gè)樣本的計(jì)算顯然更具挑戰(zhàn)性。

　　為了克服這一困難，開發(fā)者利用 Ian Goodfellow 2015 年提出的高效技術(shù)（參見論文《EFFICIENT PER-EXAMPLE GRADIENT COMPUTATIONS》），獲取訓(xùn)練標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)所需的全部梯度向量。

　　至于模型參數(shù)，則單獨(dú)返回給定批次中每個(gè)樣本的損失梯度，整個(gè)過(guò)程如下所示：

　　Opacus 工作流程圖，其中計(jì)算了每個(gè)樣本的梯度。

　　通過(guò)在運(yùn)行各層時(shí)追蹤一些中間量，Opacus 庫(kù)支持使用適合內(nèi)存的任何批量大小進(jìn)行訓(xùn)練。這使得該方法比其他替代性 micro-batch 方法快了一個(gè)數(shù)量級(jí)。

　　此外，Opacus 庫(kù)的安裝和使用過(guò)程也比較簡(jiǎn)單，詳情參見 GitHub 項(xiàng)目。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

既保護(hù)隱私又快速訓(xùn)練，F(xiàn)acebook開源Opacus庫(kù)，利用差分隱私訓(xùn)練PyTorch模型

日期： 2020-09-01

來(lái)源：機(jī)器之心

相關(guān)內(nèi)容

既保護(hù)隱私又快速訓(xùn)練，F(xiàn)acebook開源Opacus庫(kù)，利用差分隱私訓(xùn)練PyTorch模型