亚洲综合丝袜美腿_精品一区二区免费_日韩视频一区二区三区在线播放 _7878成人国产在线观看_精品一区二区三区视频在线观看_1024亚洲合集_日韩美女在线视频_欧美怡红院视频_国产一区 二区_亚洲视频 欧洲视频_99精品一区二区_亚洲va欧美va人人爽午夜_精品国产一区二区三区不卡_蜜臀av一区二区_欧美日韩精品一区二区_亚洲精品中文在线

當(dāng)前位置: 首頁(yè) > 科技新聞 >

BERT, RoBERTa, DistilBERT, XLNet的用法對(duì)比

時(shí)間:2019-11-13 01:05來(lái)源:網(wǎng)絡(luò)整理 瀏覽:
雷鋒網(wǎng)AI科技評(píng)論編者按:BERT, RoBERTa, DistilBERT, XLNet到底哪家強(qiáng)?在不同的研究領(lǐng)域和應(yīng)用場(chǎng)景如何選擇成了

雷鋒網(wǎng)AI科技評(píng)論編者按:BERT, RoBERTa, DistilBERT, XLNet到底哪家強(qiáng)?在不同的研究領(lǐng)域和應(yīng)用場(chǎng)景如何選擇成了大難題。凡事莫慌,這篇文章幫你理清思路。

BERT以及后續(xù)模型

谷歌基于transformer的BERT系列一經(jīng)問(wèn)世就在NLP領(lǐng)域掀起了一場(chǎng)風(fēng)暴,在幾項(xiàng)任務(wù)中的表現(xiàn)可謂勢(shì)頭強(qiáng)勁,已經(jīng)超越了先前沿用的最先進(jìn)的技術(shù)。最近,谷歌對(duì)BERT進(jìn)行了改版,我將對(duì)比改版前后主要的相似點(diǎn)和不同點(diǎn),以便你可以選擇在研究或應(yīng)用中使用哪一種。

BERT是一個(gè)雙向transformer,用于對(duì)大量未標(biāo)記的文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,以學(xué)習(xí)一種語(yǔ)言表示形式,這種語(yǔ)言表示形式可用于對(duì)特定機(jī)器學(xué)習(xí)任務(wù)進(jìn)行微調(diào)。雖然BERT在幾項(xiàng)任務(wù)中的表現(xiàn)都優(yōu)于NLP領(lǐng)域沿用過(guò)的最先進(jìn)的技術(shù),但其性能的提高主要還是歸功于雙向transformer、掩蔽語(yǔ)言模型對(duì)任務(wù)的訓(xùn)練以及結(jié)構(gòu)預(yù)測(cè)功能,還包括大量的數(shù)據(jù)和谷歌的計(jì)算能力。

最近,又提出了幾種方法改進(jìn)BERT的預(yù)測(cè)指標(biāo)或計(jì)算速度,但是始終達(dá)不到兩者兼顧。XLNet和RoBERTa改善了性能,而DistilBERT提高了推理速度。下表對(duì)它們進(jìn)行了比較:

BERT, RoBERTa, DistilBERT, XLNet的用法對(duì)比

圖1:比較BERT和最近的一些改進(jìn)情況

  • GPU計(jì)算時(shí)間是估算的(使用4個(gè)TPU Pod進(jìn)行為時(shí)4天的原始訓(xùn)練)

  • 使用大量的小批次數(shù)據(jù),根據(jù)掩蔽程序的差異進(jìn)行學(xué)習(xí)速度和延長(zhǎng)時(shí)間的訓(xùn)練

  • 數(shù)據(jù)來(lái)源是原始論文

XLNet是一種大型雙向transformer,它使用的是改進(jìn)過(guò)的訓(xùn)練方法,這種訓(xùn)練方法擁有更大的數(shù)據(jù)集和更強(qiáng)的計(jì)算能力,在20個(gè)語(yǔ)言任務(wù)中XLNet比BERT的預(yù)測(cè)指標(biāo)要更好。

為了改進(jìn)訓(xùn)練方法,XLNet引入了置換語(yǔ)言建模,其中所有標(biāo)記都是按隨機(jī)順序預(yù)測(cè)的。這與BERT的掩蔽語(yǔ)言模型形成對(duì)比,后者只預(yù)測(cè)了掩蔽(15%)標(biāo)記。這也顛覆了傳統(tǒng)的語(yǔ)言模型,在傳統(tǒng)語(yǔ)言模型中,所有的標(biāo)記都是按順序而不是按隨機(jī)順序預(yù)測(cè)的。這有助于模型學(xué)習(xí)雙向關(guān)系,從而更好地處理單詞之間的關(guān)系和銜接。此外使用Transformer XL做基礎(chǔ)架構(gòu),即使在不統(tǒng)一排序訓(xùn)練的情況下也能表現(xiàn)出良好的性能。

XLNet使用了超過(guò)130 GB的文本數(shù)據(jù)和512 TPU芯片進(jìn)行訓(xùn)練,運(yùn)行時(shí)間為2.5天,XLNet用于訓(xùn)練的資料庫(kù)要比BERT大得多。

RoBERTa,在Facebook上推出的Robustly是BERT的優(yōu)化方案,RoBERTa在BERT的基礎(chǔ)上進(jìn)行再訓(xùn)練,改進(jìn)了訓(xùn)練方法,還增加了1000%的數(shù)據(jù),強(qiáng)化了計(jì)算能力。

為了優(yōu)化訓(xùn)練程序,RoBERTa從BERT的預(yù)訓(xùn)練程序中刪除了結(jié)構(gòu)預(yù)測(cè)(NSP)任務(wù),引入了動(dòng)態(tài)掩蔽,以便在訓(xùn)練期間使掩蔽的標(biāo)記發(fā)生變化。在這過(guò)程中也證實(shí)了大批次的訓(xùn)練規(guī)模在訓(xùn)練過(guò)程中的確更有用。

重要的是,RoBERTa使用160 GB的文本進(jìn)行預(yù)訓(xùn)練,其中包含了16GB的文本語(yǔ)料庫(kù)和BERT使用的英文Wikipedia。其他數(shù)據(jù)包括CommonCrawl News數(shù)據(jù)集(6300萬(wàn)篇文章,76 GB),Web文本語(yǔ)料庫(kù)(38GB)和普通爬蟲(chóng)的故事(31 GB)。再加上1024個(gè) V100的Tesla GPU每天都在運(yùn)行,這使得RoBERTa具備了進(jìn)行預(yù)訓(xùn)練的基礎(chǔ)。

因此,RoBERTa在GLUE基準(zhǔn)測(cè)試結(jié)果上優(yōu)于BERT和XLNet。

另一方面,為了減少BERT或相關(guān)模型的計(jì)算(訓(xùn)練,預(yù)測(cè))時(shí)間,理應(yīng)選擇使用較小的網(wǎng)絡(luò)以達(dá)到相似的性能。其實(shí)有許多方法可以做到這一點(diǎn),包括剪枝,蒸餾和量化,然而,所有這些都會(huì)導(dǎo)致預(yù)測(cè)指標(biāo)更低。

DistilBERT學(xué)習(xí)了BERT的蒸餾(近似)版本,保留了95%的性能,但只使用了一半的參數(shù)。具體來(lái)說(shuō),它沒(méi)有標(biāo)記類(lèi)型和池化層的嵌入,只保留了谷歌BERT中一半的層。DistilBERT使用了一種叫做蒸餾的技術(shù),它與谷歌的BERT(也就是由較小的神經(jīng)網(wǎng)絡(luò)構(gòu)成大型神經(jīng)網(wǎng)絡(luò))相似。這個(gè)原理是,一旦要訓(xùn)練一個(gè)大型神經(jīng)網(wǎng)絡(luò),就可以使用較小的網(wǎng)絡(luò)來(lái)預(yù)估其完整的輸出分布。這在某種意義上類(lèi)似于后驗(yàn)近似。在貝葉斯統(tǒng)計(jì)中用于后驗(yàn)近似的關(guān)鍵優(yōu)化函數(shù)之一是Kulback Leiber散度,自然在這里也被用到了。

雷鋒網(wǎng)提示:在貝葉斯統(tǒng)計(jì)中,我們接近真實(shí)的后驗(yàn)值(來(lái)自數(shù)據(jù)),而對(duì)于蒸餾,我們只能做到接近在較大網(wǎng)絡(luò)中學(xué)習(xí)到的后驗(yàn)值。

如何使用

如果你真的需要推理速度快一點(diǎn),可以接受代價(jià)是預(yù)測(cè)精度稍微下降那么一些的話,那么DistilBERT會(huì)是一個(gè)合適的選擇,但是,如果你還在尋找最佳的預(yù)測(cè)性能,你最好使用Facebook的RoBERTa。

從理論上講,基于XLNet置換的訓(xùn)練應(yīng)該能處理好依賴關(guān)系,并且可能在長(zhǎng)期運(yùn)行中能表現(xiàn)出更好的性能。

但是,Google的BERT確實(shí)提供了良好的基線,如果你沒(méi)有上述任何關(guān)鍵需求,就可以使用BERT維持系統(tǒng)的正常運(yùn)行。

總結(jié)

大多數(shù)性能的改善(包括BERT本身)都是由于增加了數(shù)據(jù)量,計(jì)算能力或訓(xùn)練過(guò)程。雖然它們確實(shí)具有自己的價(jià)值,但它們往往傾向于在計(jì)算和預(yù)測(cè)指標(biāo)之間進(jìn)行權(quán)衡。當(dāng)前真正需要的是在使用更少的數(shù)據(jù)和計(jì)算資源的同時(shí)還可以使性能得到基本的改進(jìn)。(雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))

原文作者:SuleimanKhan

原文鏈接:https://towardsdatascience.com/bert-roberta-distilbert-xlnet-which-one-to-use-3d5ab82ba5f8

BERT, RoBERTa, DistilBERT, XLNet的用法對(duì)比

推薦內(nèi)容
亚洲综合丝袜美腿_精品一区二区免费_日韩视频一区二区三区在线播放 _7878成人国产在线观看_精品一区二区三区视频在线观看_1024亚洲合集_日韩美女在线视频_欧美怡红院视频_国产一区 二区_亚洲视频 欧洲视频_99精品一区二区_亚洲va欧美va人人爽午夜_精品国产一区二区三区不卡_蜜臀av一区二区_欧美日韩精品一区二区_亚洲精品中文在线
一区二区三区在线免费视频| 蜜臀va亚洲va欧美va天堂| 亚洲免费观看视频| 久久99国产精品免费| 色一情一伦一子一伦一区| 精品国产sm最大网站| 亚洲大片精品永久免费| 不卡的av在线| 久久精品亚洲乱码伦伦中文| 午夜欧美一区二区三区在线播放 | 色综合亚洲欧洲| 2021久久国产精品不只是精品| 亚洲高清中文字幕| 色综合色综合色综合| 中文字幕不卡在线观看| 国产综合色产在线精品| 日韩欧美aaaaaa| 三级不卡在线观看| 欧美日韩国产片| 99热国产精品| 亚洲国产精品av| 国产一区二区三区观看| 精品免费99久久| 麻豆成人在线观看| 欧美一区二区不卡视频| 日本vs亚洲vs韩国一区三区二区| 欧美精品久久天天躁| 丝袜a∨在线一区二区三区不卡| 欧美午夜免费电影| 亚洲午夜精品在线| 欧美日韩免费在线视频| 亚洲主播在线播放| 一本久道久久综合中文字幕| 综合久久综合久久| 91热门视频在线观看| 亚洲欧美视频在线观看视频| caoporn国产一区二区| 国产精品超碰97尤物18| fc2成人免费人成在线观看播放 | 日韩精品专区在线| 麻豆一区二区99久久久久| 欧美一级欧美三级在线观看| 婷婷六月综合网| 日韩精品一卡二卡三卡四卡无卡| 欧美三级在线看| 午夜精品久久久久久久久久| 欧美精品一卡两卡| 奇米四色…亚洲| 精品国产一区二区在线观看| 激情久久五月天| 久久久亚洲午夜电影| 国产精品一区二区果冻传媒| 久久久99久久| 大白屁股一区二区视频| 中文字幕一区在线观看视频| 99在线热播精品免费| 玉足女爽爽91| 欧美福利视频导航| 日日夜夜精品视频免费| 日韩精品最新网址| 国产精品66部| 1区2区3区欧美| 欧美三级中文字幕在线观看| 蜜臀av国产精品久久久久| 26uuu国产一区二区三区| 丁香天五香天堂综合| 17c精品麻豆一区二区免费| 91国偷自产一区二区开放时间 | 高清不卡在线观看| 中文字幕亚洲一区二区va在线| 色www精品视频在线观看| 午夜精品福利一区二区三区av| 欧美一级专区免费大片| 国产乱子伦视频一区二区三区| 亚洲欧洲精品一区二区三区不卡| 欧美亚洲动漫精品| 老司机精品视频在线| 国产网站一区二区三区| 91老师片黄在线观看| 热久久国产精品| 日本一区二区免费在线观看视频 | 91啪九色porn原创视频在线观看| 亚洲丝袜制服诱惑| 欧美人成免费网站| 国产一区二区视频在线播放| 亚洲欧美区自拍先锋| 91精品国产欧美一区二区| 国产精品一区二区三区网站| 有码一区二区三区| 精品国产网站在线观看| 91性感美女视频| 免费人成在线不卡| 国产精品麻豆99久久久久久| 在线播放中文一区| 成人免费毛片a| 三级欧美韩日大片在线看| 久久精品亚洲一区二区三区浴池| 午夜私人影院久久久久| 国产午夜亚洲精品理论片色戒 | 欧美日韩精品一区视频| 亚洲免费资源在线播放| 91麻豆精品国产91久久久更新时间| 国内精品写真在线观看| 亚洲欧美欧美一区二区三区| 欧美大片拔萝卜| 一本久道久久综合中文字幕| 国产一区二区三区观看| 91蝌蚪porny| 一区二区三区欧美久久| 日韩一二三四区| 一本久久a久久免费精品不卡| 亚洲成av人片在线观看无码| 国产偷国产偷精品高清尤物| 91麻豆国产福利在线观看| 丝袜美腿亚洲色图| 精品国精品国产尤物美女| 亚洲自拍另类综合| 欧美电影在哪看比较好| 亚洲在线视频免费观看| 欧美一三区三区四区免费在线看| 91小宝寻花一区二区三区| 国产乱人伦偷精品视频免下载| 五月天亚洲精品| 亚洲男人天堂av| 国产亚洲精品免费| 欧美一区二区三区免费大片| 91视频免费播放| 丁香婷婷综合网| 激情久久五月天| 午夜日韩在线电影| 亚洲免费观看高清完整版在线观看 | 久久亚洲综合av| 欧美顶级少妇做爰| 欧美亚洲动漫精品| 色欧美日韩亚洲| 97久久精品人人做人人爽| 国产精品69久久久久水密桃| 蜜臀av国产精品久久久久 | 91色在线porny| 成人精品国产一区二区4080 | 精品久久久久99| 在线成人av网站| 欧美日韩一区二区三区高清| 91视频www| 99久久久精品| 粉嫩绯色av一区二区在线观看 | 在线观看一区二区视频| 91亚洲精品久久久蜜桃| 成人高清视频在线观看| 国产suv精品一区二区883| 国产精品一区免费视频| 国精产品一区一区三区mba桃花 | 六月婷婷色综合| 日韩高清在线观看| 天天av天天翘天天综合网 | 国产精品系列在线观看| 紧缚捆绑精品一区二区| 看片的网站亚洲| 久久精品国产在热久久| 青草av.久久免费一区| 日本欧美一区二区三区乱码| 丝袜脚交一区二区| 日韩avvvv在线播放| 日韩精品一二三四| 日本在线播放一区二区三区| 日韩精品五月天| 轻轻草成人在线| 免费高清成人在线| 极品少妇一区二区三区精品视频 | 欧美日韩国产欧美日美国产精品| 欧美丝袜第三区| 欧美日韩一区三区四区| 欧美色手机在线观看| 欧美日高清视频| 欧美一区二区性放荡片| 日韩欧美www| 久久久夜色精品亚洲| 欧美激情在线看| 综合久久国产九一剧情麻豆| 亚洲精品国产a| 亚洲电影视频在线| 免费高清不卡av| 国产一区二区在线观看免费| 大美女一区二区三区| 国产精品免费久久| 亚洲人成人一区二区在线观看| 成人欧美一区二区三区| 亚洲综合精品久久| 日韩精品乱码免费| 极品美女销魂一区二区三区 | 欧美一区二区久久| 欧美精品一区二区三区蜜臀| 国产色产综合色产在线视频 | 国产成人精品1024| 91色视频在线| 欧美二区三区91| 久久久精品影视| 亚洲日本乱码在线观看| 偷拍日韩校园综合在线| 韩国女主播成人在线观看|