亚洲图片你懂的_亚洲精品一卡二卡_av伦理在线_日韩一二三区_不卡av在线免费观看_久久久精品日韩欧美_欧美色偷偷大香_免费av片风间由美在线

您當(dāng)前的位置: 首頁(yè) > 新聞 > 其他

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

來(lái)源:量子位   編輯:非小米 時(shí)間:2024-04-05 21:00人閱讀

谷歌終于更新了Transformer架構(gòu)。

最新發(fā)布的Mixture-of-Depths(MoD),改變了以往Transformer計(jì)算模式。

它通過(guò)動(dòng)態(tài)分配大模型中的計(jì)算資源,跳過(guò)一些不必要計(jì)算,顯著提高訓(xùn)練效率和推理速度。

結(jié)果顯示,在等效計(jì)算量和訓(xùn)練時(shí)間上,MoD每次向前傳播所需的計(jì)算量更小,而且后訓(xùn)練采樣過(guò)程中步進(jìn)速度提高50%。

這一方法剛剛發(fā)布,就馬上引發(fā)關(guān)注。

MoE風(fēng)頭正盛,MoD已經(jīng)來(lái)后浪拍前浪了?

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

所以MoD如何實(shí)現(xiàn)?

迫使大模型關(guān)注真正重要信息

這項(xiàng)研究提出,現(xiàn)在的大模型訓(xùn)練和推理中,有很多計(jì)算是沒(méi)必要的。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

比如預(yù)測(cè)下一個(gè)句子很難,但是預(yù)測(cè)句子結(jié)束的標(biāo)點(diǎn)符號(hào)很簡(jiǎn)單。如果給它們分配同樣的計(jì)算資源,那么后者明顯浪費(fèi)了。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

在理想情況下, 模型應(yīng)該只給需要準(zhǔn)確預(yù)測(cè)的token分配更多計(jì)算資源。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

所以研究人員提出了MoD。

它在輸入序列中的特定位置動(dòng)態(tài)分配FLOPs(運(yùn)算次數(shù)或計(jì)算資源),優(yōu)化不同層次的模型深度中的分配。

通過(guò)限制給定層的自注意力和MLP計(jì)算的token數(shù)量,迫使神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)主要關(guān)注真正重要的信息。

因?yàn)閠oken數(shù)量是事先定義好的,所以這個(gè)過(guò)程使用一個(gè)已知張量大小的靜態(tài)計(jì)算圖,可以在時(shí)間和模型深度上動(dòng)態(tài)擴(kuò)展計(jì)算量。

下圖右上圖中的橙色部分,表示沒(méi)有使用全部計(jì)算資源。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

這種方法在節(jié)省計(jì)算資源的同時(shí),還能提高效率。

這些模型在等效的FLOPS和訓(xùn)練時(shí)間上與基線性能相匹配,但每次前向傳播所需的FLOP更少,并且在訓(xùn)練后采樣時(shí)提速50%。

對(duì)比來(lái)看,如果為每一個(gè)token生成一個(gè)概率分布,每個(gè)token根據(jù)最高概率被送去對(duì)應(yīng)的“專(zhuān)家”,可能會(huì)導(dǎo)致負(fù)載不平衡。

如果反過(guò)來(lái),這能保障負(fù)載平衡,但是可能導(dǎo)致某些token被過(guò)度處理或處理不足。

最后來(lái)看論文中使用的Expert-choice MoD,router輸出的權(quán)重被用于確定哪些token將使用transformer虧啊計(jì)算。權(quán)重較大的token將參與計(jì)算,權(quán)重較小的token將通過(guò)殘差連接繞過(guò)計(jì)算,從而解決每次向前傳播的FLOPs。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

最后,研究團(tuán)隊(duì)展示了MoD在不同實(shí)驗(yàn)中的性能表現(xiàn)。

首先,他們使用相對(duì)較小的FLOP預(yù)算(6e18),以確定最佳超參數(shù)配置。

通過(guò)這些實(shí)驗(yàn),作者發(fā)現(xiàn)MoD方法能夠“拉低并向右推移”isoFLOP基線曲線,這意味著最優(yōu)的MoD方法在更低的損失水平上擁有更多的參數(shù)。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

通過(guò)isoFLOP分析,比較6e18、2e19和1e20 FLOPs的總計(jì)算預(yù)算下的模型性能。

結(jié)果顯示,在更多FLOP預(yù)算下,F(xiàn)LOP最優(yōu)的MoD仍然比基線模型有更多的參數(shù)。

存在一些MoD變體,在步驟速度上比isoFLOP最優(yōu)基線模型更快,同時(shí)實(shí)現(xiàn)更低的損失。這表明在訓(xùn)練之外,MoD的計(jì)算節(jié)省仍然有效。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

同時(shí),研究團(tuán)隊(duì)還探討了MoD和MoE結(jié)合的可能性——MoDE。

結(jié)果表明而這結(jié)合能提供更好的性能和更快的推理速度。

網(wǎng)友:聯(lián)想到了ResNet

MoD推出后馬上引發(fā)了不小關(guān)注。

有人感慨,MoE還沒(méi)有弄清楚呢,MoD都已經(jīng)來(lái)了!

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

這么高效的方法,讓人馬上聯(lián)想到了ResNet。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

不過(guò)和ResNet不同,MoD跳過(guò)連接是完全繞過(guò)層的。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

還有人表示,希望這種方法是完全動(dòng)態(tài)的,而不是每個(gè)層固定百分比。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

這項(xiàng)研究由DeepMind和麥吉爾大學(xué)共同帶來(lái)。

主要貢獻(xiàn)者是David Raposo和Adam Santoro。

谷歌更新Transformer架構(gòu) 更節(jié)省計(jì)算資源!50%性能提升

他們二人都是DeepMind的研究科學(xué)家。此前共同帶來(lái)了神作《Relational inductive biases, deep learning, and graph networks》。

這篇論文目前被引次數(shù)超過(guò)3500次,論文核心定義了Inductive bias(歸納偏置)概念。

本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 谷歌 AI

相關(guān)文章

中文字幕一区二区三区乱码图片 | 亚洲高清免费观看高清完整版在线观看 | 亚洲区小说区图片区qvod| 制服丝袜av成人在线看| 一本到12不卡视频在线dvd| 黄动漫在线看| 国产高清一区| 中午字幕在线观看| 久久色在线观看| 国产精区一区二区| 日韩美女主播在线视频一区二区三区| 一本一本久久| 亚洲精品中文字幕有码专区| 久久亚洲视频| 欧美午夜大胆人体| 日韩欧美在线视频免费观看| 欧美精选一区| 国产在线看片| 欧美日韩国产精品一区二区不卡中文| 久久久久国产精品| 在线毛片网站| 一区二区三区在线免费播放| 日韩1区在线| 精品视频一二区| 青娱乐精品视频在线| 僵尸再翻生在线观看免费国语| 日本韩国精品一区二区在线观看| 91九色鹿精品国产综合久久香蕉| 精品对白一区国产伦| 国产做a爰片久久毛片| 四虎4545www精品视频| 欧美一区二区三区免费| 欧美日韩1080p| 麻豆网站在线| 欧美日韩亚洲一区二区三区| 91精品国产乱码久久久久久久| 免费观看久久久久| 日韩欧美亚洲国产一区| 亚洲激情亚洲| 免费电影网站在线视频观看福利| 欧美专区日韩专区| 久久久久久夜| 中文字幕 在线观看| 91精品国产综合久久久久久| 精品影视av免费| 国产精品色婷婷在线观看| av激情网站| 久久久久久久久久看片| 日韩mv欧美mv国产网站| 中文字幕在线观| 亚洲欧美自拍偷拍| 欧美黄在线观看| 性xxxfreexxxx性欧美| 欧美日韩另类一区| 国产精品一区免费在线| gogo高清免费视频| 久久精品亚洲精品国产欧美| 精品一区av| 成人在线视频成人| 色系网站成人免费| 人禽交欧美网站| 国产高清亚洲| 影音先锋导航| 九九精品调教| 欧美激情偷拍自拍| 在线中文字幕资源| 欧美精品综合| 天天躁日日躁狠狠躁欧美巨大小说 | 日韩二区三区在线| 国产精品99久久久久| 成人h动漫精品一区二区器材| 欧美13~18sex性hd| 亚洲国产一区二区在线播放| 在线亚洲一区| 国产成人一级电影| 老司机aⅴ在线精品导航| 国内av一区二区三区| 色菇凉天天综合网| 精品一区二区久久| 3d欧美精品动漫xxxx无尽| 女同互忝互慰dv毛片观看| 亚洲午夜久久久久中文字幕久| 亚洲一区日本| 日本精品视频| 成人午夜影视| 91精品国产一区二区三区香蕉| 96av麻豆蜜桃一区二区| 久久伦理在线| 精品三级久久| 宅男深夜免费观看视频| 色婷婷av一区二区三区gif| 国产福利精品导航| 欧美国产美女| 中文字幕资源网在线观看免费| 开心丁香婷婷深爱五月| 欧美日韩一区二区免费在线观看| 极品尤物av久久免费看| 国产探花在线精品| 婷婷电影在线观看| 最新国产在线视频| 欧美精品粉嫩高潮一区二区| 欧美激情一区不卡| 国内精品久久久久久久97牛牛| 成人在线日韩| 污污的网站在线观看| 91精品国模一区二区三区| 中文子幕无线码一区tr| 肉肉av福利一精品导航| 天海翼一区二区三区免费| 亚洲在线观看免费| 开心九九激情九九欧美日韩精美视频电影| 国产精品久久久久av蜜臀| 成视频免费观看在线看| www.1024 | 国产成人三级在线观看| 91精品综合| 日韩一区中文| www日韩tube| 亚洲成人黄色在线| 欧美日韩国产色| 99re热这里只有精品视频| 99在线精品视频在线观看 | 色综合999| www.xxx黄| 欧美精品丝袜中出| 中文字幕在线一区二区三区| 日韩国产欧美在线视频| 久久电影院7| 日韩高清在线观看一区二区| 国产精品探花在线| 免费在线黄色电影| 亚洲人av在线影院| 欧美视频完全免费看| 欧美国产精品一区二区三区| 日韩av一区二区三区四区| 97精品视频| 国产aa精品| 成人看片免费| 污黄色在线观看| 丁香花高清视频完整版在线观看| 欧美日韩一区 二区 三区 久久精品| 亚洲视频一区在线观看| 波多野结衣在线aⅴ中文字幕不卡| 亚洲欧洲一区| 99久久99热这里只有精品| 亚洲码欧美码一区二区三区| 亚洲男人天堂九九视频| 在线观看中文字幕不卡| 亚洲激情网站免费观看| 国产亚洲污的网站| 国产成人综合网站| 麻豆精品一区二区三区| 中文久久精品| 欧美精品一线| 久久综合社区| 老司机2019福利精品视频导航| 日本三级视频在线播放| 国产在线传媒| 国产一二区视频| 亚洲三级黄色在线观看| 亚洲激情在线观看视频免费| 欧美老人xxxx18| 欧美在线观看视频在线| 五月激情六月综合| 久久精品亚洲一区二区| 日本一区二区成人在线| 99视频一区二区三区| 六月丁香婷婷色狠狠久久| 久久精品30| 在线亚洲欧美| 亚洲国产一区二区三区a毛片 | 91在线丨porny丨国产| 激情综合色综合久久| 视频在线观看一区| 99精品99| 国产精品毛片| 亚洲欧美大片| 欧美~级网站不卡| 日韩系列欧美系列| 成人av动漫| 亚洲午夜国产成人| 免费看日产一区二区三区| 精品一区二区三区在线观看视频| 久久青草视频| 四虎精品永久免费| 日韩在线观看中文字幕| 成人午夜网址| 亚洲精品国模| 日本午夜一区| 国产电影一区二区在线观看| 你懂的国产精品永久在线| 中文字幕人成人乱码| 欧美日韩国产欧| 在线成人黄色| 日本系列欧美系列| 国产一区在线观看麻豆| 国产裸体歌舞团一区二区| 成人精品一区二区三区四区| 不卡区在线中文字幕| 久久午夜免费电影|