亚洲图片你懂的_亚洲精品一卡二卡_av伦理在线_日韩一二三区_不卡av在线免费观看_久久久精品日韩欧美_欧美色偷偷大香_免费av片风间由美在线

您當前的位置: 首頁 > 新聞 > 其他

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

來源:量子位   編輯:非小米 時間:2023-08-14 17:39人閱讀

用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——

微軟最新開源大模型WizardMath來了。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——

并且是在參數只有700億,遠不及后三者的情況之下。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

HuggingFace已上線3個在線可玩版本(分別為7B、13B和70B參數),各種數學題可以直接丟進去試一試。

比如解決下面這道四次多項式方程:

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

或者是一道簡單的微積分:

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

亦或者是稍微修改過的拉格朗日方程推導:

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

它都全部正確(過程也不需要等太久)。

有網友向作者表示:

效果真的很驚人,感謝你們對開源LLM的貢獻。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

目前,相關代碼、復現方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標星。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

那么,WizardMath究竟是如何做到的?

用AI生成的指令增強大模型能力

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執行各種復雜和多樣化的任務,一部分原因是使用了真實人類用戶生成的開放域指令數據進行了微調。

然而,不是誰都能像這家公司一樣獲得這樣的指令數據集。

一是因為整個注釋過程極其昂貴且耗時,二是人工難以創建出足夠比例的高難度指令。

因此,開發出一種成本相對較低的、大規模開放域指令自動生產方法,成為當下指令調優語言模型的關鍵。

在此,作者將他們的方法命名為Evol Instruction。

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。

具體而言,Evol Instruction分為指令進化器和指令消除器。

其中指令進化器可通過深度進化(藍線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更復雜的指令或創建一條全新指令。

具體執行哪一條?隨機選擇就好。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

其中,深度進化的具體“進化法”,則是通過五種類型的操作來完成,包括:

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復雜化(complicate input)。

由于所有指令均由AI完成,有時難免會出現錯誤。因此,指令消除器就是用于過濾失敗指令的。

以下是一個具體示例,該方法從“1+1=?”開始,最終通過以上步驟自動生成了相當多的新指令。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

通過重復這一生成過程,最終我們就能得到足夠多的指令,然后將它們合并并隨機打亂,組成一個難度級別均勻分布的指令集,就可以對基礎大模型進行微調了。

在此,作者選擇Alpaca的訓練數據(僅由175條人工創建的種子指令生成)作為初始數據集,然后使用ChatGPT的API執行了四個進化周期,最終獲得25萬條指令。

為了與Vicuna的70k真實用戶數據(ShareGPT)進行公平比較,作者從這25萬條數據中抽取了等量的樣本,訓練LLaMA 7B模型,最終得到WizardLM,結果WizardLM的性能明顯優于Vicuna。

(Alpaca:斯坦福在LLaMa-7B基礎上微調出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎上微調得來)

此外,在更為復雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復雜指令的能力。

基于此,作者又利用Evol Instruction生成了很多數學領域相關的指令,然后微調羊駝大模型,得到了WizardMath。

其效果如開頭所示,在GSM8k數據集上測得其數學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數的Flan-PaLM 2之后。

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

團隊介紹本文共9位作者,全華人。

一作有3位:

Can Xu,微軟亞洲互聯網工程院S+D NLP組高級應用科學家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統工作;

Qingfeng Sun, Microsoft Research科學家,研究方向為自然語言處理和信息檢索,精通構建高效搜索系統,為Microsoft Bing和Office 365貢獻了核心深度模型;

Kai Zheng,Microsoft Research科學家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學家,在微軟工作16年有余、曾作為微軟必應搜索引擎和Cortana智能助手自然語言理解負責人,日前已被曝離職投身大模型創業。

另還有一位作者Jiazhan Feng,是北大學生,這篇合著論文是TA在微軟實習時產出的。

項目主頁: https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 大模型 ChatGPT

相關文章

秋霞福利视频| 午夜国产一区| 国产精品亚洲综合色区韩国| 国产色产综合色产在线视频| 亚洲欧美在线另类| 欧美三级午夜理伦三级中视频| 日韩一级免费观看| 日韩欧美一区二区在线视频| 亚洲精品理论电影| 夜级特黄日本大片_在线| 成人四虎影院| 国内精品在线播放| 日韩欧美一级二级三级久久久| 韩国成人动漫| 成人免费黄色大片| 亚洲精品www| 日韩成人精品一区二区三区| 日韩一区精品字幕| 国产精品久久久久久亚洲毛片| 日韩三级精品电影久久久| 美女黄a一级视频| 成人午夜亚洲| 黄色日韩精品| 亚洲人123区| 亚洲精选一区二区| 日本免费高清视频| 在线视频中文字幕| 色开心亚洲综合| 欧洲精品二区| 欧美伊人亚洲伊人色综合动图| 亚洲日本免费| 午夜国产精品一区| 亚洲嫩模很污视频| 91制片在线观看| 国产精品啊啊啊| 色中色一区二区| 欧美性www| 亚洲人成亚洲人成在线观看图片| v片在线观看| 91亚洲国产成人精品一区二区三| 在线视频你懂| 国产一区二区欧美| 亚洲欧美成aⅴ人在线观看| 精品日韩一区二区| gogo高清在线播放免费| 欧美日韩另类图片| 国产高清无密码一区二区三区| 欧美日韩国产综合视频在线观看| 狂野欧美性猛交xxxxx视频| 精品国产一区二区三区噜噜噜| 蜜桃视频在线观看一区二区| 亚洲最快最全在线视频| 亚洲久久久久久久久久| 欧美日韩在线网站| 欧美日韩高清影院| 一区二区三区性视频| 亚洲超碰在线观看| 粉嫩绯色av一区二区在线观看 | 亚洲人成在线观看网站高清| 北岛玲heyzo一区二区| 久久精品国产亚洲高清剧情介绍| 国产精品色一区二区三区| 9色精品在线| 国产日韩专区| 国产喂奶挤奶一区二区三区| 一级毛片在线看| 亚洲国产精品久久久久蝴蝶传媒| 99国产精品国产精品毛片| 男人久久精品| 激情小说亚洲一区| 日本不卡三区| 日本一区二区三区四区| 欧美黄色a视频| 中文字幕巨乱亚洲| 中文字幕资源网在线观看| 久久午夜色播影院免费高清| 四虎影院观看视频在线观看| 国产在线不卡| 欧美色窝79yyyycom| 污污视频在线看| 国产精品一级黄| 亚洲欧洲国产伦综合| av亚洲在线观看| 色婷婷国产精品久久包臀| 黄色av电影在线播放| 中文字幕伦av一区二区邻居| 依依成人综合视频| 日本高清精品| 欧美一级高清大全免费观看| 亚洲人成777| 国产日韩精品一区| 超碰个人在线| 国产成人综合精品三级| 在线亚洲高清视频| 亚洲成人av观看| 亚洲一二三四在线观看| 18+激情视频在线| 日韩欧美午夜| 污片在线观看一区二区| 综合国产视频| 亚洲免费一区三区| 91精品国产自产精品男人的天堂| 日本亚州欧洲精品不卡| 成人看片免费| 欧美日本一区二区高清播放视频| 色噜噜狠狠成人中文综合| 秋霞在线视频| 丝袜美腿成人在线| 亚洲国产另类久久精品| 国产成人毛片| 看国产成人h片视频| 亚洲精品电影网| 精品国产一区二区三区香蕉沈先生| 亚洲一本大道在线| 欧美二三四区| 经典一区二区三区| 欧美一级在线免费| 日韩av福利| 久久精品理论片| 亚洲第一天堂无码专区| 久久gogo国模啪啪裸体| 色偷偷久久一区二区三区| 国产69精品久久久久9999人| 在线免费观看一区| 欧美男gay| 欧美年轻男男videosbes| 97品白浆高清久久久久久| 欧美美女一区二区| 五月久久久综合一区二区小说| 精品99999| 成人在线视频你懂的| 午夜私人影院久久久久| 加勒比视频一区| 色婷婷国产精品| 老司机凹凸av亚洲导航| 欧美在线免费观看亚洲| 国产精品电影一区二区三区| 天涯成人国产亚洲精品一区av| 欧美日韩第一区日日骚| 日韩av在线免费| 男生女生差差差的视频在线观看| 污污的视频在线观看| 韩国精品视频在线观看| 九九久久婷婷| 国产欧美日韩一区二区三区在线| 国产精选一区二区三区| 国产精品午夜在线| 色女孩综合影院| 日韩精品欧美激情| 国产在线中文字幕| 九九色在线视频| 国产精品传媒| 国产精品v亚洲精品v日韩精品 | 9191精品国产综合久久久久久| 亚洲欧美国产制服动漫| 成在在线免费视频| 久久久久久久| 妖精视频一区二区三区| 国产亚洲激情| 91亚洲资源网| 欧美日韩在线影院| 日韩精品小视频| 香蕉视频在线看| 亚洲成人高清| 911久久香蕉国产线看观看| 久久精品国产精品亚洲综合| 国产清纯在线一区二区www| 日韩人在线观看| 亚洲欧美日韩一区在线| 麻豆传媒在线免费看| 国产精品中文| 欧美日一区二区在线观看| 岛国精品一区二区| 粉嫩av一区二区三区免费野| 亚洲美女av电影| 中文字幕中文字幕在线中高清免费版| 精品网站999| 亚洲国产mv| 久久亚洲一级片| 欧美日韩在线一区二区| 中文在线а天堂av| 外国成人直播| 午夜影院欧美| 成人av午夜影院| 日韩欧美精品网址| 免费特级黄毛片| 国产黄色大片在线观看| 无码少妇一区二区三区| 美女一区二区视频| 国产精品久久久久影院| 日韩丝袜美女视频| 在线看的av网站| 中文字幕一区二区三区四区久久| 亚洲网站在线| 久久蜜桃香蕉精品一区二区三区| 91成人免费电影| 日本一区高清| 麻豆国产精品| 日日夜夜精品视频天天综合网| 亚洲女爱视频在线|