亚洲少妇一区二区三区_精品成人无码一区二区三区_日韩影院一区二区_a天堂视频在线观看_草草影院第一页_香蕉视频污视频_99久久国产精_91成人在线观看喷潮蘑菇_天堂www中文在线资源_精品无码人妻一区二区免费蜜桃_国产黑丝一区二区

當(dāng)前位置:首頁 > 商業(yè)觀察 > 正文

“書生·浦語”2.0開源發(fā)布,引領(lǐng)新一代開源模型創(chuàng)新發(fā)展

2024-01-17 14:39:40    來源:今日熱點(diǎn)網(wǎng)    

 

1月17日,商湯科技與上海AI實(shí)驗(yàn)室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)正式發(fā)布新一代大語言模型書?·浦語2.0(InternLM2)。InternLM2 的核心理念在于回歸語言建模的本質(zhì),致力于通過提高語料質(zhì)量及信息密度,實(shí)現(xiàn)模型基座語言建模能力質(zhì)的提進(jìn)而在數(shù)理、代碼、對(duì)話、創(chuàng)作等各方面都取得長足進(jìn)步,綜合性能達(dá)到開源模型的領(lǐng)先水平

InternLM2是在2.6萬億token的高質(zhì)量語料上訓(xùn)練得到的。沿襲第一代書生·浦語(InternLM)的設(shè)定,InternLM2包含7B及20B兩種參數(shù)規(guī)格及基座、對(duì)話等版本,滿足不同復(fù)雜應(yīng)用場(chǎng)景需求,繼續(xù)開源,提供免費(fèi)商用授權(quán)

 

回歸語言建模本質(zhì),筑牢大模型能力基礎(chǔ)

大模型的研究應(yīng)回歸語言建模本質(zhì)大模型各項(xiàng)性能提升的基礎(chǔ)在于語言建模能力的增強(qiáng)。為此,聯(lián)合團(tuán)隊(duì)提出了新一代的數(shù)據(jù)清洗過濾技術(shù),通過更高質(zhì)量的語料以及更高的信息密度,筑牢大模型能力基礎(chǔ)。

主要發(fā)展了以下幾個(gè)方面的技術(shù)方法:

多維度數(shù)據(jù)價(jià)值評(píng)估:基于文本質(zhì)量、信息質(zhì)量、信息密度等維度對(duì)數(shù)據(jù)價(jià)值進(jìn)行綜合評(píng)估與提升;

高質(zhì)量語料驅(qū)動(dòng)的數(shù)據(jù)富集:利用高質(zhì)量語料的特征從物理世界、互聯(lián)網(wǎng)以及語料庫中進(jìn)一步富集類似語料;

針對(duì)性的數(shù)據(jù)補(bǔ)齊:針對(duì)性補(bǔ)充語料,重點(diǎn)加強(qiáng)現(xiàn)實(shí)世界知識(shí)、數(shù)理、代碼等核心能力。

目前,浦語背后的數(shù)據(jù)清洗過濾技術(shù)已經(jīng)歷三輪迭代升級(jí)。僅使用約60%的訓(xùn)練數(shù)據(jù)即可達(dá)到使用第二代數(shù)據(jù)訓(xùn)練1T tokens的性能表現(xiàn),模型訓(xùn)練效率大幅提升。

第三代數(shù)據(jù)清洗過濾技術(shù)大幅度提升模型訓(xùn)練效率

基于第三代數(shù)據(jù)清洗過濾技術(shù),InternLM2語言建模能力實(shí)現(xiàn)了顯著增強(qiáng)。

與第一代InternLM相比,InternLM2在大規(guī)模高質(zhì)量的驗(yàn)證語料上的Loss分布整體左移,表明其語言建模能力實(shí)質(zhì)性增強(qiáng)

支持200K超長上下文,“大海撈針”近乎完美

長語境輸入及理解能力能夠顯著拓展大模型應(yīng)用場(chǎng)景,比如支持大型文檔處理、復(fù)雜的推理演算和實(shí)際場(chǎng)景的工具調(diào)用等。然而,大模型有限的上下文長度當(dāng)前仍是學(xué)界及業(yè)內(nèi)面臨的重要難題。通過拓展訓(xùn)練窗口大小和位置編碼改進(jìn),InternLM2支持20萬 tokens的上下文,能夠一次性接受并處理約30萬漢字(約五六百頁的文檔)的輸入內(nèi)容,準(zhǔn)確提取關(guān)鍵信息,實(shí)現(xiàn)長文本中“大海撈針”。

參考業(yè)界范例,研究人員對(duì)InternLM2進(jìn)行了“大海撈針”試驗(yàn):將關(guān)鍵信息隨機(jī)插入一段長文本的不同位置并設(shè)置問題,測(cè)試模型能否從中提取出關(guān)鍵信息。

InternLM2“大海撈針”試驗(yàn)效果

上圖展示了InternLM2在不同長度的上下文(橫軸)及上下文中不同位置(縱軸)上召回關(guān)鍵信息的準(zhǔn)確率(Recall)。紅色代表較低的召回準(zhǔn)確率,而綠色則代表較高的召回率。試驗(yàn)結(jié)果表明,InternLM2在上下文長度延展到200K時(shí)依舊保持了近乎完美的召回成功率,驗(yàn)證了InternLM2對(duì)于超長上下文堅(jiān)實(shí)的支持能力。

為測(cè)試InternLM2在真實(shí)長文本處理任務(wù)中的能力,研究人員將一份時(shí)長3小時(shí)的公開會(huì)議錄音轉(zhuǎn)錄稿輸入模型中,并要求InternLM2從中提取出關(guān)鍵信息。測(cè)試結(jié)果表明,盡管在未校對(duì)的文本中存在較多錯(cuò)別字,但I(xiàn)nternLM2仍從中準(zhǔn)確提煉出了關(guān)鍵信息,并總結(jié)了關(guān)鍵發(fā)言人的觀點(diǎn)。

InternLM2準(zhǔn)確總結(jié)“聯(lián)合國2023年10月2日召開的聯(lián)合國貿(mào)易和發(fā)展會(huì)議會(huì)議記錄”

性能全面提升,綜合領(lǐng)先同量級(jí)開源模型

InternLM2的各項(xiàng)能力獲得全面進(jìn)步,相比于初代InternLM,在推理、數(shù)學(xué)、代碼等方面的能力提升尤為顯著,綜合能力領(lǐng)先于同量級(jí)開源模型。

根據(jù)大語言模型的應(yīng)用方式和用戶關(guān)注的重點(diǎn)領(lǐng)域,研究人員定義了語言、知識(shí)、推理、數(shù)學(xué)、代碼、考試等六個(gè)能力維度,在55個(gè)主流評(píng)測(cè)集上對(duì)多個(gè)同量級(jí)模型的表現(xiàn)進(jìn)行了綜合評(píng)測(cè)。評(píng)測(cè)結(jié)果顯示,InternLM2的輕量級(jí)及中量級(jí)版本性能在同量級(jí)模型中表現(xiàn)優(yōu)異。

InternLM2的輕量級(jí)及中量級(jí)版本性能在同量級(jí)開源模型中表現(xiàn)優(yōu)異

下面的表格對(duì)比了InternLM2各版本與ChatGPT(GPT-3.5)以及GPT-4在典型評(píng)測(cè)集上的表現(xiàn)。可以看到,InternLM2只用20B參數(shù)的中等規(guī)模,即在整體表現(xiàn)上達(dá)到了與ChatGPT比肩的水平。其中,在AGIEval、 BigBench-Hard(BBH)、GSM8K、MATH等對(duì)推理能力有較高要求的評(píng)測(cè)上,InternLM2表現(xiàn)甚至優(yōu)于ChatGPT。

InternLM2與ChatGPT的評(píng)測(cè)結(jié)果對(duì)比

與此同時(shí),綜合性能的增強(qiáng),帶來了下游任務(wù)的全方位能力提升。新發(fā)布的InternLM2提供優(yōu)秀的對(duì)話及創(chuàng)作體驗(yàn),支持多輪任務(wù)規(guī)劃及工具調(diào)用,并提供實(shí)用的數(shù)據(jù)分析能力。

對(duì)話及創(chuàng)作:更溫情、更富想象力

InternLM2不僅在客觀性能指標(biāo)上提升顯著,在主觀體驗(yàn)上也有明顯改善,可以為用戶提供優(yōu)秀的對(duì)話和交互體驗(yàn)。研究測(cè)試表明,InternLM2-Chat可以精準(zhǔn)地理解和遵循用戶意圖,具備較強(qiáng)的共情能力和豐富的結(jié)構(gòu)化創(chuàng)作能力。下面展示幾個(gè)示例:

示例一:在嚴(yán)格的格式要求下編制課程大綱

InternLM2設(shè)計(jì)的課程大綱精準(zhǔn)遵循用戶要求(比如格式、數(shù)量、內(nèi)容等)。

示例二:以富有人文關(guān)懷的回答開解用戶

InternLM2能夠在對(duì)話中與用戶“共情”

示例三:展開想象力,編寫《流浪地球3》的劇本

InternLM2設(shè)計(jì)的具備充滿豐富的合理想象,比如外星遺跡、量子糾纏的引入等。同時(shí)整個(gè)故事表現(xiàn)了人類面對(duì)危機(jī)時(shí)的勇氣和團(tuán)結(jié)精神。

對(duì)話和創(chuàng)造的體驗(yàn)進(jìn)步的原因,一方面是基礎(chǔ)語言能力的顯著增強(qiáng),另一方面也得益于微調(diào)技術(shù)的提升。InternLM2進(jìn)行微調(diào)的過程使用了經(jīng)過第三代數(shù)據(jù)清洗過濾技術(shù)處理的指令微調(diào)語料,同時(shí)也采用了更強(qiáng)的Online RLHF。研究人員在微調(diào)InternLM2的過程中,對(duì)獎(jiǎng)勵(lì)模型和對(duì)話模型進(jìn)行了三輪迭代更新,每一輪更新均針對(duì)前一輪模型的表現(xiàn)更新偏好數(shù)據(jù)與提示詞。在獎(jiǎng)勵(lì)模型訓(xùn)練(RM)和近端策略優(yōu)化(PPO)階段,研究人員均衡采用各類提示詞,不僅提高了對(duì)話的安全性,也提升了用戶體驗(yàn)。

工具調(diào)用:能力升級(jí),更精準(zhǔn)的工具選用,更可靠的多步規(guī)劃

基于更強(qiáng)大、更具泛化性的指令理解、工具篩選與結(jié)果反思等能力,InternLM2可支持復(fù)雜智能體的搭建,支持對(duì)工具進(jìn)行多輪有效調(diào)用及多步驟規(guī)劃,完成復(fù)雜任務(wù)。聯(lián)合團(tuán)隊(duì)針對(duì)多種任務(wù)構(gòu)建了細(xì)粒度工具調(diào)用評(píng)測(cè)集T-Eval(https://open-compass.github.io/T-Eval),InternLM2-Chat-7B在該評(píng)測(cè)集上表現(xiàn)超越了Claude-2.1和目前的開源模型,性能接近GPT-3.5。

InternLM2工具調(diào)用能力全面提升

通過工具調(diào)用,使得大語言模型可通過搜索、計(jì)算、代碼解釋器等獲取知識(shí)并處理更復(fù)雜的問題,從而拓展應(yīng)用邊界。研究人員對(duì)模型調(diào)用工具流程實(shí)施細(xì)粒度的拆解和分析,針對(duì)規(guī)劃、推理、工具選擇、理解、執(zhí)行、反思等步驟進(jìn)行了針對(duì)性增強(qiáng)和優(yōu)化。

基于InternLM2通過開源智能體框架 Lagent搭建的用戶助手智能體,能夠在一次指令回應(yīng)中完成地圖查詢、路線規(guī)劃、發(fā)郵件等任務(wù)

數(shù)理推理:會(huì)做題,還會(huì)可視化分析

數(shù)學(xué)能力是大模型邏輯思維和推理能力的重要體現(xiàn)。上海AI實(shí)驗(yàn)室對(duì)InternLM2的數(shù)學(xué)能力進(jìn)行全面提升,使其達(dá)到當(dāng)前開源模型的標(biāo)桿水平。

基于更加科學(xué)構(gòu)建的預(yù)訓(xùn)練語料,InternLM2形成了很強(qiáng)的內(nèi)生計(jì)算能力。在不依靠計(jì)算器等外部工具的情況下,在100以內(nèi)的簡單數(shù)學(xué)運(yùn)算上能夠做到接近100%的準(zhǔn)確率,在1000以內(nèi)達(dá)到80%左右的運(yùn)算準(zhǔn)確率。在GSM8K和MATH評(píng)測(cè)中,InternLM2-20B的表現(xiàn)超過了ChatGPT(GPT-3.5)。

InternLM2在100以內(nèi)的簡單數(shù)學(xué)運(yùn)算上能夠做到接近100%的準(zhǔn)確率

為應(yīng)對(duì)各類復(fù)雜計(jì)算,InternLM2-Chat還可借助代碼解釋器(Code-Interpreter)編寫代碼進(jìn)行計(jì)算,或?qū)ν评淼慕Y(jié)果進(jìn)行形式化驗(yàn)證,從而解決計(jì)算要求更高或者演算過程更加復(fù)雜的問題。在典型的數(shù)學(xué)評(píng)測(cè)集 GSM8K 和 MATH 上,配合代碼解釋器,InternLM2取得了更高的評(píng)測(cè)分?jǐn)?shù)。其中對(duì)于難度更高的 MATH 數(shù)據(jù)集,InternLM2的計(jì)算精度從 32.5 大幅提升到 51.2,甚至超過了 GPT-4 的表現(xiàn)。

InternLM2與ChatGPT的數(shù)學(xué)能力評(píng)測(cè)結(jié)果對(duì)比

下面的示例展示了InternLM2可以和代碼解釋器結(jié)合解決較復(fù)雜的高等數(shù)學(xué)問題。

InternLM2能夠完成積分求解等高等數(shù)學(xué)題目

基于在計(jì)算及工具調(diào)用方面強(qiáng)大的基礎(chǔ)能力,InternLM2在語言模型中具備了數(shù)據(jù)分析和可視化實(shí)用能力,進(jìn)一步貼近用戶使用場(chǎng)景。

向InternLM2輸入國家統(tǒng)計(jì)局公布的“2023年3-11月份規(guī)模以上工業(yè)企業(yè)主要財(cái)務(wù)指標(biāo)(分行業(yè))”,InternLM2能夠分析數(shù)據(jù)并繪制折線圖

 

 

關(guān)鍵詞:

上一篇:強(qiáng)強(qiáng)合作再升級(jí) 伊利股份攜手科拿乳業(yè)共同推動(dòng)乳業(yè)可持續(xù)發(fā)展
下一篇:真正的A級(jí)防火地板 上海普隆實(shí)業(yè)FMBflor黑科技生物質(zhì)防火抗菌地板創(chuàng)新上市

亚洲少妇一区二区三区_精品成人无码一区二区三区_日韩影院一区二区_a天堂视频在线观看_草草影院第一页_香蕉视频污视频_99久久国产精_91成人在线观看喷潮蘑菇_天堂www中文在线资源_精品无码人妻一区二区免费蜜桃_国产黑丝一区二区
婷婷色中文字幕| 黄色香蕉视频在线观看| 一区二区视频免费看| 国产精品密蕾丝袜| 欧美大波大乳巨大乳| a级在线免费观看| 久久精品成人av| 午夜理伦三级做爰电影| 精品少妇一区二区三区免费观| 在线中文字日产幕| 国产毛片毛片毛片毛片毛片毛片| 国内自拍偷拍视频| 成人在线视频免费播放| 在线不卡av电影| 人妻一区二区视频| 亚洲人与黑人屁股眼交| 杨幂一区二区国产精品| 波多野结衣加勒比| 成都免费高清电影| 国产精品国产三级国产传播| 亚洲欧美综合视频| 精品人妻无码一区二区三区 | 日韩在线观看免| 99久久99久久精品国产| 美女黄色一级视频| 国产真人做爰视频免费| 性色av无码久久一区二区三区| 亚洲最大视频网| 亚洲永久精品ww.7491进入| 亚洲天堂精品一区| 男人的天堂影院| 亚洲综合第一区| 色悠悠在线视频| 99国产精品无码| 中文字幕 日本| 久久精品日韩无码| 在线免费观看污视频| 亚洲熟女少妇一区二区| 午夜剧场免费看| 我要看一级黄色录像| 呦呦视频在线观看| 五月天激情丁香| 我不卡一区二区| 成人在线电影网站| 日韩a级片在线观看| 免费黄色在线视频| 成人免费无码大片a毛片| 久久久久久视频| 婷婷丁香综合网| 实拍女处破www免费看| 免费啪视频在线观看| 久热这里有精品| 久久久久久国产免费a片| aa片在线观看视频在线播放| www日本在线观看| 免费看一级大片| 天天看天天摸天天操| 成年人在线免费看片| 亚洲国产精品成人综合久久久| 日韩在线中文字幕视频| 女性裸体视频网站| 蜜桃av免费观看| 无码人妻精品中文字幕 | 无码任你躁久久久久久老妇| 黑人巨大精品一区二区在线| 五月天av网站| 日本中文字幕精品| 国产艳妇疯狂做爰视频| 潘金莲一级淫片aaaaaaa| 精品国产视频在线观看| 免费人成视频在线播放| 国产伦精品一区二区三区妓女下载| 性生交大片免费全黄| 超碰手机在线观看| 挪威xxxx性hd极品| 国产精品300页| 国产黄色大片免费看| 成人18视频免费69| 色哟哟在线观看视频| 国产中文字幕一区二区| 熟女少妇内射日韩亚洲| 开心激情五月网| 亚洲国产欧美日韩在线| 色综合久久五月| 中文字幕免费在线看线人动作大片| 制服 丝袜 综合 日韩 欧美| 美国黄色特级片| 亚洲国产精品第一页| www.黄色在线| 久久aaaa片一区二区| 美女久久久久久久久久| 免费国产羞羞网站美图| 菠萝菠萝蜜网站| www.5588.com毛片| 国产精品扒开腿做爽爽| 顶臀精品视频www| 黑丝av在线播放| 性生活一级大片| 日韩一级av毛片| 野战少妇38p| 日韩a级片在线观看| 国产18无套直看片| 一二三不卡视频| av地址在线观看| 91狠狠综合久久久久久| 日韩片在线观看| 国产成人av片| wwwav国产| 国产精品久久久久久成人| 国产白嫩美女无套久久| 久久久久亚洲av无码网站| 国产美女网站视频| www.狠狠爱| 久久精品一区二区免费播放 | 99久久99久久精品免费| 免费看91视频| 少妇久久久久久被弄高潮| 国产日韩精品中文字无码| 波多野结衣办公室双飞 | 无套内谢大学处破女www小说| 五月婷婷一区二区三区| 黑人操日本美女| 手机av在线不卡| 欧美人妻一区二区三区| 亚洲国产av一区| 日本xxxxxxxxx18| 日韩毛片无码永久免费看| 中文幕无线码中文字蜜桃| 白丝女仆被免费网站| 搡老熟女老女人一区二区| 好吊日免费视频| 魔女鞋交玉足榨精调教| av黄色免费网站| 国产又粗又长又黄的视频| 亚洲色偷偷综合亚洲av伊人| 精品亚洲乱码一区二区 | 一区二区三区影视| 农村黄色一级片| 亚洲av人人澡人人爽人人夜夜| 日本人添下边视频免费| 麻豆国产精品一区| 天美传媒免费在线观看| 成人在线观看小视频| 免费看毛片的网站| www久久久久久久| 成人免费精品动漫网站| 久久久久久久久久久久国产精品| 国产一级二级在线观看| 手机毛片在线观看| 99国产精品免费视频| 蜜桃无码一区二区三区| 一区二区国产精品精华液| 日批在线观看视频| 国产日产在线观看| 久久性爱视频网站| 亚洲精品自拍视频在线观看| 人妻少妇偷人精品久久久任期| 欧美成人午夜精品免费| 天天综合天天做| 一色道久久88加勒比一| 永久免费看黄网站| 91视频免费在观看| 久久久久亚洲av成人网人人软件| jlzzjizz在线播放观看| jizz亚洲少妇| 蜜桃久久精品成人无码av| 午夜福利三级理论电影| 少妇高潮惨叫久久久久| 欧美熟妇一区二区| 国产综合内射日韩久| 精品自拍偷拍视频| 亚洲ⅴ国产v天堂a无码二区| 色婷婷精品久久二区二区密| 天天做夜夜爱爱爱| 国产成人精品视频免费| 一出一进一爽一粗一大视频| 欧美一级大片免费看| 91传媒免费观看| 亚洲一二三精品| 欧美狂猛xxxxx乱大交3| 成年人网站免费看| 中国一级特黄录像播放| 91精品人妻一区二区三区蜜桃2| 久久国产精品国语对白| 成人一级片免费看| 18啪啪污污免费网站| 东京热无码av男人的天堂| 在线观看日本中文字幕| 大地资源二中文在线影视观看 | 在线xxxxx| 在线xxxxx| 国产这里有精品| 中文字幕乱码在线人视频| 久久精品视频免费在线观看| 中文字幕乱妇无码av在线| 又黄又爽又色的视频| 国产综合内射日韩久| 无码人妻一区二区三区精品视频 | 免费黄色在线网址| 亚洲欧美卡通动漫|