<tbody id="wa2ww"><abbr id="wa2ww"></abbr></tbody>

<nav id="wa2ww"></nav>

首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展

首頁(yè) >> 人工智能 >> 正文

AI公司MosaicML推出70億參數(shù)模型MPT-7B-8，號(hào)稱“一次處理 8000 字長(zhǎng)文本、可商用”

2023年7月26日 10:26 IT之家作者：漾仔

AI 創(chuàng)業(yè)公司 MosaicML 近日發(fā)布了其 70 億參數(shù)模型 MPT-7B-8K，據(jù)悉，該模型一次可以處理 8000 字文本，相當(dāng)擅長(zhǎng)處理長(zhǎng)文重點(diǎn)摘要和問答，還能在 MosaicML 平臺(tái)上根據(jù)特定任務(wù)，進(jìn)一步微調(diào)相關(guān)配置。

據(jù)悉，系列模型采用了 150 萬個(gè) Token，并以 256 塊 H100 GPU 花 3 天完成模型訓(xùn)練而成。MosaicML 本次發(fā)布了 3 個(gè)版本模型，包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。

其中，第一個(gè)版本 MPT-7B-8k、是以 Transformer 解碼器為基礎(chǔ)，并以 FlashAttention 和 FasterTransformer 機(jī)制來加速訓(xùn)練與推論，能一次處理 8000 字文本，MosaicML 公司表示，該模型開源、允許商用。

第二個(gè)版本 MPT-7B-8k-Instruct 是以第一個(gè)版本 MPT-7B-8k 微調(diào)而成，MosaicML 公司表示，MPT-7B-8k-Instruct 模型可處理長(zhǎng)篇指令，特別注重于生成“摘要和問答”，該模型一樣開源且可商用。

第三個(gè)版本 MPT-7B-8k-Chat 則是機(jī)器人對(duì)話式的 AI 模型，MosaicML 公司宣稱，該模型額外多用了 15 億個(gè)聊天數(shù)據(jù) Token，在第一版模型 MPT-7B-8k 之上繼續(xù)訓(xùn)練而成，該模型開源，但不允許商用。

據(jù)此前報(bào)道，MosaicML 公司也推出了一款號(hào)稱訓(xùn)練成本僅為競(jìng)品零頭的 MPT-30B 開源模型，該公司日前已將所有開源模型發(fā)布于 Huggingface 平臺(tái)，感興趣的小伙伴們可以前往進(jìn)行相關(guān)了解，還可以在本地硬件上使用自己的數(shù)據(jù)，在下載后，對(duì)模型進(jìn)行各種微調(diào)。

編輯：章芳

聲明：刊載本文目的在于傳播更多行業(yè)信息，本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題，請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777，郵件后綴為#cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。

相關(guān)新聞

·提速云端，引領(lǐng)創(chuàng)新 SAP賦能新型中國(guó)企業(yè)把握三大發(fā)展趨勢(shì)	·中國(guó)廣電2024年度工作會(huì)議:全面實(shí)施“1368N”計(jì)劃
·電信運(yùn)營(yíng)商在生成式人工智能生態(tài)中的角色定位	·工信部：已推動(dòng)超1.4億臺(tái)國(guó)產(chǎn)智能手機(jī)和智能電視適老化..
·機(jī)構(gòu)：2024年小芯片市場(chǎng)規(guī)模將達(dá)44億美元	·6G行業(yè)新標(biāo)準(zhǔn)再出優(yōu)選布局場(chǎng)景是發(fā)展關(guān)鍵
·機(jī)構(gòu)預(yù)測(cè)2024年5G智能手機(jī)市場(chǎng)：Top3格局不變，5G毫米..	·聯(lián)想高管：三年內(nèi)摩托羅拉成為全球TOP3手機(jī)廠商
·OPPO與諾基亞簽署5G專利交叉許可協(xié)議雙方將結(jié)束所有未..	·Canalys發(fā)布2024年全球科技行業(yè)十大趨勢(shì)：中國(guó)將成為全..
·賦能千行百業(yè) 工業(yè)互聯(lián)網(wǎng)讓數(shù)字化具象化	·我國(guó)蜂窩物聯(lián)網(wǎng)用戶已有23.32億戶占移動(dòng)網(wǎng)終端連接數(shù)..
·2023年全國(guó)移動(dòng)短信業(yè)務(wù)量下降0.3% 收入比上年下降0.7%	·全國(guó)移動(dòng)互聯(lián)網(wǎng)用戶達(dá)15.17億戶 2023年全年凈增6316萬戶

人物

工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源

·信通院曹薊光：下一代網(wǎng)絡(luò)研究正..

·信通院張海懿：量子信息技術(shù)已進(jìn)..

·信通院李文宇：醫(yī)療仍是腦機(jī)接口..

·信通院周蘭：元宇宙尚處于早期的..

·中國(guó)信通院孟楠：新型內(nèi)生安全技..

·栗蔚：算力互聯(lián)互通體系讓算力真..

精彩專題

專題丨“汛”速出動(dòng) 共筑信息保障堤壩

2023MWC上海世界移動(dòng)通信大會(huì)

中國(guó)5G商用四周年

2023年中國(guó)國(guó)際信息通信展覽會(huì)

CCTIME推薦

·崔巍出席省青年企業(yè)家助力高質(zhì)量..

·2023中國(guó)企業(yè)信用500強(qiáng)發(fā)布中天..

·5G、AI等技術(shù)創(chuàng)新應(yīng)用力度加大數(shù)..

·FTTR進(jìn)入規(guī)模發(fā)展加速期

·400G將在今年實(shí)現(xiàn)規(guī)模商用

·喜迎開門紅！中信科移動(dòng)中標(biāo)中國(guó)..

·聚焦開源、合作共建：openGauss打..

·中天科技緊急馳援甘肅災(zāi)區(qū) 首批通..

·情暖隴原，共克時(shí)艱！亨通緊急馳..

·強(qiáng)基賦智 | 思特奇數(shù)據(jù)中臺(tái)數(shù)智化..

·重磅！亨通成為全球“燈塔工廠”

·中信科移動(dòng)積極參加2023全球6G發(fā)..

·數(shù)據(jù)筑基加速產(chǎn)業(yè)升級(jí)——思特奇..

·亨通量子“江蘇省量子保密通信試..

·5G融合創(chuàng)新提檔升級(jí) 構(gòu)筑產(chǎn)業(yè)新優(yōu)勢(shì)

關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱：北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可，禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像

<tfoot id="awmua"></tfoot>

<nav id="awmua"><center id="awmua"></center></nav>

<button id="awmua"></button>

<dl id="awmua"><delect id="awmua"></delect></dl>

<pre id="awmua"><fieldset id="awmua"></fieldset></pre>