經(jīng)濟(jì)觀察網(wǎng) 記者 錢玉娟
繼海外開源大模型體系推出并實(shí)現(xiàn)商用化后,8月3日,阿里云宣布其自研的大模型通義千問正式開源,成為首個宣布大模型開源的大型中國互聯(lián)網(wǎng)科技公司。具體來看,通義千問70億參數(shù)的通用模型Qwen-7B和對話模型Qwen-7B-Chat,均上架在AI模型社區(qū)魔搭ModelScope,開源、免費(fèi)、可商用。
據(jù)了解,魔搭社區(qū)是阿里云在2022年?duì)款^發(fā)起的一個AI模型社區(qū),借此服務(wù)AI開發(fā)者。官方數(shù)據(jù)顯示,目前魔搭社區(qū)聚集了超20家頂尖人工智能機(jī)構(gòu)貢獻(xiàn)的1000多款開源模型,是中國大模型開源的第一門戶。
不過,在此之前的6月,由王小川創(chuàng)立的人工智能創(chuàng)新科技公司百川智能,先后推出了70億規(guī)模參數(shù)的Baichuan-7B開源模型,以及號稱擁有130億的參數(shù)規(guī)模的Baichuan-13B模型,率先成為國內(nèi)推行完全開源、免費(fèi)可商用的大模型創(chuàng)業(yè)公司。
在加入魔搭社區(qū)的開發(fā)者飛鯨看來,盡管通義千問開源的模型參數(shù)只有70億,但經(jīng)過微調(diào)后,模型的數(shù)學(xué)推理能力表現(xiàn)不錯,“對于一些常見的加減乘除應(yīng)用題,答得還可以。”
伴隨通義千問開源消息發(fā)出,兩個模型在社區(qū)上架后,應(yīng)用開發(fā)者等用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調(diào)用Qwen-7B和Qwen-7B-Chat兩個模型。當(dāng)用戶使用上述開源大模型體系的過程中,阿里云會提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全套服務(wù)。
今年4月推出自研大模型通義千問后,今年7月,阿里云宣布將促進(jìn)中國大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供智能算力、開發(fā)工具等服務(wù)。
談及當(dāng)前國內(nèi)外開源的模型,飛鯨認(rèn)為對包括他在內(nèi)的開發(fā)者們幫助極大,“可以基于自己的業(yè)務(wù)領(lǐng)域需求,做finetune(微調(diào))或者和本地知識庫對接,實(shí)現(xiàn)快速地業(yè)務(wù)落地。”
飛鯨告訴記者,在一些垂直領(lǐng)域并不需要參數(shù)量很高、通用能力很強(qiáng)的模型,而是“希望一些小甜點(diǎn)”,他舉例到,比如幾十到百億左右參數(shù)規(guī)模的模型,結(jié)合垂直領(lǐng)域數(shù)據(jù),就可以發(fā)揮很好的價值。
阿里云方面認(rèn)為,開源大模型可以幫助用戶簡化模型訓(xùn)練和部署的過程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。
京公網(wǎng)安備 11010802028547號