11 月 13 日,“數(shù)聚未來 —— 鳳凰大模型數(shù)據(jù)研討沙龍” 成功在京舉行,鳳凰衛(wèi)視融媒體研發(fā)副總監(jiān)經(jīng)理馮偉正式對外發(fā)布鳳凰數(shù)據(jù)首批高質(zhì)量數(shù)據(jù)集——“中文訪談對話數(shù)據(jù)集” 和 “正向價(jià)值對齊數(shù)據(jù)集”。他表示,鳳凰數(shù)據(jù)的核心目標(biāo)是推動 AI 數(shù)據(jù)領(lǐng)域華語數(shù)據(jù)的豐富與共享,同時(shí)為中華文化的傳承與傳播提供AI時(shí)代的探索思路和解決方案,讓 AI與中華文化認(rèn)知對齊更簡單。
其中,“中文訪談對話數(shù)據(jù)集”基于鳳凰衛(wèi)視訪談類節(jié)目生成,規(guī)模達(dá)百萬輪次,連續(xù)對話的平均輪次超30輪次。“正向價(jià)值對齊數(shù)據(jù)集”的構(gòu)建則以權(quán)威學(xué)術(shù)團(tuán)隊(duì)的研究成果為指導(dǎo),由鳳凰衛(wèi)視專業(yè)內(nèi)容團(tuán)隊(duì)人工撰寫而成,規(guī)模達(dá)十萬個問答對。
除上述兩個數(shù)據(jù)集外,鳳凰數(shù)據(jù)還有多個數(shù)據(jù)集正在加工生成中,包括面向財(cái)經(jīng)領(lǐng)域的評論數(shù)據(jù)集、面向視頻內(nèi)容理解領(lǐng)域的視頻問答數(shù)據(jù)集、面向數(shù)字人領(lǐng)域的談話動作數(shù)據(jù)集和語音合成數(shù)據(jù)集等。同時(shí),鳳凰數(shù)據(jù)也在與數(shù)據(jù)伙伴共同構(gòu)建具有高價(jià)值和稀缺性的高質(zhì)量數(shù)據(jù)集,包括華語圖文對數(shù)據(jù)集、華語書籍?dāng)?shù)據(jù)集和網(wǎng)絡(luò)流行語數(shù)據(jù)集等。
除了高質(zhì)量數(shù)據(jù)集產(chǎn)品外,鳳凰數(shù)據(jù)還將推出以數(shù)據(jù)為中心的一站式 AI 訓(xùn)練平臺,計(jì)劃于近期開放內(nèi)測。平臺將與高質(zhì)量數(shù)據(jù)集市實(shí)現(xiàn)互聯(lián)互通,確保數(shù)據(jù)在平臺內(nèi)的安全使用。平臺也將提供一系列以數(shù)據(jù)為中心的服務(wù),包括豐富的數(shù)據(jù)處理工具、可視化模型訓(xùn)練和微調(diào)套件、全面的數(shù)據(jù)和模型評估框架和多云異構(gòu)的算力資源。
2024 年,鳳凰數(shù)據(jù)計(jì)劃分三批發(fā)布更多高質(zhì)量數(shù)據(jù)集,并正式上線 AI 訓(xùn)練平臺。同時(shí),鳳凰數(shù)據(jù)還將舉行“Link+科技峰會”和“AI數(shù)據(jù)挑戰(zhàn)賽”等系列活動,面向高校及科研院所,鳳凰衛(wèi)視還將發(fā)布“鳳凰智媒 AI 筑巢計(jì)劃”,提供部分?jǐn)?shù)據(jù)集的免費(fèi)授權(quán),以助力學(xué)術(shù)研究和創(chuàng)新。鳳凰 AI 數(shù)據(jù)官網(wǎng)(https://www.feng-data.com)于發(fā)布會當(dāng)天正式上線,為行業(yè)客戶提供數(shù)據(jù)集試用下載服務(wù)。
京公網(wǎng)安備 11010802028547號