首頁 > 新聞 > 智能 > 正文

大廠模型商用開源,阿里云起了個頭

2023-08-04 08:21:30來源:ZAKER科技  

看來開源的力量勢不可擋。

8 月 3 日,通義千問 70 億參數通用模型和對話模型(簡稱 Qwen-7B 和 Qwen-7B-Chat)出現在 AI 模型社區魔搭 ModelScope 上,兩款模型均開源、免費、可商用。


(資料圖)

由此,阿里云成為國內大廠中第一個開源大模型的企業。

Qwen-7B 是支持中、英等多種語言的基座模型,Qwen-7B-Chat 是基于基座模型的中英文對話模型,在許多測基準,比如 MMLU、C-Eval 中,Qwen-7B 在 70 億參數規模領域上都取得了良好的表現,阿里云表示其部分能力甚至可以趕超一些 120 億參數大模型。

用戶目前已經可以從魔搭社區直接下載模型,也可通過阿里云靈積平臺訪問和調用這些模型,而通過開源代碼,用戶可以很方便地在消費級顯卡上部署和運行模型。阿里云基于大模型的服務,包括訓練、推理、部署和精調都可以應用在上述兩個模型上。

這不是國內第一個免費、可商用的大模型。就在半個月前,智譜 AI 宣布 ChatGLM-6B 和 ChatGLM2-6B 允許免費商業使用,百川智能的 Baichuan 13B 模型在發布的同時就開源允許免費商用。

但通義千問是成為了第一個科技大廠的開源大模型,它的開源將被視為國內 " 百模大戰 " 進入新階段的一個標志——現在無論中美,也無論巨頭還是中小初創公司,有關大模型開源的看法正在趨近于一致。

在 Meta 宣布開源 LLaMA 2 的時候,Meta 首席科學家、圖靈獎獲得者 Yann LeCun 就宣稱,大模型行業的競爭格局將會改變。這是因為閉源依靠大力出奇跡的方式證明了大模型路線的可性能和極限,而開源則會通過繁榮的生態,讓大模型變得真正可用、易用。

換而言之,大模型本身的神秘光環正在逐漸消褪。當技術不再難以逾越,繁榮的開源生態以及由此帶來的群策群力的技術迭代和突破就成為了新的護城河。在 7 月舉辦的世界人工智能大會上,阿里云將促進中國大模型生態的繁榮作為自己的首要目標。

為此,阿里云打出了一套組合拳。

比如阿里云的靈積模型服務平臺,它提供了一系列自動化的模型上云工具鏈路,讓模型不僅能通過推理 API 被集成,也能通過訓練微調 API 實現模型定制化。另外,去年推出的 AI 模型社區魔搭,已經聚集了 20 多家頂尖人工智能機構貢獻的 1000 多款開源模型。它們彼此的部署鏈路是打通的,也就是說來自社區的模型可以通過靈積實現服務化——這看上去就像是個起步階段的模型自由市場,它能夠實現,當然是開源的功勞。

而任何市場都需要充分的競爭,歸根結底,阿里云想要通過降低門檻來讓開源大模型生態繁榮起來,就需要提供足夠豐富、足夠高質量的開源大模型參與其中。

通義千問的開源勢在必行。

由此,千帆競渡的百模大戰,現在已經進入到了真刀真槍貼身肉搏環節——模型究竟好不好,不是靠吹出來的,開源到社區里,群眾自會檢驗。

歡迎來到自由的大模型開放世界。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀