首頁 > 新聞 > 智能 > 正文

昆侖萬維「天工」大模型開啟內測，我們跟它聊了聊理想

2023-04-25 21:18:17來源：ZAKER科技

國產 ChatGPT，能再迎一次驚喜嗎？

來源 |AI 藍媒匯

(資料圖)

ID:lanmeih001

作者 | 伊柒

編輯 | 魏曉

" 每隔一段時間，就會有一個革命性的產品出現，然后改變一切。"

這是 2007 年 1 月 9 日，喬布斯在一次手機發布會上的開場白。手機名叫 iPhone，它改變了通訊、娛樂和移動互聯網。之后，iPhone 或是和 iPhone 類似的手機，出現每個人的手中。

2022 年 11 月 30 日，由 OpenAI 研發的 ChatGPT 問世。

在最初的描述中，ChatGPT 被稱為 " 聊天機器人程序 "，但人們發現這個 AI 能做的不只是 "Chat" ——之后的幾個月，人們陸陸續續將它接入各種場景：答疑、編程、繪畫、翻譯、文本創作、廣告設計、頭腦風暴……然后震驚于 AIGC 的想象力、創造力和生產效率。從聊天到創作，或許在 2023 年之后，沒有任何一個行業有理由完全排除 AIGC。

此時此刻，恰如彼時彼刻。

但也有不同——這一次，國內 AI 行業的跟進遠比過去及時。百度、商湯等幾位 AI 課代表很快推出了類似 ChatGPT 國產 AI 大模型，外界的質疑聲中漸漸聽到了掌聲。

2023 年 4 月，昆侖萬維「天工」3.5 大語言模型發布，并啟動邀請測試。AI 藍媒匯（ID：lanmeih001）的藍媒君第一時間對話了「天工」大模型。

對話的內容，都和 " 理想 " 有關：

AI 大模型沒說自己的理想，但它鼓勵藍媒君堅持理想—— " 記得不要因為挫傷自尊心而放棄。"

昆侖萬維的理想—— " 目前版本我們對標的主要是 OpenAI 的 ChatGPT。未來讓它盡快達到 GPT4 的能力。"

國產 ChatGPT，能再迎一次驚喜嗎？

第一個實現 " 智能涌現 " 的國產大模型

在和「天工」大模型的對話中，藍媒君預設了一個場景：中學老師與學生對話，目的是確定學生的興趣。

對話過程如下。

藍媒君確實曾和體育場里面的小朋友聊過這個問題，當時小朋友的回答是 " 喜歡跑步 "、" 覺得好玩 "。盡管在一開始就預設了問答模式，但「天工」大模型在實際對話中并沒有完全遵循 " 每答必問 " 的結構——或許是算法判定藍媒君 " 喜歡踢足球 " 這個話題已經討論充分，可以作為 " 你的興趣是什么 " 的答案。

藍媒君提出了第二個興趣，看書。

從這里可以看出，「天工」大模型依然延續著剛才關于 " 確定興趣 " 的這個話題，并遵循了問答結構。

對話繼續，藍媒君的愛好很多。

「天工」大模型所給出的反饋始終直白，像是兩位小朋友最日常的對話：你喜歡科學，那你會怎么做？

以上文本在成年人看來略顯簡單，但一問一答確實符合需求——「天工」的回答做到了邏輯通順、推進溝通。而這種簡單通順，或許正是人們需要的。

或許整場對話難言十分驚喜，但至少從對話邏輯和內容上，「天工」基本做到了連貫通順、符合人類邏輯。

在談到大模型的邏輯推理時，昆侖萬維稱，「天工」目前的記憶力大約可支持 20 輪次以上的交互式問答，文本容量也在萬字以上。

" 在 AI 領域，進行自主學習并完成邏輯推理等任務的能力，被稱為‘涌現’能力。" 而根據昆侖萬維 CEO 方漢的介紹，「天工」大模型是目前 " 國內第一個實現智能涌現 " 的國產大語言模型。

這是一個在相對簡單的系統中，由量變產生質變，最終產生復雜的行為或特性的過程。

而根據官方提供的測試數據，基于千億基座模型和千億排序模型，「天工」大模型生成內容已經能夠在某知識社區的問答中，獲得 KOL 級的贊同和回應。

但「天工」偶爾也有失誤的時候。

在另一份關于數學題的測試中，天宮大模型準確算出了一道雞兔同籠題目，但卻被另一道來自中學數學課本的一元一次方程困住，并最終得出了一個錯誤的計算結果。

或許是對題干的理解偏差，或許是方程組相關的數據訓練還不夠完善，「天工」在運算方面的能力和方法，仍有些改進空間。

談及大模型訓練的工程進度，昆侖萬維方面表示，關于數據的篩選、剪枝和清洗是 " 長期主義 " 的過程——「天工」大模型將在后續的迭代中，通過篩選數據調整參數改進模型設計。

" 問題會有，但正視差距不會影響團隊的信心。"

而「天工」大模型，也只是昆侖萬維在 AIGC 賽道內的落腳點之一。

合作破局

和大模型同期公布的，還有昆侖萬維同阿里云的 AI 合作項目。

4 月 11 日的阿里云峰會上，昆侖萬維與阿里云共同發布了包括智算中心建設、大模型訓練等領域戰略合作。

這并非是兩家公司首度牽線—— 2015 年到 2020 年間，昆侖游戲、閑徠互娛，OPay 海外支付業務已經相繼接入了阿里云業務。

兩家公司在 AI 領域的合作則稍晚一些。2021 年，昆侖萬維開始規劃自建大語言模型之后，于 2022 年 2 月敲定第一批 AI 算力集群的項目合作。

項目的合作方，正是阿里云：" 當時合作主要是依托阿里那邊的高性能 AI 計算集群，進行大規模語言模型預訓練工作。"訓練內容囊括了算法與架構的協同、計算流水線與架構的協同、最優化存儲、TCO 優化四個方面。

雙方此番合作，目標是則是要進一步盤活國內 AIGC 生態——不只是大廠背書，還有技術合作。

昆侖萬維方面表示，隨著「天工」訓練規模的擴大，模型參數逐漸接近萬億規模，" 單個訓練任務需要 5000 張以上 A100（GPU 芯片），這樣大規模的 GPU 集群下，通信會產生大量的擁塞，訓練效率會越來越低，對存儲讀寫性能同樣是個挑戰。"

而阿里云所提供的，則是業內最領先的算力平臺。" 后續昆侖萬維的 AIGC 業務，預計會有阿里云的靈駿底座 +PAI 軟件平臺加持。"

AI 藍媒匯曾在一文中提及，國內 AIGC 項目始終繞不開算力和成本的阻力，昆侖萬維 CEO 方漢也表示，在目前的大模型訓練中，購買或者租賃英偉達的 A100 系列 GPU 仍占據了不少開銷。

"資源是一張門票。大模型訓練的門檻就是幾千張 GPU 芯片。而在芯片到齊之后，接下來還要拼工程經驗——實驗的速度，人才的厚度。"

圍繞 ChatGPT 開展的 AIGC 項目，在變現之前仍需付出。

按照計劃，在 2023 年的 6、7 月份，阿里云會為昆侖萬維打造一個專屬的、支持萬卡擴展的 AI 算力集群。

" 我們期望與阿里云展開深入合作，激活國內 AIGC 技術生態，為中小企業和開發者的創新提供便利。我們一直覺得，當產品的能力足夠好、真正能夠幫助用戶解決剛需，那么獲得經濟回報就是水到渠成的事。"

而現階段昆侖萬維的業務重心，則仍在研發和訓練領域：" 潛下認真打磨產品，幫助模型進化到更高水平，讓它盡快達到 GPT4 的能力。"

可以預見的是，在未來一段時間內，包括昆侖萬維在內的國內 AI 玩家，仍將面對 GPU 資源量方面的阻力，仍將是賽道內的追趕者。

至于何時追近，能否比肩，AIGC 的從業者同樣需要市場和時間來解答。

今日話題

你想和 AI 大模型聊什么？

來評論區我們聊聊 ~

關鍵詞：

責任編輯：hnmd003

昆侖萬維「天工」大模型開啟內測，我們跟它聊了聊理想

相關閱讀

相關閱讀

精彩推薦

閱讀排行

精彩推送

推薦閱讀