首頁 > 新聞 > 智能 > 正文

對話金山辦公 CEO 章慶元:相比微軟,我們要跑得更快 全球快看點

2023-05-08 11:08:12來源:ZAKER科技  

誰也沒想到,金山辦公居然是國內第一個將大語言模型(LLM)應用在辦公軟件領域,并真正交付了可用產品的公司。

畢竟,比起全方位集成 ChatGPT 的微軟 Office,以及宣稱開發出自己的類似微軟 " 智能辦公副駕 "Copilot 功能的釘釘和飛書,金山辦公并不是一個通常處在風口上和聚光燈下的玩家,它看上去有些另類,安靜不聒噪。但是,人們不能忽略的是:金山辦公的 WPS 是國內市場份額最高的辦公軟件產品,迄今已經有 35 年的歷史。


(相關資料圖)

毫無疑問,一款 35 年的辦公軟件要完成一次基于大語言模型的人工智能革命,是一個充滿挑戰的、困難的,但又波瀾壯闊的歷程。畢竟,我們都清楚一件事情——任何一家傳統業務做得越深越強的公司,要實現迅速轉向并非一件易事。

目前,金山辦公這個基于大語言模型的人工智能應用,被稱作 WPS AI,已經展現了類 Notion AI 的能力。

WPS AI 確定的三個戰略方向分別是:讓 AIGC 輔助用戶生產更優質的文章;讓閱讀理解為用戶提供個性化知識庫檢索和信息生成;以及通過人機交互,讓辦公軟件可以 " 聽懂 " 用戶的任意需求,完成自動操作。

值得一提的是,至少在目前,金山辦公沒有獨立研發大語言模型,它選擇當 " 甲方 ",使用大語言模型開發方如百度、MiniMax,開發自己的 WPS AI。在眾聲喧嘩的 " 百模大戰 " 之側,它顯得多少有些另類。

不僅如此,在與金山辦公 CEO 章慶元的訪談中,品玩聽到了諸多 " 另類 " 的," 反傳統思維 " 的觀點。

比如,章慶元認為,跟大語言模型聊天的場景,就像是移動互聯網早期的湯姆貓和憤怒的小鳥,或者是水果忍者,是非常初級的應用,未來大語言模型的核心場景,肯定不在聊天上。

比如,章慶元相信,大語言模型開發和實現的算力成本,未來會出現明顯的下降,現在拼命砸錢 " 燒顯卡 " 的現象會被終結。

比如,章慶元預估,大概再過一年,人們就可以用 "100 塊錢一個月請一個全能 Office 助手 " 的方式,實現對辦公軟件全新的掌控,任何復雜的表單、表格和計算等工具欄都會從辦公軟件上消失,用 " 訂閱 " 的方式根本改變辦公軟件的商業模式。

這些 " 反傳統思維 " 的辦公軟件變革思路,正在很大程度上決定著中國最老牌的辦公軟件未來的走向。

就像五年前人們還不相信微軟會在人工智能的 " 圣杯之戰 " 中徹底翻盤取得對 Google 的優勢地位那樣,對同樣老牌、脫胎于桌面辦公軟件時代的金山辦公,我們也需要有一些 " 反傳統思維 " 的期待。

以下是品玩與金山辦公 CEO章慶元的對話實錄:

對話人:駱軼航 申遠

受訪人:章慶元

問答部分經過整理編輯

我們過去解決的問題,現在看來索然無味

品玩:一開始看到 GPT,您的第一個想法是什么?

章慶元:這個世界變了。用了一下之后我就感覺,人類好像要被顛覆了(笑)。因為我是程序員出身的,我發現它會自己寫代碼,這是一件很震撼的事情。

品玩:什么時候決定在 WPS 里面集成大模型。

章慶元:春節過后我們就開始折騰了。

品玩:但那個時候感覺很多人都還沒理解發生了什么。

章慶元:在我看來大模型對軟件業是一個完全的顛覆性改變。今天我回頭去看,我們過去解決的東西可以說索然無味。比如過去我們一個團隊干一個季度,就是為了把打印預覽給改個版。大模型出現后,這些東西都沒有任何意義了,現在團隊所要做的不是自己閉門造車想用戶的需求,而是如何把軟件本身和 AI 能力做結合,大模型變成了統一的解決方案。

品玩:就辦公軟件這個賽道來說,大模型的革命性體現在哪兒,它能做什么?

章慶元:Office 類軟件為什么做的這么復雜、這么難用?我做了 20 年辦公軟件,我一直都覺得辦公軟件非常難用。為什么呢,因為用戶的需求太多了、太復雜了,所以我們的單元格屬性、文字、字體、排版,它們統統都集成了太多的功能,WPS 的 API 接口就有幾千個,一方面這說明了我們的功能強大,但另一方面這也讓普通用戶上手非常困難,誰沒事去翻底層那么多的功能怎么用?。课覀兒芏喙δ埽脩舾径疾恢烙羞@個功能。

但大模型出來之后,這些復雜功能都變成了 API 的一個調用。用戶只需要和它對話就能實現任意功能,也就是說,用戶的需求直達我們產品功能的底層,這是革命性的。

品玩:所以辦公軟件是最適合被大模型革命的?

章慶元:美圖秀秀和 Photoshop 兩個東西我們都很熟悉,不考慮價格,在大模型價值上你覺得它們誰更優秀?我認為是 Photoshop。因為過去它太復雜了,它是個專業軟件,一般人根本上手不了,而美圖秀秀非常簡潔。但有了大模型一切都變了,用戶只需要問問題就行,有了思維鏈能力的大模型,能夠針對性解答問題,再把解答編寫成腳本來調用對應的 API,這會讓包括 Photoshop 在內的所有復雜軟件都變得非常簡單易用。

所以大模型對效率的提升并不局限在辦公領域。只要軟件底層能力足夠強大,軟件的復雜度對用戶來說不再是問題,這對任何軟件來說都適用。

品玩:一個人自己在一個辦公文檔上做復雜的操作,變成用一個對話機器人來進行操作,這還是同一個產品嗎,文檔的界面是不是跟過去長的都不一樣了?

章慶元:文檔產品本質還是用來表達思想的,這些需求永遠不會消失。所以未來的軟件應該既有輸入界面,也有和大模型的交互界面,它們是并存的,只是軟件本身變得非常簡潔,你看微軟的 Copilot 視頻,它的工具欄只有短短一行。

大模型的出現會讓很多東西消失,比如 BI 直接就給干掉了。大模型加電子表格就是一個最好的低代碼平臺,你需要什么就對大模型說,它直接就幫你做出來了。

品玩:過去幾年,關于 " 怎么辦公 " 的話語權很大程度上被釘釘和飛書壟斷了?,F在大模型的出現,是不是意味著這個賽道出現了全新的機會?更直接點說,是不是對金山辦公是個新的機會?

章慶元:我們倒沒想著要顛覆誰,我們只是覺得這玩意對我們來說是一個從燃油車升級到電車,甚至是比這個還大的一個升級。

WPS 所謂的辦公軟件更多是從微軟 office 這個傳統層面上講的,釘釘飛書包括企業微信,單就文檔能力來說,我們有自己的優勢。大模型確實會帶來重新洗牌的機會,但對我們來說,首要考慮的是如何升級我們自己的產品,這就回到了文檔產品表達思想的本質。

我們公司的使命是 " 簡單創作、輕松表達、實現價值的連接 "。有時對用戶來說,從一張白紙開始畫畫是很難的,但如果給你一個填色卡,那我相信誰都可以畫出一幅很棒的畫來,所以我們過去推出了模板商店稻殼,現在又在輕文檔上集成了 AIGC(人工智能生成內容——編者注)的能力,它和 Notion AI 一樣可以幫你起草、潤色、修改文章,其實等于是用大模型搭框架幫助你去表達。

你放心,將來再也不會有人看類似《21 天 Word 從入門到精通》這樣的書了,因為大模型解放了人表達和創造的能力。

品玩:WPS AI 要做的三個方向:AIGC、閱讀理解和人機交互,它們的關系是什么?有沒有哪一個是真正在人工智能時代有決定性影響的?

章慶元:最重要的應該是后面兩個,閱讀理解和人機交互。AIGC 我認為是比較簡單的。

我們的輕文檔已經用上了 AIGC 的能力。我覺得用戶在創作和表達的時候,AIGC 賦能的過程其實只占一小步,它現在的作用其實和模板商店差不多,只不過大模型會自動把內容填進模板里而已。最重要的還是后面兩個。

首先是閱讀理解,或者說內容分析,那就是構建用戶的知識庫。我們有 2000 多億個文檔儲存在云上,在大模型出現前這些數據都是死的,大模型相當于給每個用戶提供了一個私人 New Bing(微軟的搜索引擎——編者注),它能理解你沉淀的個人文檔數據。舉個例子,比如我是公司老板,我想要知道過去幾天我們公司軟件的卸載率是多少,不需要再讓下屬加班整理資料了,直接問大模型,它就會自動生成出來。

大模型不是僅僅提取我的內容,而是理解并從中分析出新的知識和信息來,這對效率的提升是巨大的,過去企業很痛苦的一件事情,就是如何處理非結構化數據,現在靠大模型就能解決了。

品玩:它會從根本上改變 WPS 的商業模式么?

章慶元:這個能力想象空間就非常大了。人機交互也就是微軟的 Copilot 能力,這個很好理解,它對用戶的影響,包括對我們商業模式的影響將是非常巨大的。我問你,你愿不愿意一個月花 100 塊錢請一個 7x24 小時隨時在線,速度飛快不出錯的 Office 高手來幫你工作?它不僅懂你說什么,而且對軟件的所有復雜功能了如指掌,你愿不愿意用?

答案是顯而易見的,我們未來的商業模式可能就建立在這個基礎上。

品玩:那這幾個戰略方向有具體的時間表嗎?

章慶元:未來幾個月內,我們的產品上就會逐漸上線這些功能,當然國內和海外版有所區別。因為海外版可以直接使用 OpenAI 的接口,這樣在人機交互方面表現可能會更好一些。而國內在知識庫構建上可能會更快一點,因為海外大家基本上不做什么私有化部署??偟膩碚f,我們的節奏應該比微軟快很多。

我們的定位是做一個好甲方。

品玩:為什么金山辦公沒有自己做大模型?

章慶元:舉個例子,現在國內就連大廠都很難搞到足夠的 GPU,另外一個是成本,現在的算力成本還是非常高的,說實話,你真要指望靠自研大模型商業化,那現階段基本上肯定是虧的。

金山辦公做人工智能很多年了,不是因為有了 ChatGPT 才瞄準這個賽道的。這也是我們為什么能這么快推出 WPS AI 的原因。當我們回顧更早期人工智能發展就會發現,算力成本過一段時間后就會大幅下降,所以何必現在這個時候花很大的代價去搶卡呢?

品玩:但其實現在依然有很多創業公司在做大模型啊?

章慶元:我們現在回頭看,早年我們做一個 CV(計算機視覺——編者注)模型都很難的。但過幾年后你就發現算力的成本大幅下降了?,F在我們有自己的 CV 模型,就是做文檔掃描這種工作,效果我說實話我們內部測評應該是行業里面最好的。因為我們現在做其實成本很低,要是三年前做的話成本是非常非常高的。

成本居高不下,效率就會很低,除了算力,在人才儲備上現在也不是個好的時間點,但 " 百模大戰 " 之后市場環境可能大不一樣,那個時候不管是投資也好,甚至直接去收一支團隊,都會是個更好的選擇。

品玩:金山辦公為什么選擇跟 MiniMax 合作做大模型的應用?

章慶元:其實我們每一家都接觸了,但大家做得有快有慢,MiniMax 在大模型領域投入比較早,它們是有現成的模型可以用的,以及非常重要的一點,出于合規、監管等方面的考慮,我們的大模型必須能夠實現私有化部署,像 MiniMax 本身就是做 to B 服務的,因此在私有化、包括個性需求方面能夠比較好滿足我們的要求。

特別要說的是,其實我們自己的整體大模型策略不是只用一家的產品,也不是只用一個模型。實際上像百度這樣大廠的大模型在通用能力上,比如翻譯、潤色文章或者寫一首詩上肯定是有優勢的,所以未來我們會根據不同的場景做一系列模型。

品玩:比如自己做個中模型或者小模型?

章慶元:這就像醫院的分診臺一樣,需求來了,思維鏈做的特別好的大模型就可以用來對標開發微軟 Copilot 的人機交互功能;需要通用能力的地方,比如寫首詩、寫個提綱之類的,我們會接入大廠大模型;而對文檔內容的抽取,則會利用 MiniMax 給我們提供的能夠私有化部署的大模型。

這樣不僅能更好地充分利用不同大模型之間的能力,而且從成本角度講也是合算的。比如 Copilot,它本身對思維鏈的要求很高,一定要有專用模型,如果用大模型從頭去做的話成本哪怕一年、兩年之后都太貴了。

品玩:所以金山辦公還是總有一天會做自己的大模型的?

章慶元:我們稱之為 " 自主可控大模型 ",這當然是一定的。但自主可控有很多方式,自研是一種,外部提供的專門定制優化的大模型同樣也可以稱之為自主可控。

其實大家都很愿意和金山辦公合作,因為辦公是一個很重要的場景,而金山辦公在中國是絕對的第一,所以我為什么不選擇當一個很好的甲方而非要自己去做一個未必有很好效果又很費錢的大模型呢?

現在的大模型應用還處在 " 湯姆貓 " 和 " 憤怒的小鳥 " 階段

品玩:前面說的那種花 100 塊錢就能請一個全天候 Office 助手這么好的事,金山辦公需要花多久實現?

章慶元:可能要久一點,還得一年吧。

品玩:這中間還需要幾個產品化的升級步驟?

章慶元:就差一個吧,就是國內的大模型有了很好的 Codex 能力(Codex 是一種預先訓練過的、基于轉換的編碼器 - 解碼器模型,它可以學習自然語言和編程語言之間的代表性上下文,進而做出合理的答復——編者注)

品玩:那您怎么看美國的 Notion AI,它是完全長在 ChatGPT 上的,它是金山辦公的對標么?

章慶元:NotionAI 和我們的輕文檔做的東西差不多,但是 WPS 的底層能力比它強多了。這其實回到了我們最開始談到的 AIGC 問題,用戶并不需要你每天幫它生成五個提綱,這不是最常見的場景。我自己覺得,現在跟 10 來年前移動互聯網剛開始的時候很像,那時候大家在做什么?湯姆貓、憤怒的小鳥和忍者切水果。

我認為大模型應用發展同樣處于這個湯姆貓的階段,未來一兩年應該有很多新的應用場景出現。

品玩:那在您看來實現大模型應用發展的突破,告別湯姆貓,需要什么條件?

章慶元:第一是你的工程能力,因為它決定了你對 GPU 利用效率的高低。訓練大模型說實話,算法大家用的都是同一套,關鍵看如何發揮 GPU 的能力,上萬張卡啊,那么龐大的集群沒有出色的工程能力,算力是沒法很好發揮的。

第二點很重要,你是不是上輩子做了一些好事,運氣特別好?(大笑)因為今天為止沒有任何一個人能說清楚我訓練出來的東西為什么就是這樣的。所以現在 " 百模大戰 " 也是個好事,混戰之下說不定就訓練出來幾個智商特別高的大模型出來,是有這個可能的。我覺得中國的 AI 應用最后會跑在美國前面。

品玩:您說金山辦公要有 " 自主可控的大模型 ",這對中國的辦公軟件事業有什么意義?

章慶元:意義當然很大。因為 WPS 在自主可控上已經做了很多年了,我從 2001 年開始就在做相關的事了,大模型加進來后,對中國自己產品的競爭力一定是個比較大的幫助,想要做最懂 Office 的大模型,需要我們和模型方一起聯合開發,這區別于通用大模型的能力。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀