大模型應用瘋狂加速,洗牌卻在靜悄悄進行了

0 評論 2350 瀏覽 5 收藏 16 分鐘

截至8月底,首批8家AI大模型企業通過備案,隨著未來不斷有新的企業通過備案,“大模型+”的應用拐點正在到來,或許在不久之后,以“實用”為導向的大模型將成為行業趨勢呢!

在被譽為“科技企業營銷圣經”的《跨越鴻溝》一書中,杰弗里·摩爾寫道:“高科技產品面世過程中,最危險、最關鍵的一點,就是由少數有遠見者所主宰的早期市場,向實用主義者占支配地位的主流市場過渡?!贝丝?,狂飆突進已半年有余的國內生成式人工智能(AIGC)市場,正面臨著這個關鍵的過渡。

截至8月底,首批8家AI大模型企業通過備案。與上半年“甚囂塵上”的行業境況不同,具備實力且具備滿腔“產業抱負”的實力型玩家,總是姍姍來遲,但卻總是能夠一鳴驚人,為產業的大規模應用創造機會。目前來看,隨著未來不斷有新的企業通過備案,“大模型+”的應用拐點正在到來。

一、“大模型+”應用拐點加速到來

8月份剛剛過去,9月初百度就迫不及待地對外公布了文心一言大模型開源。與此同時,“姍姍來遲”的騰訊混元大模型,一亮相便“秀”起了“肌肉”,科大訊飛與華為合作發布“星火一體機”,進一步把大模型端側應用擺在了臺面上。

1. 大模型從C端應用逐漸轉向B端應用領域,以“實用”為導向的大模型日漸成為行業趨勢

自從去年12月ChatGPT,在短短一個月之內實現月活破億之后,圍繞整個C端市場的AI大模型玩家如百度等,就開始大規模地涌入該領域,一時之間C端大模型應用迎來了外界的一致關注。

但進入下半年以后,市面上越來越多的“面向B端”的應用開始出現,更加“實用”的行業大模型也在成群結隊地出現,大大加速了生成式AI產業化的進程。比如,京東發布了言犀大模型、京醫千詢大模型,攜程發布了攜程問道大模型,網易有道發布了基于教育的子曰大模型,用友發布了用友GPT大模型等等。

相比通用大模型廠商而言,垂直大模型廠商在相關行業深耕已久,因而在尋找產業機會方面往往走得更加深入。以網易有道、京東兩家為例,網易有道在教育領域深耕已久,它在長期深耕行業的過程中,不僅積累了龐大的用戶和教育行業數據,還積累了相對應的高質量數據,這使其在做教育大模型過程中,擁有更多比較優勢。

無獨有偶,京東在零售、大健康領域廣有布局,這使其在構建產業大模型和京醫大模型方面,擁有堅實根基;而攜程則在文旅行業深耕已久,積累了廣泛的文旅產業鏈數據和資源。

顯然,相比通用大模型廠商而言,圍繞垂直領域的行業大模型,不僅可以依靠專業數據讓大模型更加“實用”,還可以在特定領域發揮獨特作用,幫助行業盡快完成數字化轉型。

2. 具備通用能力的大型云服務企業,正在加速與各路行業大模型企業展開合作,新的大模型生產機制正在成型

目前業內包括百度、騰訊、阿里、華為等主要云廠商,都紛紛依托自身的技術優勢、團隊優勢和資金支持,在通用大模型領域實現搶跑。除此之外,各主要廠商還聯合行業頭部企業,推出行業大模型解決方案。

比如,騰訊云聯合行業頭部企業,已為文旅、政務、金融等10余個行業,提供了50多個大模型行業解決方案。華為旗下盤古大模型,更是可以提供5個基礎大模型+N個行業大模型+X個場景模型的三層解耦架構,目前已經應用到了鐵路、礦山、能源、氣象、政務等諸多領域。

阿里云更是對外開放了“通義千問”的全部能力,幫助企業結合自身的行業知識和應用場景,訓練自己的企業大模型;加上目前已經開源的文心一言,由大的云平臺提供包括云服務、算力、通用大模型工具支持等基礎設施,各行業頭部企業提供專業經驗和數據訓練的大模型生產機制已經基本成型。

二、志在必得的騰訊

對于大模型的發展,騰訊高層顯然很早之前就已經定下了調子,但其推出的時間卻在一眾巨頭中最晚。在上半年如火如荼的大模型混戰中,騰訊的大模型在業內一直是“只聞其聲、不見其名”的存在。但從9月其正式面世之后的外界反應來看,此前“默默無聞”的騰訊大模型,更多是在“厚積薄發”。

9月7日騰訊正式對外發布了騰訊混元大模型,據了解該模型擁有超千億參數規模,預訓練語料超過2萬億Tokens,并已接入騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔等50多個騰訊業務。

而且在國家公布的首批大模型廠商中,騰訊混元大模型赫然在列。同時,騰訊混元大模型還宣布對外開放,千行百業的人都可以通過API調用混元,或者將其作為產業底座,為不同產業場景構建大模型應用,不難看出騰訊對大模型的“志在必得”。

1. 騰訊構建了“更強”的“探真”技術方法,這使其具備更強的信息可信度,極大增強了大模型自身的實用性

基于全網的數據檢索和生成,是大模型的核心能力之一。值得一提的是,無論是基于GPT-3.5還是國內其他大模型,源于錯誤信息帶來的錯誤答案,依然不可避免。但騰訊混元大模型卻基于自身的技術能力,保證正確答案的輸出。

與業界消除“幻覺”的通用做法不同,混元大模型并沒有為大模型增加搜索或者知識圖譜等外掛,而是從源頭上解決問題。具體來說,混元大模型從第一行代碼開始,就采用了預訓練階段優化目標函數的“探真”技術方法。據業內專業人士介紹,該方法與常見的開源大模型相比,能有效降低幻覺30%到50%。

除了“探真”能力優秀之外,騰訊混元的另一大超強能力在于其支持超長文本輸出。盡管目前多模態正在成為主流大模型演進方向,但在文本輸出方面,包括GPT-3.5和GPT-4在內的大模型,都很難支持1000字以上的文本輸出,但騰訊混元通過位置編碼優化提高了超長文的處理效果和性能,已經具備輸出4000多字的完整答案的能力。

2. 騰訊構建了從軟到硬的全流程基礎設施,這讓騰訊具備了更強的“全局優化”能力

從自研的星星海服務器,到新一代HCC高性能計算集群,再到自研的星脈高速網絡,騰訊已經為自己打造了一整套面向AIGC的高性能智算網絡。據騰訊內部負責人介紹,目前騰訊云已經可支持超過10萬張卡并行計算的大規模訓練集群,萬億參數大模型可以在四天之內完成。

目前,騰訊云已經建立起了圍繞大模型的全套能力,包括高性能算力集群、云原生數據湖倉和向量數據庫等數據處理引擎,以及模型安全、支持模型訓練和精調的工具鏈等,企業和開發者都可以根據自己的需求,靈活選擇產品,降低大模型的訓練成本。

三、不甘落后的科大訊飛

除了騰訊大模型之外,在大模型上已經先行一步的科大訊飛也是不甘落后,不僅積極參與通用大模型的建設,還持續發力行業大模型的建設。

目前科大訊飛的大模型已經具備7大能力,分別為:文本生成、語言理解、知識問答、邏輯推理、數學和多模態能力,并且這種能力還在不斷提升。而基于大模型開發所需的巨大投入量,科大訊飛也做了多方面的準備。

1. 科大訊飛積極展開與業內巨頭的合作,強化星火大模型的技術實力

早在今年8月中旬,科大訊飛就與華為共同發布星火一體機,讓所有企業都可以在國產自主創新平臺上私有化部署大模型。

一來,星火一體機基于星火認知大模型,針對污語料和幻覺問題,形成了“立體化”的內容安全機制;二來,星火一體機基于昇騰AI硬件、昇思AI開源框架,提供業界領先的大模型訓練、推理能力,為大模型全流程創新提供堅實的自主創新算力底座。

具體來說,訊飛星火認知大模型基于訓練推理一體化設計,實現大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業落地應用和迭代;與此同時,以昇騰AI為核心,軟硬件協同優化,構建算力集中、協同優化、供給穩定、數據安全的大模型訓練集群,這些都可以強化星火大模型的自身實力。

2. 科大訊飛積極推動與自身業務場景的整合,加速大模型的場景落地

除了不斷強化自己核心能力之外,科大訊飛還結合自身的業務場景,推動大模型在辦公、政務、電力、教育、醫療、工業、司法、金融等行業的場景落地。

星火一體機內已涵蓋辦公、代碼、運維、客服、營銷、采購等10多個場景包,支持對話開發、任務編排、插件執行、知識接入、提示工程等5種定制優化模式,并將持續拓展更多專業場景和模式優化,為客戶快速定制企業專屬大模型。

總的來看,科大訊飛在大模型上,外部合作和內部場景落地相結合的方式,很好地保證了其大模型產業化的加速落地。

四、大模型大洗牌正在加速到來

在眾多頭部巨頭和行業巨頭的共同努力之下,“百模大戰”甚至“千模大戰”的局面正在加速形成。而在這種的形勢之下,圍繞大模型的“行業大洗牌”或將提前到來。

1. 產品能力的比拼已經初見分曉

據知名廠商IDC依據算法模型、通用能力、創新能力、平臺能力和安全可解釋等五方面的要求,評估出了目前市面上在大模型方面綜合評分最高的三家廠商,分別是百度、阿里巴巴、科大訊飛。不過由于這個數據排出的時間較早,未考慮到騰訊和華為的產品能力,所謂真實的綜合技術實力方面,排名靠前的依舊會是BATH這些行業巨頭。

但各家的能力并不相同,也各有側重。

具體來說,百度的能力在于其具有“芯片—框架—模型—應用”四層技術棧完整布局的獨特優勢:芯片層—昆侖芯、框架層—飛漿、模型層—文心大模型,以及各種AI的落地應用。阿里的能力也相近,其強大之處在于圍繞云搭建起了一整個的大模型基礎設施;華為的能力在于強大的基礎技術能力,以及廣泛的終端生態應用和B端應用能力。

在BATH之外,其他大模型廠商依然排在第二梯隊、第三梯隊,產品層面的分化已經出現。

2. 大模型生態服務能力的比拼已然拉開序幕

以阿里為例,阿里不僅推出了通義千問大模型,還推出了魔搭大模型社區,還有眾多的生態合作伙伴;百度在這方面也不遑多讓,不僅有基于大模型的技術能力,還有廣泛的生態伙伴,推理能力和速度伴隨著大模型的版本更新,也在日新月異;作為同級別大廠,華為、騰訊等廠商自然也具備類似能力。

不難預見,未來各路廠商圍繞預訓練、邏輯推理等相關方面的技術服務,將成為行業競爭的常態。

當然,無論是產品維度還是服務能力,最終都要落地到產業實踐上。從行業覆蓋來看,從文心大模型出發,百度已經在能源、汽車、政務、交通、金融等重點領域布局11個行業大模型,將大模型融入到垂直領域,真正做到產業實踐和商業落地。阿里、騰訊、華為等也覆蓋電商零售、物流、社交、礦業等諸多行業,產業化落地也在快速提升。

而隨著各大平臺的大模型,在產品、生態服務和產業實踐上的全面展開,大模型的大洗牌正在加速到來。

專欄作家

劉曠,微信公眾號:劉曠(liukuang110),人人都是產品經理專欄作家。海南三車網絡科技有限公司董事長、購團邦資訊創始人、知名自媒體。

本文原創發布于人人都是產品經理,未經許可,不得轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!