kimi爆火後，大廠角逐長文本|聚焦

《科創板日報》3月23日訊（記者張洋洋）月之暗面不再“晦暗”。近期，由這家公司創作的大模型應用kimi，吸引了大量目光。kimi產生的效應已經從大模型圈外溢至資本市場，kimi概念股在本週應運而生。用戶激增，巨大流量突然涌入，甚至讓kimi服務器一度宕機。

kimi在這一輪大模型應用當中突圍，核心優勢在於長文本讀取和解析能力。頗爲巧合的是，就在22日晚間，阿里高調宣佈通義千問開放1000萬字長文本能力。360當晚緊隨其後，宣佈360智腦正式內測500萬字長文本處理功能，即將入駐360AI瀏覽器。

而據《科創板日報》瞭解，百度也將在下個月開放200萬-400萬的長文本能力。

阿里巴巴、百度等互聯網巨頭紛紛佈局並升級自家的大模型產品，強化長文本處理能力，正讓業界重新審視長文本處理在大模型領域的必要性和重要性。而隨着kimi的崛起，這也讓大模型的討論焦點從大模型本身轉移到了應用端，2024年是否會成爲AI大模型應用落地元年？

▍長文本是必要的嗎？

相較於其他大模型應用，kimi的長處在於長文本分析聯網搜索、文檔處理和等功能上，尤其在深度解析厚重書籍內容方面，其性能遠超遠超其他模型。3月18日，月之暗面甚至一口氣將無損上下文長度提升了十倍，直達200萬字級別。

據目前的用戶體驗來看，kimi也不是全能選手。有用戶反饋表示，對於一些較爲困難的任務，包括結構化信息處理和圖像中潦草文字的識別，對話連續性上，kimi仍顯示出一些短板。在生成能力和語音能力上，目前kimi還未加入這些模態。

儘管如此，長文本能力的重要性不言而喻。目前，市面上的大模型應用，GPT-4Turbo-128k公佈的文本範圍約爲10萬漢字，Claude3200k上下文約16萬漢字。

一家AI上市公司大模型架構業務人士告訴記者，由於模型訓練結構的限制，以往大模型的文本範圍都不算長，但複雜任務和行業知識通常是長篇鉅製，這種情況下，只能拆分輸入提問，但這可能會導致輸出的結果上下不連貫邏輯不通順。長文本可以全篇連貫的去理解上下文，滿足理解和問答的需求，長文本能力在此時是具備優勢的。

而國內大廠們，則正在長文本領域快速佈局。

《科創板日報》記者從知情人士方面瞭解到，百度在下個月將對文心一言進行升級，屆時也將開放長文本能力，文本範圍在200萬-500萬。目前，文心一言的文本最高上限在3.2萬。

而阿里已經先行一步。22日晚間，阿里的通義千問官宣升級，向所有人免費開放1000萬字的長文檔處理功能。用戶可通過通義千問網站和APP快速讀研報、分析財報、讀科研論文、研判案情、讀醫療報告、解讀法律條文、分析考試成績、總結深度文章。

360緊隨其後，其在當晚宣佈，360智腦正式內測500萬字長文本處理功能，即將入駐360AI瀏覽器。

kimi成功在前，阿里、百度、360先後角逐長文本。長文本能力會是大模型未來差異化的競爭點嗎？

上述大模型架構人士表示，長文本能力目前在訓練和效果上仍存在一些難點，比如如何避免遺漏細節。事實上，文本長度也可以通過RoPE等算法技術去拓展，但是此時會嚴重丟失細節，這就導致輸出效果不準確。因此，核心標準是看輸出結果的精準性連貫性，並不是文本長度越長越好。

另外一名大模型行業人士也告訴記者，長文本實際是大模型的基礎能力，只要算力資源足夠，理論上長文本可以追求無限長，“但是如果使用場景根本用不上長文本，那麼此時的長文本就沒有任何意義”。

▍2024年是大模型應用落地元年嗎？

kimi的火爆，一定程度上也反應了當下國內大模型的發展階段，從打基建開始走向應用落地。那麼，2024年是否會成爲AI大模型應用落地元年？

瀾舟科技CEO周明認爲，從長遠來看，人工智能在逼近AGI。而經過去一年的發展，大模型已經具備了落地的能力，企業側也積攢了很多業務落地場景。加上國家政策的推動，2024年將會是大模型落地元年。

零一萬物聯合創始人祁瑞峰也表達了類似的看法，但他是聚焦在B端場景。目前，內容生成、理解、摘要和對話等應用仍佔據主導，但隨着新一代模型推理、決策和執行能力的提升，有望更快地將AI技術植入企業業務系統，真正開啓大模型賦能的騰飛。

電商是AI應用最具代表性的領域之一。魔琺科技目前是阿里媽媽、淘寶直播生態官方指定的3D超寫實虛擬直播服務商，旗下有一款3D虛擬人直播AIGC產品“有光”。

魔琺科技CEO柴金祥在接受《科創板日報》記者採訪時表示，電商是公司AI產品應用的最主要一個行業。從已有的使用效果來看，多個知名頭部美妝品牌在使用魔琺科技提供的3D虛擬人後，午夜６小時的直播時段內累計年GMV增量高達數千萬。3D虛擬直播午夜超級直播廣告投放高於行業均值2倍以上，ROI大於5倍。

儘管2024年被寄予厚望，但是各方仍然保持着審慎樂觀的態度。

祁瑞峰認爲，在C端市場，目前成本還很高，商業模式還未完全跑通。即便是對於現在已經可以創收的B端市場，周明也認爲，要想做好產品標準化和完整交付，訓練和部署成本、行業適配能力、幻象問題、數據安全四方面的問題，還有待解決。

夢餉科技CTO曾均濤在接受《科創板日報》記者採訪時表示，雖然AI在電商行業的應用，想象空間非常大，夢餉也在通過GPT大模型重構業務場景，包括解決模特圖片生成、素材差異化、服裝秀、AI創作助手、聊天室導購等問題。

“但是現在的階段，基礎設施並不完善。”曾均濤告訴記者，夢餉在去年爲創作者做了AI創作平臺，雖然能生成模特圖，但是成圖率並不高，還是需要技術升級和內部做技術提示詞、算法模型的調優，這個平臺到現在還沒有開放，“現在大家都在找應用場景，估計2024年開始能夠看到更多AI、大模型帶來的變化”。

在42章經創始人曲凱看來，2024年仍會是技術上不斷突破的一年，很難真的做到大規模的落地和有非常多的場景，不過，不管是在B端還是C端，今年有望看到更多應用開始跑出來。與此同時，應用端的項目今年也將更受投資人青睞。

“去年大家投了非常多資金和精力在大模型本身，要想將這個故事持續下去，就需要有落地，因此會在應用端繼續探索，找到PMF（Product Market Fit，產品市場匹配）。”曲凱說。

近期文章