大模型廠商卷起“價格戰(zhàn)”，折射怎樣AI新風(fēng)向？

來源：證券之星時間：2024-05-21 19:31 編輯：葉子琪閱讀量：13171

近期，國內(nèi)多家大模型廠商紛紛宣布降價策略，推動大模型從“以分計價”的定價模式向更“以厘計價”新時代邁進。

5月21日，阿里云通義千問的主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens，降幅達(dá)97%。這意味著，1元可以買200萬tokens。

阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光表示:“作為中國第一大云計算公司，阿里云這次大幅降低大模型推理價格，就是希望加速AI應(yīng)用的爆發(fā)。預(yù)計未來大模型API的調(diào)用量會有成千上萬倍的增長。”

同日，百度智能云也宣布其文心大模型的兩大主力模型ERNIE Speed和ERNIE Lite全面免費。

此前，字節(jié)跳動、智譜AI等廠商也紛紛推出了各自的降價方案?！岸拱髁δＰ偷耐评磔斎攵▋r只有0.0008元/千Tokens，0.8厘就能處理1500多個漢字，比行業(yè)便宜99.3%?！被鹕揭婵偛米T待5月15日公開表示。

受訪人士認(rèn)為，這場價格戰(zhàn)的背后，是各家廠商對于優(yōu)先做大市場的共識，各家旨在通過降低使用成本，吸引更多企業(yè)和個人開發(fā)者使用其技術(shù)，從而推動生態(tài)繁榮。

大模型廠商打響價格戰(zhàn)

5月以來，國內(nèi)廠商紛紛開啟了大模型推理端的價格戰(zhàn)。

5月6日，幻方量化官微宣布，旗下深度求索正式開源第二代MoE模型DeepSeek-V2。據(jù)介紹，DeepSeek-V2API的定價為:每百萬tokens輸入1元、輸出2元，價格為GPT-4-Turbo的近百分之一。

智譜AI大模型開放平臺于5月11日上線了新的價格體系，新注冊用戶可以獲得額度從500萬tokens提升至2500萬tokens，并且個人版GLM-3Turbo模型產(chǎn)品的調(diào)用價格從5元/百萬tokens降低至1元/百萬tokens。

5月15日，在火山引擎原動力發(fā)布會上，字節(jié)跳動豆包大模型家族、火山方舟2.0、AI應(yīng)用及AI云基礎(chǔ)設(shè)施等一系列最新產(chǎn)品正式發(fā)布。

“豆包主力模型的推理輸入定價只有0.0008元/千Tokens，0.8厘就能處理1500多個漢字，比行業(yè)便宜99.3%?！被鹕揭婵偛米T待表示，大模型從以分計價到以厘計價，將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新。

譚待強調(diào)，降價是用技術(shù)優(yōu)化成本來實現(xiàn)的。如果只是補貼，用虧損換收入是不可持續(xù)的，火山引擎不會走這條路。

海外方面，自2023年3月，OpenAI已經(jīng)進行了多次降價。在今年1月25日夜間的更新中，OpenAI 新推出了2個嵌入模型，更新了3種模型的版本，并降低了多個模型及 API 的使用價格。其中，GPT-3.5 Turbo 模型的輸入價格降低了50%，至0.0005美元/1000 tokens，輸出價格降低了25%，至0.0015美元/1000 tokens。

5月13日，OpenAI發(fā)布新一代大模型GPT-4o，GPT-4o能夠接受文本、音頻、圖像和視頻的任意組合作為輸入，并生成文本、音頻和圖像輸出的任意組合。GPT-4o可以在最短232毫秒內(nèi)響應(yīng)音頻輸入，平均為320毫秒，與人類正常對話的響應(yīng)時間接近。與GPT-4Turbo相比，GPT-4o的速度快2倍，價格減半，速率限制高出5倍。

在機構(gòu)分析師看來，GPT-4o的誕生進一步驗證了大模型廠商API的降價趨勢，其技術(shù)路徑對國內(nèi)大模型產(chǎn)業(yè)也具備積極的映射作用。

隨著國內(nèi)外大模型廠商技術(shù)角逐進一步激烈，華龍證券分析師孫伯文認(rèn)為，大模型行業(yè)開啟價格戰(zhàn)信號明顯。通過降低價格門檻，大模型廠商有望吸引更廣泛的企業(yè)用戶群體，從而進一步平衡收入和成本。

“同時，更多C端用戶有望免費使用基礎(chǔ)AI應(yīng)用，龐大的訪問量有助于企業(yè)進一步提升模型服務(wù)能力，完成良性循環(huán)。對下游企業(yè)來說，推理成本進一步降低，AI應(yīng)用行業(yè)有望迎來成本拐點?！逼浔硎?。

AI應(yīng)用有望加速普及

在業(yè)內(nèi)看來，此輪大模型降價潮是各家廠商為了搶占市場份額，加速AI應(yīng)用的商業(yè)化落地而采取的策略。

談及字節(jié)跳動大模型降價原因，譚待近期指出，今年大模型技術(shù)顯著提升，應(yīng)用環(huán)節(jié)至關(guān)重要。繁榮生態(tài)是推廣應(yīng)用的關(guān)鍵。市場上，許多客戶都渴望嘗試大模型，但創(chuàng)新風(fēng)險高，尤其是AI風(fēng)險。

“要減少不確定性，我們必須大幅降低試錯成本，使大模型能被廣泛采用，無論大企業(yè)還是個人開發(fā)者。市場呼吁我們提供更低成本的核心技術(shù)?！彼硎尽?/p>

據(jù)悉，目前火山引擎的生態(tài)包括了IaaS、PaaS(平臺即服務(wù))、SaaS(軟件即服務(wù))。

談及用戶場景落地情況時，譚待對21世紀(jì)經(jīng)濟報道記者舉例道，隨著汽車與手機的交互日益自然，如在駕駛中導(dǎo)航、查詢周邊信息，無需分心操作手機，車載系統(tǒng)可即時響應(yīng)需求。手機助手AI的應(yīng)用受限于技術(shù)，未充分滿足用戶需求。

他還表示，在其他場景如消費營銷、金融服務(wù)中，智能體也展現(xiàn)出巨大潛力。

“為實現(xiàn)AI技術(shù)的廣泛應(yīng)用，需提升技術(shù)并構(gòu)建豐富的應(yīng)用生態(tài)。這需要低代碼生態(tài)的支持，降低開發(fā)門檻，激發(fā)群體智慧。同時，降低AI技術(shù)成本，使更多初創(chuàng)企業(yè)和小規(guī)模項目得以實施，促進AI時代的創(chuàng)新與發(fā)展?！弊T待告訴記者。

北京一位人工智能行業(yè)人士告訴記者，此輪大模型價格戰(zhàn)的開啟，對于AI應(yīng)用的普及具有積極的推動作用，將使得更多企業(yè)和個人開發(fā)者能夠負(fù)擔(dān)得起AI技術(shù)的使用成本，從而更加積極地投入到AI技術(shù)的研發(fā)和應(yīng)用中來。

“價格戰(zhàn)的競爭將促進AI技術(shù)的不斷創(chuàng)新和優(yōu)化，推動整個行業(yè)的技術(shù)水平不斷提升。隨著AI應(yīng)用的普及，將帶動相關(guān)產(chǎn)業(yè)鏈的發(fā)展，形成更加完善的AI生態(tài)系統(tǒng)，為整個社會的數(shù)字化轉(zhuǎn)型提供有力支撐?！痹撊耸勘硎?。

華創(chuàng)證券研報認(rèn)為，整體來看，降低成本是推動大模型快進到“價值創(chuàng)造階段”的關(guān)鍵要素，更低的成本價格才能真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場景需求，充分驗證大模型的應(yīng)用價值。盡管模型終端的價格壓降或?qū)⒋偈勾竽Ｐ推髽I(yè)對上游加強成本管控，但目前我國企業(yè)正處于AI轉(zhuǎn)型的關(guān)鍵時期，低成本下AI模型生態(tài)將進一步完善，終端應(yīng)用亦將涌現(xiàn)出一批核心的創(chuàng)新應(yīng)用。

鄭重聲明：此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊，目的在于傳播更多信息，與本站立場無關(guān)。僅供讀者參考，并請自行核實相關(guān)內(nèi)容。