近期,國內(nèi)多家大模型廠商紛紛宣布降價策略,推動大模型從“以分計價”的定價模式向更“以厘計價”新時代邁進。
5月21日,阿里云通義千問的主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens,降幅達(dá)97%。這意味著,1元可以買200萬tokens。
阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光表示:“作為中國第一大云計算公司,阿里云這次大幅降低大模型推理價格,就是希望加速AI應(yīng)用的爆發(fā)。預(yù)計未來大模型API的調(diào)用量會有成千上萬倍的增長。”
同日,百度智能云也宣布其文心大模型的兩大主力模型ERNIE Speed和ERNIE Lite全面免費。
此前,字節(jié)跳動、智譜AI等廠商也紛紛推出了各自的降價方案?!岸拱髁δP偷耐评磔斎攵▋r只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業(yè)便宜99.3%?!被鹕揭婵偛米T待5月15日公開表示。
受訪人士認(rèn)為,這場價格戰(zhàn)的背后,是各家廠商對于優(yōu)先做大市場的共識,各家旨在通過降低使用成本,吸引更多企業(yè)和個人開發(fā)者使用其技術(shù),從而推動生態(tài)繁榮。
5月以來,國內(nèi)廠商紛紛開啟了大模型推理端的價格戰(zhàn)。
5月6日,幻方量化官微宣布,旗下深度求索正式開源第二代MoE模型DeepSeek-V2。據(jù)介紹,DeepSeek-V2API的定價為:每百萬tokens輸入1元、輸出2元,價格為GPT-4-Turbo的近百分之一。
智譜AI大模型開放平臺于5月11日上線了新的價格體系,新注冊用戶可以獲得額度從500萬tokens提升至2500萬tokens,并且個人版GLM-3Turbo模型產(chǎn)品的調(diào)用價格從5元/百萬tokens降低至1元/百萬tokens。
5月15日,在火山引擎原動力發(fā)布會上,字節(jié)跳動豆包大模型家族、火山方舟2.0、AI應(yīng)用及AI云基礎(chǔ)設(shè)施等一系列最新產(chǎn)品正式發(fā)布。
“豆包主力模型的推理輸入定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業(yè)便宜99.3%?!被鹕揭婵偛米T待表示,大模型從以分計價到以厘計價,將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新。
譚待強調(diào),降價是用技術(shù)優(yōu)化成本來實現(xiàn)的。如果只是補貼,用虧損換收入是不可持續(xù)的,火山引擎不會走這條路。
海外方面,自2023年3月,OpenAI已經(jīng)進行了多次降價。在今年1月25日夜間的更新中,OpenAI 新推出了2個嵌入模型,更新了3種模型的版本,并降低了多個模型及 API 的使用價格。其中,GPT-3.5 Turbo 模型的輸入價格降低了50%,至0.0005美元/1000 tokens,輸出價格降低了25%,至0.0015美元/1000 tokens。
5月13日,OpenAI發(fā)布新一代大模型GPT-4o,GPT-4o能夠接受文本、音頻、圖像和視頻的任意組合作為輸入,并生成文本、音頻和圖像輸出的任意組合。GPT-4o可以在最短232毫秒內(nèi)響應(yīng)音頻輸入,平均為320毫秒,與人類正常對話的響應(yīng)時間接近。與GPT-4Turbo相比,GPT-4o的速度快2倍,價格減半,速率限制高出5倍。
在機構(gòu)分析師看來,GPT-4o的誕生進一步驗證了大模型廠商API的降價趨勢,其技術(shù)路徑對國內(nèi)大模型產(chǎn)業(yè)也具備積極的映射作用。
隨著國內(nèi)外大模型廠商技術(shù)角逐進一步激烈,華龍證券分析師孫伯文認(rèn)為,大模型行業(yè)開啟價格戰(zhàn)信號明顯。通過降低價格門檻,大模型廠商有望吸引更廣泛的企業(yè)用戶群體,從而進一步平衡收入和成本。
“同時,更多C端用戶有望免費使用基礎(chǔ)AI應(yīng)用,龐大的訪問量有助于企業(yè)進一步提升模型服務(wù)能力,完成良性循環(huán)。對下游企業(yè)來說,推理成本進一步降低,AI應(yīng)用行業(yè)有望迎來成本拐點?!逼浔硎?。
在業(yè)內(nèi)看來,此輪大模型降價潮是各家廠商為了搶占市場份額,加速AI應(yīng)用的商業(yè)化落地而采取的策略。
談及字節(jié)跳動大模型降價原因,譚待近期指出,今年大模型技術(shù)顯著提升,應(yīng)用環(huán)節(jié)至關(guān)重要。繁榮生態(tài)是推廣應(yīng)用的關(guān)鍵。市場上,許多客戶都渴望嘗試大模型,但創(chuàng)新風(fēng)險高,尤其是AI風(fēng)險。
“要減少不確定性,我們必須大幅降低試錯成本,使大模型能被廣泛采用,無論大企業(yè)還是個人開發(fā)者。市場呼吁我們提供更低成本的核心技術(shù)?!彼硎尽?/p>
據(jù)悉,目前火山引擎的生態(tài)包括了IaaS、PaaS(平臺即服務(wù))、SaaS(軟件即服務(wù))。
談及用戶場景落地情況時,譚待對21世紀(jì)經(jīng)濟報道記者舉例道,隨著汽車與手機的交互日益自然,如在駕駛中導(dǎo)航、查詢周邊信息,無需分心操作手機,車載系統(tǒng)可即時響應(yīng)需求。手機助手AI的應(yīng)用受限于技術(shù),未充分滿足用戶需求。
他還表示,在其他場景如消費營銷、金融服務(wù)中,智能體也展現(xiàn)出巨大潛力。
“為實現(xiàn)AI技術(shù)的廣泛應(yīng)用,需提升技術(shù)并構(gòu)建豐富的應(yīng)用生態(tài)。這需要低代碼生態(tài)的支持,降低開發(fā)門檻,激發(fā)群體智慧。同時,降低AI技術(shù)成本,使更多初創(chuàng)企業(yè)和小規(guī)模項目得以實施,促進AI時代的創(chuàng)新與發(fā)展?!弊T待告訴記者。
北京一位人工智能行業(yè)人士告訴記者,此輪大模型價格戰(zhàn)的開啟,對于AI應(yīng)用的普及具有積極的推動作用,將使得更多企業(yè)和個人開發(fā)者能夠負(fù)擔(dān)得起AI技術(shù)的使用成本,從而更加積極地投入到AI技術(shù)的研發(fā)和應(yīng)用中來。
“價格戰(zhàn)的競爭將促進AI技術(shù)的不斷創(chuàng)新和優(yōu)化,推動整個行業(yè)的技術(shù)水平不斷提升。隨著AI應(yīng)用的普及,將帶動相關(guān)產(chǎn)業(yè)鏈的發(fā)展,形成更加完善的AI生態(tài)系統(tǒng),為整個社會的數(shù)字化轉(zhuǎn)型提供有力支撐?!痹撊耸勘硎?。
華創(chuàng)證券研報認(rèn)為,整體來看,降低成本是推動大模型快進到“價值創(chuàng)造階段”的關(guān)鍵要素,更低的成本價格才能真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場景需求,充分驗證大模型的應(yīng)用價值。盡管模型終端的價格壓降或?qū)⒋偈勾竽P推髽I(yè)對上游加強成本管控,但目前我國企業(yè)正處于AI轉(zhuǎn)型的關(guān)鍵時期,低成本下AI模型生態(tài)將進一步完善,終端應(yīng)用亦將涌現(xiàn)出一批核心的創(chuàng)新應(yīng)用。
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場無關(guān)。僅供讀者參考,并請自行核實相關(guān)內(nèi)容。