文:雷晨 來源:21世紀經(jīng)濟報道(dào)
近期,國(guó)内多家大模型廠商紛紛宣布降價策略,推動大模型從“以分計價”的定價模式向(xiàng)更“以厘計價”新時代邁進(jìn)。
5月21日,阿裡(lǐ)雲通義千問的主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens,降幅達97%。這(zhè)意味著(zhe),1元可以買200萬tokens。
阿裡(lǐ)雲智能(néng)集團資深副總裁、公共雲事(shì)業部總裁劉偉光表示:“作爲中國(guó)第一大雲計算公司,阿裡(lǐ)雲這(zhè)次大幅降低大模型推理價格,就是希望加速AI應用的爆發(fā)。預計未來大模型API的調用量會(huì)有成(chéng)千上萬倍的增長(cháng)。”
同日,百度智能(néng)雲也宣布其文心大模型的兩(liǎng)大主力模型ERNIE Speed和ERNIE Lite全面(miàn)免費。
此前,字節跳動、智譜AI等廠商也紛紛推出了各自的降價方案。“豆包主力模型的推理輸入定價隻有0.0008元/千Tokens,0.8厘就能(néng)處理1500多個漢字,比行業便宜99.3%。”火山引擎總裁譚待5月15日公開(kāi)表示。
受訪人士認爲,這(zhè)場價格戰的背後(hòu),是各家廠商對(duì)于優先做大市場的共識,各家旨在通過(guò)降低使用成(chéng)本,吸引更多企業和個人開(kāi)發(fā)者使用其技術,從而推動生态繁榮。
大模型廠商打響價格戰
5月以來,國(guó)内廠商紛紛開(kāi)啓了大模型推理端的價格戰。
5月6日,幻方量化官微宣布,旗下深度求索(DeepSeek)正式開(kāi)源第二代MoE模型DeepSeek-V2。據介紹,DeepSeek-V2API的定價爲:每百萬tokens輸入1元、輸出2元,價格爲GPT-4-Turbo的近百分之一。
智譜AI大模型開(kāi)放平台于5月11日上線了新的價格體系,新注冊用戶可以獲得額度從500萬tokens提升至2500萬tokens,并且個人版GLM-3Turbo模型産品的調用價格從5元/百萬tokens降低至1元/百萬tokens。
5月15日,在火山引擎原動力發(fā)布會(huì)上,字節跳動豆包大模型家族、火山方舟2.0、AI應用及AI雲基礎設施等一系列最新産品正式發(fā)布。
火山引擎是字節跳動旗下雲服務平台,據譚待介紹,經(jīng)過(guò)一年時間的叠代和市場驗證,字節跳動自研的豆包大模型正成(chéng)爲國(guó)内使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成(chéng)3000萬張圖片。
“豆包主力模型的推理輸入定價隻有0.0008元/千Tokens,0.8厘就能(néng)處理1500多個漢字,比行業便宜99.3%。”火山引擎總裁譚待表示,大模型從以分計價到以厘計價,將(jiāng)助力企業以更低成(chéng)本加速業務創新。
譚待強調,降價是用技術優化成(chéng)本來實現的。如果隻是補貼,用虧損換收入是不可持續的,火山引擎不會(huì)走這(zhè)條路。
海外方面(miàn),自2023年3月,OpenAI已經(jīng)進(jìn)行了多次降價。在今年1月25日夜間的更新中,OpenAI 新推出了2個嵌入模型,更新了3種(zhǒng)模型的版本,并降低了多個模型及 API 的使用價格。其中,GPT-3.5 Turbo 模型的輸入價格降低了50%,至0.0005美元/1000 tokens,輸出價格降低了25%,至0.0015美元/1000 tokens。
5月13日,OpenAI發(fā)布新一代大模型GPT-4o,GPT-4o能(néng)夠接受文本、音頻、圖像和視頻的任意組合作爲輸入,并生成(chéng)文本、音頻和圖像輸出的任意組合。GPT-4o可以在最短232毫秒内響應音頻輸入,平均爲320毫秒,與人類正常對(duì)話的響應時間接近。與GPT-4Turbo相比,GPT-4o的速度快2倍,價格減半,速率限制高出5倍。
在機構分析師看來,GPT-4o的誕生進(jìn)一步驗證了大模型廠商API的降價趨勢,其技術路徑對(duì)國(guó)内大模型産業也具備積極的映射作用。
随著(zhe)國(guó)内外大模型廠商技術角逐進(jìn)一步激烈,華龍證券分析師孫伯文認爲,大模型行業開(kāi)啓價格戰信号明顯。通過(guò)降低價格門檻,大模型廠商有望吸引更廣泛的企業用戶群體,從而進(jìn)一步平衡收入和成(chéng)本。
“同時,更多C端用戶有望免費使用基礎AI應用,龐大的訪問量有助于企業進(jìn)一步提升模型服務能(néng)力,完成(chéng)良性循環。對(duì)下遊企業來說,推理成(chéng)本進(jìn)一步降低,AI應用行業有望迎來成(chéng)本拐點。”其表示。
AI應用有望加速普及
在業内看來,此輪大模型降價潮是各家廠商爲了搶占市場份額,加速AI應用的商業化落地而采取的策略。
談及字節跳動大模型降價原因,譚待近期指出,今年大模型技術顯著提升,應用環節至關重要。繁榮生态是推廣應用的關鍵。市場上,許多客戶都(dōu)渴望嘗試大模型,但創新風險高,尤其是AI風險。
“要減少不确定性,我們必須大幅降低試錯成(chéng)本,使大模型能(néng)被(bèi)廣泛采用,無論大企業還(hái)是個人開(kāi)發(fā)者。市場呼籲我們提供更低成(chéng)本的核心技術。”他表示。
據悉,目前火山引擎的生态包括了IaaS(基礎設施即服務)、PaaS(平台即服務)、SaaS(軟件即服務)。
談及用戶場景落地情況時,譚待對(duì)21世紀經(jīng)濟報道(dào)記者舉例道(dào),随著(zhe)汽車與手機的交互日益自然,如在駕駛中導航、查詢周邊信息,無需分心操作手機,車載系統可即時響應需求。手機助手AI的應用受限于技術,未充分滿足用戶需求。
他還(hái)表示,在其他場景如消費營銷、金融服務中,智能(néng)體也展現出巨大潛力。
“爲實現AI技術的廣泛應用,需提升技術并構建豐富的應用生态。這(zhè)需要低代碼生态的支持,降低開(kāi)發(fā)門檻,激發(fā)群體智慧。同時,降低AI技術成(chéng)本,使更多初創企業和小規模項目得以實施,促進(jìn)AI時代的創新與發(fā)展。”譚待告訴記者。
北京一位人工智能(néng)行業人士告訴記者,此輪大模型價格戰的開(kāi)啓,對(duì)于AI應用的普及具有積極的推動作用,將(jiāng)使得更多企業和個人開(kāi)發(fā)者能(néng)夠負擔得起(qǐ)AI技術的使用成(chéng)本,從而更加積極地投入到AI技術的研發(fā)和應用中來。
“價格戰的競争將(jiāng)促進(jìn)AI技術的不斷創新和優化,推動整個行業的技術水平不斷提升。随著(zhe)AI應用的普及,將(jiāng)帶動相關産業鏈的發(fā)展,形成(chéng)更加完善的AI生态系統,爲整個社會(huì)的數字化轉型提供有力支撐。”該人士表示。
華創證券研報認爲,整體來看,降低成(chéng)本是推動大模型快進(jìn)到“價值創造階段”的關鍵要素,更低的成(chéng)本價格才能(néng)真正滿足企業的複雜業務場景需求,充分驗證大模型的應用價值。盡管模型終端的價格壓降或將(jiāng)促使大模型企業對(duì)上遊加強成(chéng)本管控,但目前我國(guó)企業正處于AI轉型的關鍵時期,低成(chéng)本下AI模型生态將(jiāng)進(jìn)一步完善,終端應用亦將(jiāng)湧現出一批核心的創新應用。