財(cái)聯(lián)社6月14日訊(記者付靜)“正如去年豆包1.0開(kāi)啟了大模型規(guī)模調(diào)用一樣,我也相信豆包1.6和區(qū)間定價(jià)的新模式,能夠讓多模態(tài)深度思考得到更廣泛的調(diào)用,讓Agent的大規(guī)模應(yīng)用進(jìn)一步加速。”火山引擎總裁譚待在最新召開(kāi)的Force原動(dòng)力大會(huì)上表示。
今年以來(lái)AI智能體迎來(lái)爆發(fā),火山引擎日前最新升級(jí)豆包大模型,通過(guò)“區(qū)間定價(jià)”將其使用成本降至三分之一,以期使智能體規(guī)模化應(yīng)用提速。財(cái)聯(lián)社記者獲悉,智能體目前已在B端多場(chǎng)景率先落地,模型的智能水平和性?xún)r(jià)比提升將進(jìn)一步加速其大規(guī)模應(yīng)用。雖然業(yè)內(nèi)還在針對(duì)智能體進(jìn)行效果評(píng)估和持續(xù)迭代,但隨著智能體爆發(fā),強(qiáng)化學(xué)習(xí)的算力消耗正在快速攀升,為此軟硬件廠商通過(guò)生態(tài)協(xié)作,已推出了云邊一體的智算一體機(jī)方案。
智能體規(guī)模化應(yīng)用提速
去年底,豆包大模型曾一度引爆AI玩具板塊在內(nèi)的豆包概念股行情,本次Force原動(dòng)力大會(huì)亦受到業(yè)內(nèi)期待,大會(huì)召開(kāi)前夕二級(jí)市場(chǎng)上豆包概念股亦出現(xiàn)震蕩拉升。而財(cái)聯(lián)社記者在此次大會(huì)上看到,在豆包再度升級(jí)的基礎(chǔ)上,智能體作為重點(diǎn)方向被頻繁提及。
“我們實(shí)際正處于PC到移動(dòng)到AI三個(gè)時(shí)代的變化之中。這三個(gè)時(shí)代里技術(shù)主體在發(fā)生變化,PC時(shí)代的主體是web,移動(dòng)時(shí)代是APP,AI時(shí)代是Agent。”譚待表示。
據(jù)了解,深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構(gòu)建智能體的關(guān)鍵要素。火山引擎方面預(yù)計(jì),隨著大模型智能水平持續(xù)提升,智能體正逐漸進(jìn)入企業(yè)核心業(yè)務(wù),兩到三年之內(nèi)將帶來(lái)巨大的生產(chǎn)力提升。
同時(shí)火山引擎方面認(rèn)為,模型更優(yōu)的性?xún)r(jià)比將使智能體規(guī)模化應(yīng)用提速。
財(cái)聯(lián)社記者最新獲悉,豆包1.6按“輸入長(zhǎng)度”區(qū)間定價(jià),深度思考、多模態(tài)能力與基礎(chǔ)語(yǔ)言模型統(tǒng)一價(jià)格。在0-32K輸入?yún)^(qū)間,豆包1.6的輸入價(jià)格為0.8元/百萬(wàn)tokens、輸出價(jià)格為8元/百萬(wàn)tokens,綜合成本約為豆包1.5深度思考模型或DeepSeek R1的三分之一。
談及模型成本,譚待亦對(duì)其原理進(jìn)行了解釋?zhuān)骸按竽P褪前磘okens來(lái)收費(fèi)。市面上有不同類(lèi)型的模型,支持深度思考的、不支持深度思考的、支持多模態(tài)的等等,但實(shí)際上對(duì)于同結(jié)構(gòu)同參數(shù)的模型而言,對(duì)成本真正影響的是上下文長(zhǎng)度,而不是是否開(kāi)啟了思考和多模態(tài)功能。”
目前火山引擎已經(jīng)推出了AI Agent平臺(tái)“扣子”、企業(yè)級(jí)智能體構(gòu)建平臺(tái)HiAgent等,支持智能體開(kāi)發(fā)應(yīng)用。大會(huì)期間,財(cái)聯(lián)社記者亦注意到了“扣子”與產(chǎn)業(yè)鏈廠商共同推出的多款細(xì)分領(lǐng)域應(yīng)用。具體的應(yīng)用場(chǎng)景方面,智能體目前已涉足金融風(fēng)控審核、教育場(chǎng)景輔助教學(xué)、制造業(yè)等泛企業(yè)場(chǎng)景做流程的打通等。
實(shí)際上,智能體當(dāng)下已受到眾多廠商的積極加碼布局。5月,價(jià)格曾炒到10萬(wàn)、一碼難求的AI智能體平臺(tái)Manus宣布開(kāi)放注冊(cè),騰訊、京東、榮耀、昆侖萬(wàn)維(300418.SZ)等隨后陸續(xù)宣布各自智能體新進(jìn)展。5月22日上午天工超級(jí)智能體上線不久后,昆侖萬(wàn)維更是發(fā)布了限流通知。
火山引擎AI生態(tài)與智能終端資深解決方案架構(gòu)師朱成剛表示,火山引擎目前主要聚焦的場(chǎng)景一是大模型核心能力,二是Agent開(kāi)發(fā)支持能力。“在私有化場(chǎng)景里,模型的迭代速度沒(méi)有那么快,我們重點(diǎn)關(guān)注的還是企業(yè)如何能在內(nèi)部私有化場(chǎng)景里落地并發(fā)揮價(jià)值,因此關(guān)鍵點(diǎn)就成為做一套持續(xù)運(yùn)營(yíng)、可優(yōu)化可迭代的智能體體系。”
一位從業(yè)者告訴財(cái)聯(lián)社記者,“現(xiàn)在我們看到,如果把大模型只當(dāng)成Chat bot來(lái)聊天的話,其實(shí)它真正幫助我們的效果并不見(jiàn)得很好。而Agent to B的利用效果會(huì)更好一些,尤其在跨多個(gè)不同的IT系統(tǒng)時(shí)幫助會(huì)更大。”
“真正面向企業(yè)的業(yè)務(wù),絕對(duì)不是一個(gè)大模型就能全部解決的。”另有業(yè)內(nèi)人士在現(xiàn)場(chǎng)這樣表示。
據(jù)朱成剛介紹,“我們最終提供的服務(wù)就是一個(gè)智能體應(yīng)用,想做出這樣的應(yīng)用需要大量工具和能力的支持,最簡(jiǎn)單的方式就是大模型外部工具,目前是RAG、Function call和MCP。當(dāng)前階段MCP和A2A等開(kāi)放智能體生態(tài)雖然有了標(biāo)準(zhǔn),在實(shí)際使用中還是存在一些問(wèn)題,所以還是多種接入形態(tài)共存。”
火山引擎方面同時(shí)認(rèn)為,針對(duì)智能體的效果評(píng)估和持續(xù)迭代,將是長(zhǎng)期的重要方向。
算力端催生一體機(jī)新需求
AI應(yīng)用端智能體的落地提速,將如何推動(dòng)算力端演進(jìn)?
財(cái)聯(lián)社記者在大會(huì)現(xiàn)場(chǎng)注意到一個(gè)基于AI PC的案例:英特爾和“扣子”打造了基于AI PC的端云協(xié)同智能體,其典型應(yīng)用場(chǎng)景如執(zhí)行報(bào)銷(xiāo)、掛號(hào)、訂票等任務(wù)的事務(wù)助手。
一位英特爾展臺(tái)人士向財(cái)聯(lián)社記者展示了借助這一智能體在“微醫(yī)”平臺(tái)掛號(hào)的流程。該展臺(tái)人士稱(chēng),面對(duì)智能體爆發(fā)趨勢(shì),“我們?cè)贏I PC上提供了更多工具鏈,幫助ISV(注:指獨(dú)立軟件供應(yīng)商)的應(yīng)用跑在AI PC上,不用耗費(fèi)云端算力,就實(shí)現(xiàn)在輕薄本上跑比較重的AI應(yīng)用。”
不過(guò)實(shí)際場(chǎng)景中的算力需求不僅限于此。
“在過(guò)去的幾個(gè)月,我們看到強(qiáng)化學(xué)習(xí)的算力消耗正在快速攀升。我們也做一個(gè)大膽的預(yù)測(cè),強(qiáng)化學(xué)習(xí)帶來(lái)的算力和資金消耗,有可能在2027年附近,逼近整個(gè)行業(yè)在預(yù)訓(xùn)練上的投入。”火山引擎智能算法負(fù)責(zé)人吳迪在大會(huì)期間透露。
財(cái)聯(lián)社記者從火山引擎方面獲悉,隨著大量智能體加速進(jìn)入現(xiàn)實(shí)世界,強(qiáng)化學(xué)習(xí)愈加重要,需考慮GPU/CPU資源混合編排、異構(gòu)算力調(diào)度、異步推理等。
一位英特爾技術(shù)專(zhuān)家現(xiàn)場(chǎng)告訴財(cái)聯(lián)社記者,“一些企業(yè)級(jí)客戶(hù)的需求是在本地部署模型,又擔(dān)心能力演進(jìn)無(wú)法跟上模型快速迭代的步伐。但若使用云上模型,又需考慮隱私數(shù)據(jù)、保密信息。另外,當(dāng)企業(yè)決定內(nèi)部部署時(shí),一定會(huì)考慮性?xún)r(jià)比。”
財(cái)聯(lián)社記者注意到,英特爾、火山引擎HiAgent、華勝天成(600410.SH)三方聯(lián)合打造了智算一體機(jī)方案。
據(jù)了解,算力方面,該方案基于英特爾至強(qiáng)處理器和多張英特爾銳炫顯卡,銳炫Pro B60單卡可提供24GB顯存;平臺(tái)層面,HiAgent 2.0覆蓋了模型精調(diào)、推理優(yōu)化到智能體開(kāi)發(fā)、編排、運(yùn)行的全生命周期;服務(wù)方面,華勝天成提供需求分析、方案設(shè)計(jì)、落地實(shí)施、運(yùn)維支持等服務(wù)。
值得一提的是,銳炫Pro B60系英特爾近期于臺(tái)北電腦展上最新發(fā)布,相比2023年發(fā)布的銳炫A770,顯存從16GB增加至24GB。
“一年前大家做企業(yè)里的知識(shí)問(wèn)答,上下文長(zhǎng)度只要10K就夠,我們現(xiàn)在接觸到的客戶(hù)需求超過(guò)32K的非常多。這提出了更大的顯存需求,因?yàn)殚L(zhǎng)的上下文會(huì)消耗更多顯存,顯存對(duì)整個(gè)應(yīng)用性能及能夠支持的場(chǎng)景也有非常大的幫助。”英特爾方面向財(cái)聯(lián)社記者表示。
財(cái)聯(lián)社記者獲悉,一體機(jī)形態(tài)可分為純本地部署、云邊一體兩種。由于云上大模型按tokens收費(fèi),商業(yè)模式較簡(jiǎn)單,因此相比需要考慮平臺(tái)整體成本的本地部署方案,云邊一體的一體機(jī)勝在性?xún)r(jià)比。據(jù)了解,前述一體機(jī)平臺(tái)既支持7B-72B主流模型,也支持Deepseek V3/R1 671B本地部署。
另外朱成剛提到,一體機(jī)客戶(hù)的重點(diǎn)投入會(huì)在硬件方面,軟件的預(yù)算和成本偏低,建議一體機(jī)分成兩端進(jìn)行。“首先提供開(kāi)發(fā)端的核心開(kāi)發(fā)和運(yùn)營(yíng)管理能力,然后通過(guò)容器鏡像或其他打包方式分發(fā)到用戶(hù)客戶(hù)端,連接顯示器就可以完成應(yīng)用的調(diào)用。如果在單個(gè)或多個(gè)部門(mén)的辦公或協(xié)同場(chǎng)景,也可以做一些簡(jiǎn)單的規(guī)劃隔離,保證用戶(hù)數(shù)據(jù)隔離,就可以在極低算力成本下跑通整個(gè)智能體平臺(tái)的核心能力。”
證券日?qǐng)?bào)網(wǎng)訊 6月11日晚間,絲路視覺(jué)發(fā)布公告稱(chēng),公司第五屆監(jiān)事會(huì)第五...
本站鄭重聲明:第一黃金網(wǎng)中的操作建議僅代表第三方觀點(diǎn)與本平臺(tái)無(wú)關(guān),投資有風(fēng)險(xiǎn),入市需謹(jǐn)慎。據(jù)此交易,風(fēng)險(xiǎn)自擔(dān)。