新浪科技訊 8月12日晚間消息,推理在2025金融A(yíng)I推理應用落地與發(fā)展論壇上,創(chuàng )新中國銀聯(lián)執行副總裁涂曉軍、技術(shù)華為數字金融軍團CEO曹沖出席并發(fā)表致辭。于今論壇上,年月華為公司副總裁、正式數據存儲產(chǎn)品線(xiàn)總裁周躍峰發(fā)布AI推理創(chuàng )新技術(shù)——UCM推理記憶數據管理器,開(kāi)源旨在推動(dòng)AI推理體驗升級,推理提升推理性?xún)r(jià)比,創(chuàng )新加速AI商業(yè)正循環(huán)。技術(shù)同時(shí),于今華為攜手中國銀聯(lián)率先在金融典型場(chǎng)景開(kāi)展UCM技術(shù)試點(diǎn)應用,年月并聯(lián)合發(fā)布智慧金融A(yíng)I推理加速方案應用成果。正式
周躍峰在論壇上強調:“AI時(shí)代,開(kāi)源模型訓練、推理推理效率與體驗的量綱都以Token數為表征,Token經(jīng)濟已經(jīng)到來(lái)”。為保障流暢的推理體驗,企業(yè)需持續加大算力投入,但如何在推理效率與成本之間找到最佳平衡點(diǎn),成為了全行業(yè)亟待解決的重要課題。
為此,華為推出UCM推理記憶數據管理器,包括對接不同引擎與算力的推理引擎插件(Connector)、支持多級KV Cache管理及加速算法的功能庫(Accelerator)、高性能KV Cache存取適配器(Adapter)三大組件,通過(guò)推理框架、算力、存儲三層協(xié)同,實(shí)現AI推理“更優(yōu)體驗、更低成本”。
在與中國銀聯(lián)的聯(lián)合創(chuàng )新技術(shù)試點(diǎn)中,UCM的技術(shù)價(jià)值得到驗證。在中國銀聯(lián)“客戶(hù)之聲”業(yè)務(wù)場(chǎng)景下,借助UCM技術(shù)及工程化手段,大模型推理速度提升125倍,僅需10秒即可精準識別客戶(hù)高頻問(wèn)題,促進(jìn)服務(wù)質(zhì)量提升。未來(lái),中國銀聯(lián)將依托國家人工智能應用中試基地,聯(lián)合華為等生態(tài)伙伴共建“AI+金融”示范應用,推動(dòng)技術(shù)成果從“實(shí)驗室驗證”走向“規?;瘧谩?。
論壇現場(chǎng),華為正式公布了UCM開(kāi)源計劃。UCM通過(guò)開(kāi)放統一的南北向接口,可適配多類(lèi)型推理引擎框架、算力及存儲系統。今年9月,UCM將正式開(kāi)源,后續逐步貢獻給業(yè)界主流推理引擎社區,攜手全產(chǎn)業(yè)共同推動(dòng)AI推理生態(tài)的繁榮發(fā)展。
責任編輯:何俊熹
(責任編輯:焦點(diǎn))