E創傳媒
2025年 / 11 月 20日 / 星期四
  • 首頁
  • 生活消費
  • 健康樂活
  • 旅遊美食
  • 地方社會
  • 3C科技
  • 影劇娛樂
  • 藝術教育
  • 金融財經
  • 運動體育
沒有結果
查看所有結果
  • 首頁
  • 生活消費
  • 健康樂活
  • 旅遊美食
  • 地方社會
  • 3C科技
  • 影劇娛樂
  • 藝術教育
  • 金融財經
  • 運動體育
沒有結果
查看所有結果
E創傳媒
沒有結果
查看所有結果
  • 首頁
  • 生活消費
  • 健康樂活
  • 旅遊美食
  • 地方社會
  • 3C科技
  • 影劇娛樂
  • 藝術教育
  • 金融財經
  • 運動體育
首頁 金融財經

WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障

2025-11-20
發布在 金融財經
分享到Facebook分享到LINE分享到Twitter分享到Wechat

突破性記憶體擴展技術經 Oracle Cloud Infrastructure 驗證,實現推論普及化,為 NeuralMesh 客戶帶來 1000 倍記憶體容量,首個 Token 生成時間加快 20 倍

聖路易斯和加州坎貝爾2025年11月20日 /美通社/ — 於 SC25 大會上:AI 儲存公司
WEKA 的突破性 Augmented Memory Grid 現已於 NeuralMesh 上正式推出。

從創新到投產:解決 AI 記憶體牆難題
自 NVIDIA GTC 2025 亮相以來,Augmented Memory Grid 已在包括 OCI 在內的領先 AI 雲端生產環境中,經過嚴格的強化、測試與驗證。結果證實了早期測試的預期:隨著 AI 系統演進至更長、更複雜的互動——從程式碼編寫助手到研究助理及推理代理——記憶體已成為限制推論效能與經濟效益的關鍵樽頸。

「我們正推出一個經 Oracle Cloud Infrastructure 及其他領先 AI 基礎設施平台驗證的成熟解決方案。」WEKA 聯合創始人兼行政總裁 Liran Zvibel 表示,「擴展代理式 AI 不僅取決於原始運算力,更在於透過智能數據路徑來解決記憶體牆問題。Augmented Memory Grid 讓客戶能在每個 GPU 上運行更多 Token,支援更多並發用戶,並為長文本工作負載解鎖全新的服務模式。OCI 的裸機基礎設施配合高性能 RDMA 網絡及 GPUDirect Storage 功能,使其成為大規模加速推論的獨特平台。」

現今的推論系統面臨一項根本限制:GPU 高頻寬記憶體 (HBM) 速度極快但容量有限,而系統 DRAM 雖空間較大但頻寬不足。一旦這兩層記憶體飽和,鍵值緩存數據便會被清除,迫使 GPU 重新運算已處理過的 Token,造成運算週期、電力與時間的浪費。

WEKA 的 Augmented Memory Grid 透過在 GPU 記憶體(通常是 HBM)與快閃儲存之間建立高速橋樑,成功突破 GPU 記憶體牆。它利用 RDMA 及 NVIDIA Magnum IO GPUDirect Storage 技術,在 GPU 記憶體與 WEKA 的 Token 倉庫之間持續傳輸鍵值緩存數據,從而達致記憶體級別的速度。這讓大型語言模型及代理式 AI 模型能夠存取更多語境資訊,無需重新運算先前的 KV Cache 或已生成的 Token,大幅提升效率與可擴展性。

經 OCI 驗證的效能與生態系統整合
獨立測試(包括在 OCI 上的驗證)已確認以下成果:

  • KV Cache 容量增加 1000 倍,同時保持接近記憶體的效能。
  • 在處理 128,000 個 Token 時,相較於重新運算預填充階段,首個 Token 生成時間加快 20 倍。
  • 在八節點叢集中錄得 750 萬次讀取 IOP 及 100 萬次寫入 IOP。

對於 AI 雲端供應商、模型供應商及企業 AI 開發者而言,這些效能提升從根本上改變了推論的經濟效益。透過消除多餘的預填充操作並維持高緩存命中率,機構可最大化租戶密度,減少閒置 GPU 週期,並顯著提高每千瓦時的投資回報率 (ROI)。模型供應商現可具成本效益地提供長文本模型服務,大幅削減輸入 Token 成本,並圍繞持久、具狀態的 AI 會話建立全新商業模式。

本次正式商用反映了 WEKA 與 NVIDIA 及 Oracle 等領先 AI 基礎設施夥伴的深度合作。該解決方案與 NVIDIA GPUDirect Storage、 NVIDIA Dynamo及 NVIDIA NIXL 緊密整合,WEKA 更為 NVIDIA Inference Transfer Library (NIXL) 開源了一個專用插件。OCI 的裸機 GPU 運算配合 RDMA 網絡及 NVIDIA GPUDirect Storage 功能,提供了 WEKA 所需的高效能基礎,確保在雲端 AI 部署中提供效能毫不妥協的 Augmented Memory Grid。

「大規模推論的經濟性是企業的重要考量。」Oracle 雲端基礎架構多雲端副總裁 Nathan Thomas 表示,「WEKA 的 Augmented Memory Grid 正面迎擊了這一挑戰。我們在 OCI 聯合測試中錄得首個 Token 生成時間加快 20 倍的提升,這不僅是效能指標,更從根本上重塑了運行 AI 工作負載的成本結構。對我們的客戶而言,這意味著部署下一代 AI 將變得更簡單、更具成本效益。」

正式商用資訊
Augmented Memory Grid 現已作為 NeuralMesh 部署的一項功能正式推出,並已上架 Oracle Cloud Marketplace,未來將支援更多雲端平台。

有意部署 Augmented Memory Grid 的機構,請瀏覽 WEKA 的 Augmented Memory Grid 頁面,以了解更多解決方案詳情及資格標準。

關於 WEKA
WEKA 憑藉其智能、適應性網狀儲存系統 NeuralMesh™,正在變革機構建立、運行和擴展 AI 工作流程的方式。傳統的數據基礎設施會隨著工作負載擴展而變得更慢、更脆弱,與此不同,NeuralMesh 會隨著規模擴展而變得更快、更強、更高效,動態適應 AI 環境,為企業級 AI 和代理式 AI 創新提供靈活的基礎。NeuralMesh 深受 30% 的《財富》50 強企業信賴,幫助領先企業、AI 雲端服務供應商和 AI 開發者優化 GPU、加速擴展 AI 並降低創新成本。如欲了解更多,請瀏覽 www.weka.io 或追蹤我們的 LinkedIn 和 X。

WEKA 和 W 標誌乃 WekaIO, Inc. 的註冊商標,而此處其他商品名稱可能是其各自擁有人的商標。

WEKA:企業人工智能的基礎
WEKA:企業人工智能的基礎

 

分享130分享Tweet81分享
前一篇文章

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

下一篇文章

McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談

相關的文章

農心發佈由aespa出演的辛拉麵全球廣告片
金融財經

農心發佈由aespa出演的辛拉麵全球廣告片

2025-11-20
McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談
金融財經

McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談

2025-11-20
WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益
金融財經

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

2025-11-20
下一篇文章
McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談

McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談

最新新聞

農心發佈由aespa出演的辛拉麵全球廣告片

農心發佈由aespa出演的辛拉麵全球廣告片

2025-11-20
McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談

McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談

2025-11-20
WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障

WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障

2025-11-20
WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

2025-11-20
Smart City Expo Doha 匯聚中東地區頂尖城市專家

Smart City Expo Doha 匯聚中東地區頂尖城市專家

2025-11-20

你可能也想看

嶺南大學與悉尼大學聯合舉辦研討會 探討教育與教學在AI時代轉型的迫切性

嶺南大學與悉尼大學聯合舉辦研討會 探討教育與教學在AI時代轉型的迫切性

2025-11-18

《監所男子囚生記》拍出粉紅名場面 劉以豪×陳澤耀四目相交火花強烈惹觀眾姨母笑

《監所男子囚生記》拍出粉紅名場面 劉以豪×陳澤耀四目相交火花強烈惹觀眾姨母笑

2025-11-14

改編自真實故事 《扶桑花女孩》強勢重回影迷視野

改編自真實故事 《扶桑花女孩》強勢重回影迷視野

2025-11-13

漾新聞|大社125熱力奔騰 白髮七傑返校爆「不老青春」潮

2025-11-16

E創傳媒

探索生活點滴,尋找啟發靈感!E創傳媒是您的生活媒體網站,提供豐富多彩的生活主題,包括旅行、美食、文化和時尚。進入我們的網站,探索最新的生活趨勢,豐富您的日常生活!

熱門新聞

  • 農心發佈由aespa出演的辛拉麵全球廣告片
  • McKinsey 與 General Catalyst 亮相 CES 主題演講舞台,接受 All-In 現場訪談
  • WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障
  • WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益
  • Smart City Expo Doha 匯聚中東地區頂尖城市專家

熱搜關鍵字

/莊珮縈 2025財經趨勢論壇暨金融科技商業交流展 AI指引 EXPO,昨(20)日在曼谷國際貿易展覽中心BITEC盛大開幕,開幕典禮由泰國會議展覽局局長Duangdej NEXTRATE睿途 Yuaikwamde、泰國投資促進署秘書長Narit 三陽 五里埔路段 光陽 南部最大聲/  屏東 隨著中央流行疫情指揮中心公告臺灣嚴重特殊傳染性肺炎COVID 山葉 曾志豪 機車 編輯 暌違3年的泰國臺灣形象展Taiwan 行動夢想家基金會 財產申報作業誤失 那瑪夏 鄭司文 重大洩密 韓佳宏 高階幹部個資

Copyright © E創傳媒. All rights reserved.

沒有結果
查看所有結果
  • 首頁
  • 生活消費
  • 健康樂活
  • 旅遊美食
  • 地方社會
  • 3C科技
  • 影劇娛樂
  • 藝術教育
  • 金融財經
  • 運動體育

Copyright © E創傳媒. All rights reserved.