UltiHash
UltiHash 是一個專為 AI 和大數據工作負載打造的高效能、Kubernetes 原生對象儲存平台。它透過先進的位元組級重複資料刪除技術提供閃電般的資料存取速度和顯著的成本節約,並支援在雲端、本地或混合環境中靈活部署。其 S3 相容的 API 確保了與現有資料堆疊和 AI 工作流程的無縫整合。
UltiHash 是一個專為 AI 和大數據工作負載打造的高效能、Kubernetes 原生對象儲存平台。它透過先進的位元組級重複資料刪除技術提供閃電般的資料存取速度和顯著的成本節約,並支援在雲端、本地或混合環境中靈活部署。其 S3 相容的 API 確保了與現有資料堆疊和 AI 工作流程的無縫整合。
關於 資料儲存
AI資料儲存是專門用於管理訓練和部署人工智慧模型所需的大量複雜資料集的系統。這些平台專為高吞吐量、低延遲性能而設計,旨在消除資料瓶頸,確保GPU等強大運算資源得到充分利用。作為AI基礎設施中的基礎層,它們支援更快的模型迭代、更高的準確性以及可擴展的AI應用部署。其架構經過優化,能夠以PB級規模處理非結構化資料(圖像、文字、音訊)和結構化資料。
核心功能
- 高效能I/O:提供大規模並行吞吐量和高IOPS(每秒輸入/輸出操作數),滿足資料密集型AI訓練負載的需求。
- 海量可擴展性:能夠獨立、無中斷地彈性擴展儲存容量和效能,從TB級擴展至EB級。
- 非結構化資料優化:高效儲存、管理和存取AI中常見的各種資料類型,如圖像、影片和大型文字語料庫。
- AI框架整合:與TensorFlow、PyTorch等主流ML框架以及Spark等資料平台無縫連接。
- 資料版本與血緣:追蹤資料集版本和元資料,確保模型訓練實驗的可重現性和可追溯性。
適用場景
這些儲存解決方案對於從事大規模AI開發的組織至關重要。這包括訓練基礎模型的研究機構、管理自動駕駛資料的汽車公司以及分析醫學影像的醫療機構。對於運行即時詐欺偵測的金融服務公司和驅動推薦引擎的電子商務平台而言,它們同樣不可或缺。
選擇要點
選擇AI資料儲存解決方案時,應評估其效能基準(例如,針對特定工作負載的吞吐量)。考量其處理主要資料類型的能力及其與現有MLOps工具鏈的整合情況。評估其可擴展性模型,確保能滿足未來資料增長的需求。最後,根據預算比較其總擁有成本,包括資料傳輸、API請求和支援費用。
資料儲存應用場景
訓練大型語言模型 (LLM)
一家AI研究實驗室正在開發一個新的基礎模型。他們需要儲存和處理一個50TB的精選文字和程式碼資料集。一個針對AI優化的資料儲存解決方案提供了所需的高並行吞吐量,可以同時為數百個GPU提供資料,防止它們閒置。這將訓練過程從數月縮短到數週,從而實現更快速的實驗和模型優化。資料版本控制功能還用於追蹤每次訓練執行使用的資料集快照,確保了可重現性。
管理自動駕駛車輛感測器資料
一家汽車公司從其測試車隊中收集PB級的資料,包括高解析度影片、光學雷達和雷達資料。一個可擴展的AI資料儲存平台充當中央資料湖。它使工程師能夠高效地擷取、編目和查詢這個龐大的資料集,以尋找特定場景(例如,「高速公路上的夜間雨天」)。這些經過整理的資料隨後被送入感知和控制模型的訓練管道,直接提高了其自動駕駛系統的安全性和可靠性。
驅動即時推薦引擎
一個大型電子商務平台使用AI模型提供個人化的產品推薦。一個高效能的資料儲存系統(通常是特徵儲存),用於保存使用者行為資料和產品特徵向量。當使用者瀏覽網站時,推薦引擎會查詢該儲存,以亞毫秒級的延遲檢索相關特徵。這使得平台能夠即時生成並顯示新鮮、相關的推薦,從而顯著提高使用者參與度和轉化率。
分析醫學影像用於診斷
一家醫療科技公司正在開發一種AI,用於從MRI掃描中檢測疾病。他們需要一個安全且合規的資料儲存解決方案,以存放數百萬個高解析度DICOM影像檔案。該儲存系統必須為訓練卷積神經網路(CNN)提供快速的讀取存取,並與資料標註平台整合。高效的資料處理使研究人員能夠快速迭代模型架構,提高其AI的診斷準確性,最終改善患者的治療效果。
為基因組研究建構資料湖
一個生物資訊學研究所處理大量的基因組定序資料。他們使用AI資料儲存解決方案來創建一個集中的資料湖。該系統經過優化,可以處理混合的超大檔案(定序讀數)和數百萬個較小檔案(分析結果)。其高效能檔案系統允許多名研究人員並行運行複雜的資料處理和機器學習管道,而不會降低效能。這加快了個人化醫療和藥物開發等領域的發現步伐。
歸檔和存取媒體製作資產
一家視覺效果(VFX)工作室處理4K和8K影片檔案,這些檔案非常大。他們使用高容量的AI資料儲存系統作為活動歸檔。這使得藝術家可以使用AI驅動的元資料標記和搜尋,快速尋找和檢索過去專案中的特定片段或資產。該儲存為藝術家提供了足夠的效能,可以直接在歸檔上進行調色或添加特效等任務,從而消除了從傳統磁帶歸檔恢復資料的緩慢過程。