人工智慧與高效能運算資料中心
容錯解決方案
整合式記憶體
如果驅動器過熱,則熱節流是一項安全功能。熱感測器監控關鍵元件的工作溫度。必要時會啟動韌體熱節流演算法,以防止溫度超過最大臨界值,藉此降低 I/O 交易的效能,直到操作溫度降至安全水平。
當 SSD 磁碟機承受大量工作負載,或使用高頻處理器製造的 NVMe SSD 消耗更多電力時,SSD 磁碟機會產生較大的熱量。過熱可能導致電子元件損壞和系統故障。
SMART 的 SSD 驅動器內置了一個熱感測器,可監控 SSD 的溫度,並在 SSD 的溫度超過臨界值時會降低整體性能。SMART 的熱節流架構提供了精細的算法,可優化安全性和性能的平衡。
假單層單元格 (pSLC) 是使用多級單元格 (MLC) 或三級單元格 (TLC) NAND Flash 的新技術,以將每個儲存格中儲存的位元數減少到一個。將每個儲存格中的儲存位元數量減少為一個,可增加 NAND 快閃記憶體的可靠性和使用壽命。
許多密集寫入應用程式,例如視訊監控、機器學習和 HPC,都需要高程式化和清除週期。SLC NAND 快閃記憶體比其他 NAND 快閃記憶體類型提供更高的耐用性和效能,但每位元成本更高。
隨著 NAND 技術成為每 GB 的成本驅動,3D TLC NAND 在成本和產品壽命方面提供了出色的平衡。SMART 的偽 SLC (pSLC) 產品在需要更高水平的資料完整性和預期產品使用壽命的應用程式中提供更好的耐用性和效能。透過在 Flash 控制器韌體中實作 NAND 供應商特定的指令和演算法,3D TLC NAND 可以在 1 位元 PSLC 模式下操作,其耐久性和性能行為與原生 SLC NAND 相符。SMART 的 PSLc 技術旨在優化成本和性能之間的平衡。
磨損平衡是指確保某些 NAND 塊不會比其他區塊更頻繁地寫入和刪除的練習。透過防止特定區塊過度使用,進而導致裝置故障或資料遺失,因此可提高 Flash 產品的預期壽命和耐用性。
在 NAND Flash 的應用中,程序/擦除週期(P/E 週期)存在一個限制。當每個圖塊的 P/E 週期達到最大值時,這些區塊就會變得無法執行。如果某些區塊被過度寫入和刪除,這些區塊的 P/E 週期將會迅速消耗,導致 NAND Flash 早期失敗。
磨損平衡的原理是讓所有單元格接收相同的寫入數,以避免在同一塊上連續的 P/E 週期。磨損平衡演算法通常由 Flash 控制器管理,以確定每次編程資料時要使用哪個實體區塊。使用磨損等級可以提高專門針對企業系統應用的儲存裝置的可靠性和使用壽命。
與傳統磁盤相比,基於 Flash 的存儲設備在處理先前刪除的數據方式上有所不同。必須先刪除數據,才能將新數據寫入 SSD 中的相同區塊。垃圾收集將使用中的資料複製到新區塊,然後從舊區塊中刪除所有資料。
基於 Flash 的儲存裝置與傳統硬碟不同,新資料通常會覆寫在相同實體位置的舊資料。在 SSD 中,新資料會寫入開啟的 Flash 記憶體區塊,並且與邏輯位址相關的相應舊資料會失效。垃圾收集會將新的有效資料合併到相鄰的記憶體位置,然後從實體 Flash 記憶體中刪除無效資料,以釋放記憶體區塊供新資料。
Flash 儲存格由頁面組成,多個頁面組成一個區塊。SSD 以頁面形式讀取和寫入資料,並在區塊層級清除資料。若要將新資料寫入已使用的區塊,SSD 控制器必須先複製所有有效資料,並將其寫入不同區塊的空頁。然後,在新刪除的區塊可以寫入新數據之前,它會刪除目前區塊中的有效和無效數據。這個過程稱為垃圾收集。
TRIM 是一個命令,操作系統可以通過該命令告訴 SSD 哪些塊不再需要並且可以刪除,或將其標記為免費進行重寫。使用 TRIM 指令,它不僅降低寫入放大器係數(WAF),還可以提高數據訪問速度。
雖然基於 Flash 的裝置是程式設計到控制器中的區塊層級實體結構,但作業系統有自己的組織架構 — 檔案系統。SSD 控制器知道哪些塊正在使用中,哪些是免費的,但不知道哪些塊對應到哪些文件。當 SSD 或操作系統刪除文件時,事情變得複雜。
TRIM 命令提供從檔案層級到區塊層級的橋接,讓作業系統能夠告訴 SSD 是否正在刪除檔案,並在下次「垃圾收集」執行期間將刪除的檔案標記為移除。
沒有 TRIM 命令,垃圾收集將不知道操作系統刪除哪些文件,因此它會繼續移動包含已刪除數據的頁面以及好頁面,從而導致寫入放大增加。這就是 TRIM 命令的工作地點。TRIM 指示 SSD 控制器停止收集包含已刪除數據的頁面,以便它們被留在後面並與區塊的其餘部分一起刪除。
TRIM 命令可以改善垃圾收集過程,減少寫入放大,並延長 SSD 的使用壽命和效能。
過度佈建是一種技術,其中記憶體的某一部分實體容量會保留用於進行垃圾收集、磨損等級和不良區塊管理。它有效減少寫入放大的屬性,並延長 SSD 的使用壽命。
SSD 磁碟機空間的一定部分會保留用於執行各種內部記憶體管理功能。使用者無法使用及存取過度佈建的空間,且主機作業系統無法看到。
SSD 製造商通常會保留 7% 的實體儲存空間,因為過度為背景活動提供,例如垃圾收集和磨損平衡。以 256GB 原始容量的固態硬碟為例。它本質上保留 7% 的原始容量,用於內置過度配置,從而留下 240GB 的實際使用者容量。較高的過度配置百分比(例如 28%)可進一步改善效能和 SSD 產品使用壽命。
觸發垃圾收集時,會根據散佈資料的規模影響 SSD 的寫入效能。資料在 NAND Flash 中散佈的數據越少,而過度佈建的百分比越高,因為垃圾收集的工作週期減少而影響效能的可能性就越低。換句話說,寫入放大減少,因此增加 SSD 的使用壽命。下圖顯示了不同過度配置層級中持久性增強的結果。
SMART 模組化技術透過整合式記憶體解決方案的設計、開發和進階封裝,協助世界各地的客戶實現高效能運算。我們的產品組合包括當今領先的記憶體技術,到標準和傳統的 DRAM 和快閃儲存產品。三十多年來,我們提供標準、堅固且自訂記憶體和儲存解決方案,滿足高成長市場中各種應用的需求。 立即聯繫我們以獲取更多信息。
在 Penguin,我們的團隊設計、構建、部署和管理高效能、高可用性的 HPC 和 AI 企業解決方案,使客戶能夠實現突破性的創新。
立即聯繫,讓我們討論您的基礎架構解決方案專案需求。