Write Amplification
Keywords
write amplificationWAFGC overheadjournaling overheadcompactionpartial-stripe writeSSD lifetimeAsk ChatGPT
Prerequisites
Related Papers
- SSD-iq: Uncovering the Hidden Side of SSD Performance(PVLDB 2025)
- ZNS: Avoiding the Block Interface Tax for Flash-based SSDs(USENIX ATC 2021)
- Co-design of B+-Tree Index with Emerging Zone Interfaces(ACM TACO 2025)
- Write-Aware Timestamp Tracking: Effective and Efficient Page Replacement(PVLDB 2023)
- WiscKey: Separating Keys from Values in SSD-Conscious Storage(FAST 2016)
- Flash-oriented Coded Storage: Research Status and Future Directions(ACM TOS 2025)
Progress
Sign in to track your progress.
Write amplification 是衡量 SSD 效率的核心指標,定義為 WAF = 實際寫入 NAND flash 的資料量除以上層應用程式要求寫入的資料量。理想情況下 WAF 應為 1,但實際上幾乎不可能達到。GC 在搬移 valid page 時會產生額外的寫入;檔案系統的 journaling 機制會將同一筆資料先寫入 journal 再寫入正式位置;LSM-Tree 型態的儲存引擎在 compaction 過程中也會反覆搬移資料;而 RAID 架構中的 partial-stripe update 同樣會造成多餘的寫入。WAF 越高,SSD 的實際壽命就越短,因為每個 cell 的 P/E cycle 消耗得更快,同時寫入效能也會下降。我們在設計和評估儲存系統時,必須將 write amplification 視為一個需要從硬體到軟體全面考量的系統層級問題。
Key Concepts
我理解 write amplification factor(WAF)的定義:實際寫入 NAND flash 的資料量除以應用程式要求寫入的資料量
我了解 GC 搬移 valid page 是 write amplification 的主要來源之一,並知道如何從 GC 行為推算其對 WAF 的貢獻
我知道 journaling、LSM-Tree compaction、以及 RAID partial-stripe write 等軟體層機制也會造成額外的寫入放大
我理解 WAF 如何影響 SSD lifetime:WAF 越高,P/E cycle 消耗越快,SSD 的可用壽命就越短