การป้องกันการสูญเสียพลังงานของ SSD โดยละเอียด

ระบบป้องกันกรณีไฟฟ้าดับ (PLP) ของ SSD ปัจจุบันไม่ใช่เรื่องใหม่ แต่แอพพลิเคชั่นและเทคนิคในการป้องกัน SSD ระหว่างและหลังจากไฟฟ้าดับมีการปรับปรุงขึ้นมากสำหรับ SSD รุ่นใหม่ ๆ ที่เปิดตัวเข้ามา วัตถุประสงค์ในการป้องกันกรณีไฟดับหลัก ๆ มีอยู่สองข้อด้วยกันได้แก่

  • เพื่อให้สามารถไล่ล้างข้อมูลค้าง (หรือข้อมูลในบัฟเฟอร์แคช DRAM หรือ SRAM ของไดร์ฟ) ไปยังแฟลชเมมโมรี่แบบฝั่งแน่นหรือไม่เลือนหายและ
  • เพื่อรักษาความสมบูรณ์ของตารางผังโครงสร้างไดร์ฟ SSD เพื่อให้ SSD มีโครงสร้างการทำงานที่สมบูรณ์และสามารถใช้งานได้อีกครั้งเมื่อรีบู๊ตเครื่อง

หมายเหตุ: ตารางโครงสร้าง SSD หรือ Flash Transition Layer (FTL) มีหน้าที่ดูแลผังโครงสร้างตรรกะทางกายภาพของข้อมูลในไดร์ฟ SSD

เมื่อมีการปิดเครื่องตามปกติ SSD จะรับคำสั่ง (คำสั่งสแตนด์บายทันที) จากไดร์เวอร์ ATA เพื่อแจ้ง SSD ว่าระบบกำลังปิดการทำงาน และ SSD จะเตรียมการตัดไฟ ขณะปิดเครื่องตามปกติ SSD จะมีเวลาเพียงพอในการไล่ล้างบัฟเฟอร์แคชและอัพเดตผังโครงสร้างข้อมูลของไดร์ฟ

SSD ที่ออกแบบเป็นอย่างดีจะใช้ระบบการทำงานระดับฮาร์ดแวร์ที่มีตัวเก็บประจุไฟฟ้าออนบอร์ดใน SSD และ/หรือ PLP ระดับเฟิร์มแวร์ซึ่งข้อมูลเมต้าดาต้าที่สำคัญจะถูกเขียนไปยังหน่วยความจำแฟลชเพื่อให้แน่ใจว่าจะสามารถกู้ข้อมูล SSD ในการเริ่มการทำงานครั้งถัดไปได้อย่างสมบูรณ์ ปัจจุบัน Kingston ใช้ตัวเก็บประจุแทนทาลัมโพลิเมอร์สำหรับ PLP

SSD ยุคแรกอาจไม่รองรับการตัดกระแสไฟอย่างฉับพลันได้ดีเท่ากับรุ่นใหม่ ๆ โดยมาก SSD ที่ถูกตัดไปอย่างฉับพลันจะหยุดตอบสนองหลังจากมีกระแสไฟเลี้ยงอีกครั้ง โดยส่วนใหญ่กรณีไฟดับนี้จะทำให้ SSD ไม่สามารถใช้การได้ และข้อมูลเกิดการสูญหาย

ระบบ PLP กับการทำงานสองรูปแบบอย่างละเอียด

Hardware PLP – Hardware PLP ออกแบบมาโดยมีเป้าหมายหลักเพื่อลดการสูญเสียของข้อมูลโดยการเก็บไฟไว้ที่ SSD ผ่านตัวเก็บประจุออนบอร์ด (Power Caps) เพียงพอที่ข้อมูลภายในบัฟเฟอร์แคชของ SSD จะสามารถเขียนไปยังหน่วยความจำแฟลชและตารางโครงสร้างข้อมูลจะทำการอัพเดตเสร็จสิ้น ภาพรวมการทำงานของ PLP ระดับฮาร์ดแวร์ทั่ว ๆ ไปกับ SSD จะมีลักษณะนี้

ชุดควบคุม SSD จะตรวจพบการสูญเสียไฟเลี้ยงแบบเฉียบพลัน

  1. ตัวเก็บประจุออนบอร์ดจะเก็บกระแสไฟเพื่อจ่ายไปยัง SSD
  2. ชุดควบคุมจะสั่งการให้ไล่ล้างบัฟเฟอร์แคช
  3. ชุดควบคุมจะอัพเดตตารางโครงสร้างข้อมูลเพื่อเตรียมพร้อมสำหรับการตัดกระแสไฟ
  4. ไดร์ฟจะปิดการทำงานได้อย่างสมบูรณ์

Firmware PLP – Firmware PLP ออกแบบมาเพื่อลดการสูญหายของข้อมูลเช่นกัน โดยการกำกับดูแลในระดับเฟิร์มแวร์เพื่อให้มีการสร้างตารางโครงสร้างข้อมูลเมื่อมีการเปิดใช้งานครั้งถัดไปหลังจากที่ไฟดับ ภาพรวมการทำงานของระบบป้องกัน PLP ระดับเฟิร์มแวร์จะมีลักษณะนี้:

  1. ตารางโครงสร้างข้อมูลของ SSD จะถูกจัดเก็บในหน่วยความจำแฟลชและอัพเดตไปยัง DRAM
  2. เมื่อข้อมูลใหม่ถูกเขียนไปยัง SSD เฟิร์มแวร์จะทำการอัพเดตตารางโครงสร้างข้อมูล
  3. ข้อมูลใหม่ที่ถูกเขียนมักมีการกำกับหมายเหตุ (หรือไบต์สำรอง) ซึ่งประกอบไปด้วย LBA, EEC และข้อมูลโครงสร้างอื่น ๆ
  4. ไฟดับกระทันหัน
  5. ไบต์สำรองที่มีรายละเอียดโครงสร้างข้อมูลจะถูกผสานกับตารางโครงสร้างข้อมูลเดิมเพื่อให้เฟิร์มแวร์ของ SSD สามารถจัดทำตารางโครงสร้าง SSD ใหม่เมื่อมีการเปิดใช้งานครั้งถัดไป

ระบบป้องกัน PLP ระดับเฟิร์มแวร์มีประสิทธิภาพมากเป็นพิเศษในการป้องกันข้อมูลสูญหายสำหรับแอพพลิเคชั่นจัดเก็บข้อมูลระดับองค์กร เช่น SSD จะต้องกำหนดค่าไว้ในอาร์เรย์ RAID เพื่อให้สามารถกู้คืนและกลับสู่สถานะที่สมบูรณ์หลังจากไฟดับเพื่อให้อาร์เรย์ RAID ยังสมบูรณ์เหมือนเดิม กลุ่มอาร์เรย์หนึ่งหรือหลายส่วนที่มีปัญหาอาจทำให้อาร์เรย์ออฟไลน์และมีโอกาสสูงที่ข้อมูลจะสูญหาย

การใช้งานในระดับองค์กรรูปแบบอื่น ๆ อาจมีการใช้ SSD “เป็นแหล่งแชร์ข้อมูล” ของส่วนจัดเก็บ โดย SSD ทางกายภาพจะถูกจัดแบ่งเป็น LUN ต่าง ๆ เพื่อแชร์กับกลุ่มโฮสต์หลาย ๆ ตัว การออกแบบสำหรับการใช้งานที่มีภาระสูงและต้องรองรับการใช้งานต่อเนื่องจากตัวอย่างนี้และระบบป้องกัน PLP ระดับเฟิร์มแวร์ทำให้มั่นใจว่า SSD สามารถกลับมาทำงานได้อีกครั้งเพื่อรองรับการทำงานกับ LUN และโฮสต์ได้ต่อไป

Kingston ให้ความสำคัญอย่างมากกับปัญหากรณีไฟดับ

Kingston® จะทำการทดสอบ SSD (ไคลเอนท์และระดับองค์กร) ผ่านวงรอบการทดสอบด้านวิศวกรรมที่เข้มงวดซึ่งเป็นกระบวนการมาตรฐานในการรับรองคุณภาพ นอกเหนือจากการรองรับการทำงานร่วมกัน ประสิทธิภาพและการทดสอบด้านความปลอดภัย Kingston SSD ยังต้องผ่านการทดสอบกรณีเมื่อเกิดไฟดับต่าง ๆ โดยจะต้องสามารถบู๊ตและทำงานได้ตามปกติจึงจะถือว่าผ่านกระบวนการตรวจสอบคุณภาพ หาก SSD เกิดปัญหา “bricks” ขึ้นระหว่างการทดสอบกรณีไฟดับ ระบบการทดสอบทางวิศวกรรมจะสิ้นสุดลงและมีการแจ้งให้แก้ไขปัญหาก่อนเริ่มวงรอบการตรวจสอบทางวิศวกรรมใหม่อีกครั้ง

สรุป

แอพพลิเคชั่นและสภาพแวดล้อมในการทำงานแต่ละอย่างมีความแตกต่างกัน และควรพิจารณาให้ดีขณะเลือกระบบ PLP ที่ตรงกับการใช้งานของคุณมากที่สุด

แอพพลิเคชั่นระดับองค์กรส่วนใหญ่จะป้องกันไฟเกิน มีระบบสำรองแบตเตอรี่และระบบผลิตกระแสไฟเพื่อให้ศูนย์ข้อมูลทำงานได้ต่อเนื่องแม้ว่าไฟจะดับโดยไม่คาดคิด ซอฟต์แวร์และเครือข่ายความเร็วสูงมีบทบาทสำคัญต่อจำนวนสถาปัตยกรรมการจำลองข้อมูลที่เพิ่มมากขึ้น ทำให้ฮาร์ดแวร์ไม่ใช่ปัญหาที่ต้องคำนึงถึงเพียงอย่างเดียวอีกต่อไป

เสถียรภาพของระบบไฟศูนย์ข้อมูล และมาตรการเพื่อรองรับการทำงานอย่างต่อเนื่อง (HA) ควรจะเป็นปัจจัยสำคัญในการพิจารณาระบบป้องกัน SSD PLP ที่เหมาะกับการจัดเก็บข้อมูลของผู้ใช้มากที่สุด

บทความที่เกี่ยวข้อง