หน่วยความจำ
ไดรฟ์โซลิดสเตต
ไดรฟ์ USB
แฟลชการ์ด
การสนับสนุน
ค้นหาหน่วยความจำ

แนวทางที่เหมาะสม

เปรียบเทียบ SSD สำหรับองค์กรและไคลเอนท์

ศูนย์ข้อมูลระดับองค์กรที่เพิ่มจำนวนมากขึ้นอย่างต่อเนื่องทำให้ประสิทธิภาพในการรองรับข้อมูลต้องดีขึ้นตามไปด้วย ความเร็วในการเรียกค้นข้อมูลที่ต่ำของฮาร์ดดิสก์ (HDD) ปัจจุบันได้กลายเป็นปัญหาคอขวดของเซิร์ฟเวอร์ หลายแห่งจึงเริ่มให้ความสนใจกับไดรฟ์ SSD เพื่อเป็นทางเลือกในการเพิ่มประสิทธิภาพของศูนย์ข้อมูล เสถียรภาพในการทำงาน และลดค่าใช้จ่ายในการทำงานโดยรวม (OpEx)

เพื่อทำความเข้าใจข้อแตกต่างระว่าง SSD แต่ละประเภท เราจะต้องเข้าใจส่วนประกอบหลักสองอย่างของ SSD ก่อน ซึ่งประกอบไปด้วย Flash Storage Processor และหน่วยความจำแฟลช NAND แบบไม่ลบเลือนซึ่งใช้เพื่อจัดเก็บข้อมูล

ในสภาวะตลาดปัจจุบันการใช้งาน SSD และหน่วยความจำแฟลช NAND ถูกแยกออกเป็นสามกลุ่มหลัก ๆ ได้แก่ กลุ่มผู้ใช้ทั่วไป (แท็บเล็ต กล้อง โทรศัพท์มือถือ) ไคลเอนท์ (เน็ตบุ๊ก โน้ตบุ๊ก Ultrabook AIO คอมพิวเตอร์เดสก์ทอป) กลุ่มบริการสำเร็จรูป/อุตสาหกรรม (ตู้เกม) และระบบคอมพิวเตอร์สำหรับองค์กร (HPC, เซิร์ฟเวอร์ฐานข้อมูล)

การเลือก SSD สำหรับจัดเก็บข้อมูลที่เหมาะสมสำหรับศูนย์ข้อมูลระดับองค์กรจึงเป็นกระบวนการที่ต้องศึกษาและพิจารณาอย่างละเอียด เนื่องจากมีผู้จำหน่าย SSD หลายเจ้าและมีผลิตภัณฑ์หลากหลายประเภท อีกทั้ง SSD และหน่วยความจำแฟลช NAND ก็มีประสิทธิภาพไม่เท่าเทียมกัน

SSD ผลิตขึ้นเพื่อให้สามารถใช้แทนฮาร์ดดิสก์ (HDD) แบบแผ่นจานแม่เหล็กหมุนแบบเก่าหรือเสริมการทำงานอย่างไม่ยุ่งยาก มีจำหน่ายรองรับฟอร์มแฟคเตอร์มากมาย ทั้งขนาด 2.5 นิ้ว และสำหรับโปรโตคอล/อินเทอร์เฟซการสื่อสารอย่าง Serial ATA (SATA) หรือ Serial Attached SCSI (SAS) เพื่อรองรับการรับส่งข้อมูลกับหน่วยประมวลผลกลาง (CPU) ของเซิร์ฟเวอร์

แม้ว่าการใช้งานจะไม่ยุ่งยาก แต่ก็ไม่สามารถรับประกันได้ว่า SSD จะเหมาะกับการใช้ในแอพพลิเคชั่นสำหรับองค์กรในระยะยาว อีกทั้งค่าใช้จ่ายจากการเลือก SSD ที่ผิดพลาดยังอาจทำให้เกิดภาระทางการเงินเพิ่มขึ้นและผลกระทบในเชิงประสิทธิภาพที่เกิดขึ้นเมื่อ SSD สึกหรอก่อนกำหนดจากการเขียนข้อมูลเป็นจำนวนมากทำให้การเขียนข้อมูลช้าลงแม้ยังไม่ถึงอายุการใช้งานที่กำหนด การเก็บข้อมูลจึงล่าช้า ซึ่งทำให้ต้องเปลี่ยนชิ้นส่วนใหม่ก่อนเวลาที่คาดการณ์ไว้

เอกสารชุดนี้กล่าวถึงคุณสมบัติที่สำคัญสามประการที่ใช้แยกแยะ SSD ระดับองค์กรและสำหรับไคลเอนท์ เพื่อให้สามารถพิจารณาจัดซื้อไดรฟ์สำหรับเปลี่ยนแทนหรือสำหรับเพิ่มพื้นที่ให้กับศูนย์ข้อมูลระดับองค์กรได้อย่างคุ้มค่าที่สุด

ประสิทธิภาพ

SSD มีประสิทธิภาพในการอ่านและเขียนข้อมูลสูงมากทั้งแบบอ่านต่อเนื่องหรือแบบสุ่มจาก CPU โดยอาศัยสถาปัตยกรรมหลายช่องสัญญาณ และการสืบค้นข้อมูลแบบคู่ขนานจาก FSP ไปยังแฟลชดาย NAND

ในศูนย์ข้อมูลปกติที่มีการประมวลผลข้อมูลบริษัทแบบสุ่มนับล้านไบต์ รวมทั้งต้องรองรับระบบ CAD และระบบวิเคราะห์ข้อมูลแผ่นดินไหว (เช่น Big Data) หรือในแอพพลิเคชั่นที่ต้องมีการเรียกค้นข้อมูลของลูกค้าทั่วโลกเพื่อตรวจสอบรายการธุรกรรม (เช่น OLTP) สื่อบันทึกข้อมูลจะต้องสามารถสืบค้นได้โดยใช้เวลาน้อยที่สุด และสื่อสารกับไคลเอนท์ที่ต้องการข้อมูลชุดเดียวกันได้มากที่สุดพร้อม ๆ กันโดยไม่ส่งผลต่อประสิทธิภาพในการทำงาน

แอพพลิเคชั่นไคลเอนท์เป็นการใช้งานของผู้ใช้รายเดียวซึ่งข้อจำกัดระหว่างความเร็วต่ำสุดและสูงสุดในการรับส่งข้อมูลอาจไม่มีข้อจำกัดมากนัก

ระบบจัดเก็บข้อมูลที่มีความซับซ้อนที่เลือกใช้ SSD (เช่น Network Attached Storage, Direct Attached Storage หรือ Storage Area Network) อาจเกิดปัญหาขึ้นได้จากประสิทธิภาพที่ไม่สม่ำเสมอของไดรฟ์ ทำให้ส่งผลต่อการจัดเก็บข้อมูล เสถียรภาพในการทำงาน และคุณภาพในการให้บริการ

SSD ระดับองค์กรอย่าง Kingston E100 แตกต่างจาก SSD ไคลเอนท์ตรงที่ไม่เพียงแต่มีประสิทธิภาพในระดับสุดยอดในช่วงเริ่มการทำงานเท่านั้น แต่ยังมีพื้นที่จัดสรรพิเศษ (OP) ที่ทำให้เสถียรภาพในการทำงานเป็นไปอย่างต่อเนื่องแม้จะใช้งานไปแล้วเป็นเวลานาน [1]

ทำให้มั่นใจได้ว่าระบบจัดเก็บข้อมูลจะมีการทำงานที่สม่ำเสมอตามเกณฑ์คุณภาพในการให้บริการที่องค์กรคาดหวังแม้ในช่วงที่มีการสื่อสารข้อมูลเป็นจำนวนมาก

ความเชื่อถือได้

หน่วยความจำแฟลช NAND มีข้อจำกัดอยู่บางประการ ส่วนที่สำคัญที่สุดสองอย่างได้แก่อายุการใช้งานที่จำกัด และข้อผิดพลาดที่มักเกิดขึ้นได้บ่อย

ระหว่างขั้นตอนการผลิตแฟลช NAND แฟลชดาย NAND แต่ละตัวจะผ่านการทดสอบและประเมินอัตราข้อผิดพลาดบิตเบื้องต้น (BER หรือ RBER)

BER ใช้เพื่อระบุอัตราการเกิดข้อผิดพลาดของบิตข้อมูลในแฟลช NAND หากไม่มี Error Correction Code (ECC) หรือ FSP ที่อาศัย fly advanced ECC เพื่อไม่ให้รบกวนการทำงานของผู้ใช้หรือระบบตามปกติ

ประสิทธิภาพของ Flash Storage Processor ในการแก้ไขข้อผิดพลาดของบิตข้อมูลเหล่านี้สามารถประเมินออกมาเป็น Uncorrectable Bit Error Ratio (UBER) "ซึ่งเป็นเกณฑ์ชี้วัดอัตราข้อผิดพลาดของข้อมูลเทียบกับจำนวนข้อผิดพลาดของข้อมูลต่อการอ่านบิตหลังจากใช้ระบบแก้ไขข้อผิดพลาดที่เกี่ยวข้องแล้ว" [2]

ภายใต้นิยามและมาตรฐานของ JEDEC Committee ปี 2010 ตามเอกสาร JESD218A:Solid State Drive (SSD) Requirements and Endurance Test Method และ JESD219:Solid State Drive (SSD) Endurance Workloads ไดรฟ์สำหรับองค์กรจะมีลักษณะแตกต่างจาก SSD สำหรับไคลเอนท์ในหลาย ๆ ด้าน เช่น รองรับงานเขียนได้มากกว่า สมบุกสมบันกว่า และกู้ข้อมูลจาก BER ได้ดีกว่า SSD ไคลเอนท์ [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

ตารางที่ 1 - JESD218A:Solid State Drive (SSD) Requirements and Endurance Test Method ลิขสิทธิ์ JEDEC เผยแพร่โดยได้รับอนุญาตจาก JEDEC

ภายใต้เงื่อนไข UBER ที่เสนอโดย JEDEC ในส่วนของ SSD สำหรับองค์กรและไคลเอนท์ พบว่า SSD ระดับองค์กรจะมีอัตราข้อผิดพลาดบิตข้อมูลที่ไม่สามารถกู้คืนได้เพียง 1 ต่อ 1,000 ล้านล้านบิต (~1.11 พาทาไบต์) เมื่อเทียบกับ SSD ไคลเอนท์ที่มีข้อผิดพลาดบิตข้อมูลที่ 1 ต่อ 100 ล้านล้านบิต (~0.11 เพทาไบต์)

ระบบป้องกันอีกชั้นของไดรฟ์คือ Redundant Array of Independent Silicon Element (R.A.I.S.E.) จาก LSI® SandForce® ที่ถูกนำมาใช้กับ SSD ระดับองค์กรผ่านพาริตี้แบบ Stripe กับดายแฟลช NAND เพื่อจัดการกรณีที่ FSP ECC ไม่สามารถแก้ไขปัญหาข้อผิดพลาดบิตข้อมูลได้

เทคโนโลยี R.A.I.S.E. ™ สามารถลดระดับ UBER ลงได้อย่างมากถึง 1 บิตต่อทุก ๆ 100 ออคทิลเลียนบิต (10-29) หรือ ~111022302462515.66 เพทาไบต์ที่ถูกประมวลผล นอกจากนี้ UBER ยังน้อยกว่า SSD มาตรฐานถึง 100 ล้านล้านบิต [5]

เพื่อเสริมการทำงานของเทคโนโลยี R.A.I.S.E. ™ ใน Kingston E100 SSD เราจึงได้พัฒนาระบบกำหนดจุดตรวจสอบตามช่วงเวลาและ Cyclic Redundancy Check (CRC) ขึ้นเพื่อปกป้องระบบการสื่อสารภายในระหว่างต้นทางและปลายทางเพื่อให้ข้อมูลมีความสมบูรณ์ระหว่างโฮสต์และแฟลชทั้งขาไปขากลับ

การทำงานจะคล้ายกับระบบป้องกัน ECC แบบพิเศษใน SSD ระดับองค์กรที่สามารถป้องกันข้อผิดพลาดของบิตข้อมูล โดยจะมีส่วนควบคุมอิเล็กทรอนิกส์ที่คอยตรวจจับกระแสไฟที่ขาดหายคล้ายกับ Kingston E100 ทำให้ทราบระดับกระแสไฟที่ถูกจ่ายเข้า และพร้อมจ่ายกระแสไฟชั่วคราวผ่านตัวเก็บประจุ Tantalum ในกรณีที่ไฟดับเพื่อให้พร้อมในกรณีที่เกิดปัญหาขณะเขียนข้อมูลทั้งภายในหรือภายนอก ความทนทานจึงเพิ่มมากขึ้น

สมบุกสมบัน

หน่วยความจำแฟลช NAND ทั้งหมดในสื่อบันทึข้อมูลระบบแฟลชจะมีเสถียรภาพในการเก็บบิตข้อมูลลดลงทุกครั้งที่เขียนโปรแกรมหรือลบข้อมูล (P/E) ลงบนเซลล์หน่วยความจำแฟลช NAND จนในที่สุดแฟลช NAND ก็จะไม่สามารถจัดเก็บข้อมูลได้อย่างมีเสถียรภาพอีกต่อไปและจะต้องนำออกจากการใช้เป็นส่วนจัดเก็บข้อมูลที่อ้างอิงได้ของผู้ใช้ การอ้างอิงที่อยู่ตรรกะของไดรฟ์จะถูกย้ายไปยังที่อยู่ทางกายภาพใหม่บนอาร์เรย์จัดเก็บข้อมูลแฟลช NAND

ขณะที่เซลล์ถูกเขียนโปรแกรมหรือลบข้อมูลอย่างต่อเนื่อง BER ก็จะเพิ่มขึ้นตามไปด้วย ด้วยเหตุนี้จึงต้องมีเทคนิคในการจัดการที่ซับซ้อนสำหรับ SSD FSP ระดับองค์กรในการเค้นประสิทธิภาพของเซลล์บันทึกข้อมูลของ SSD ให้มีเสถียรภาพและอายุการใช้งานตามที่กำหนด [6]

ค่าความทนทาน P/E ของหน่วยความจำแฟลช NAND จะแตกต่างกันไปขึ้นอยู่กับกระบวนการผลิตในปัจจุบันและประเภทของแฟลช NAND ที่ใช้

ประเภทหน่วยความจำแฟลช NAND TLC MLC e-MLC SLC
สถาปัตยกรรม 3 บิตต่อเซลล์ 2 บิตต่อเซลล์ 2 บิตต่อเซลล์ 1 บิตต่อเซลล์
ความจุ ความจุสูงสุด ความจุสูง ความจุสูง ความจุต่ำสุด
ความทนทาน (P/E) ทนทานต่ำสุด ทนทานปานกลาง ทนทานสูง ทนทานสูงสุด
ต้นทุน $ $$ $$$ $$$$
Approx NAND Bit Error Rate (BER) อัตราข้อผิดพลาดบิดข้อมูล NAND (BER) โดยประมาณ 10^4 10^7 10^8 10^9

อัตราข้อผิดพลาดบิดข้อมูล NAND (BER) โดยประมาณ ตาราง 2 - ประเภทหน่วยความจำแฟลช NAND [6] [7] [8] [9]

หน่วยความจำแฟลช NAND Multi-Level Cell (e-MLC) ระดับองค์กรที่ใช้กับ Kingston E100 SSD ทำงานคล้ายกับหน่วยความจำแฟลช MLC NAND ทั่วไป แต่ยังมีระบบคัดกรองและตรวจสอบคุณสมบัติ ทำให้มีค่าความทนทาน P/E สูงกว่าและ BER ต่ำกว่า MLC มาตรฐานที่ใช้ใน SSD สำหรับไคลเอนท์

เนื่องจาก SSD ระดับองค์กรจะต้องสามารถทนต่อการเขียนเป็นจำนวนมากได้ซึ่งถือเป็นเรื่องปกติในเซิร์ฟเวอร์ศูนย์ข้อมูลที่มีการเรียกค้นข้อมูลตลอด 24 ชั่วโมงทุกวันในขณะที่ SSD ไคลเอนท์อาจทำงานเพียง 8 ชั่วโมงต่อวัน e-MLC จึงเป็นทางเลือกที่สมบูรณ์แบบที่สุดในการเพิ่มประสิทธิภาพ ความจุและความทนทานให้กับ SSD

การศึกษาเกี่ยวกับความทนทานในการเขียนข้อมูลของแอพพลิเคชั่นหรือ SSD อาจมีองค์ประกอบมากมาย ด้วยเหตุนี้คณะกรรมการ JEDEC จึงได้จัดทำข้อเสนอและเกณฑ์ตรวจวัดความทนทานขึ้นโดยใช้ค่า TeraBytes Written (TBW) เพื่อชี้วัดปริมาณข้อมูลดิบที่สามารถเขียนไปยัง SSD ก่อนที่แฟลช NAND ใน SSD จะไม่สามารถจัดเก็บข้อมูลได้อย่างมีเสถียรภาพและต้องเปลี่ยนไดรฟ์ใหม่

การใช้วิธีการทดสอบ JESD218A และ JESD219 สำหรับองค์กรที่เสนอโดย JEDEC ทำให้สะดวกยิ่งขึ้นในการคำนวณค่าความทนทานของ SSD จากผู้ผลิตต่าง ๆ โดยอาศัย TWB และยังทำให้เกิดมาตรการที่ชัดเจนด้านความทนทานที่มากขึ้นซึ่งศูนย์ข้อมูลทุกแห่งสามารถนำมาปรับใช้ได้

ในเอกสาร JESD218 และ JESD219 มีระบุไว้ว่าภาระในการทำงานของแอพพลิเคชั่นแต่ละกลุ่มอาจได้รับผลกระทบได้อย่างมากจากตัวแปรยกกำลังในการเขียนข้อมูล (WAF) ซึ่งสามารถสร้างภาระได้มากกว่าการข้อมูลการเขียนจริงที่ได้รับจากโฮสต์ และทำให้เกิดการสึกหรอของแฟลช NAND โดยไม่สามารถควบคุมได้ BER แฟลช NAND สูงขึ้นเนื่องจากการสึกหรอจากการเขียนข้อมูลที่เพิ่มขึ้นไปตามเวลา ประสิทธิภาพในการทำงานที่ช้าลงเนื่องจากความกระจัดกระจายของเพจข้อมูลที่ไม่ถูกต้องใน SSD

กลไกการบีบอัดข้อมูลที่ใช้ใน Kingston E100 ร่วมกับเทคโนโลยี LSI® SandForce® DuraWrite™ ช่วยลด WAF โดยรวม และเพิ่มความทนทานให้กับแฟลช NAND ซึ่งเหมาะกับแอพพลิเคชั่นในระดับองค์กร

ในขณะที่ TWB ถือเป็นตัวแปรสำคัญที่ได้รับการกล่าวถึงใน SSD ระดับองค์กรและไคลเอนท์ แต่ TBW เป็นตัวแบบคาดการณ์ความทนทานของแฟลช NAND เพียงตัวเดียว โดยควรมีการพิจารณาค่า Mean Time Between Failure (MTBF) ร่วมด้วยเพื่อให้สามารถประเมินความทนทานและเสถียรภาพในการทำงานสอดคล้องกับส่วนประกอบที่ถูกใช้ผลิต สิ่งที่ผู้ใช้คาดหวังจากส่วนประกอบของ SSD ระดับองค์กร ได้แก่ความทนทาน การรองรับงานได้สมบุกสมบันมากกว่า และการจัดการแรงดันไฟฟ้าได้ครอบคลุมหน่วยความจำแฟลช NAND ทั้งหมดตลอดอายุการใช้งานของ SSD

ระบบตรวจสอบและแจ้งข้อมูล S.M.A.R.T. ใน SSD ระดับองค์กร ช่วยให้สามารถประเมินประสิทธิภาพของส่วนประกอบได้ก่อนจะเกิดปัญหา การคาดการณ์อายุการใช้งานจึงสอดคล้องกับตัวแปรยกกำลังในการเขียนข้อมูลและระดับการสึกหรอจากการใช้งานจริง

ระบบแจ้งเตือนก่อนเกิดปัญหารองรับการตรวจสอบที่หลากหลาย เช่น กรณีไฟดับ ข้อผิดพลาดบิตข้อมูลจากอินเทอร์เฟซทางกายภาพ หรือการสึกหรอที่ไม่สม่ำเสมอกัน

SSD ไคลเอนท์รองรับระบบ S.M.A.R.T. ในระดับพื้นฐานเพื่อตรวจสอบ SSD ระหว่างการใช้งานตามปกติหรือเมื่อเกิดข้อผิดพลาดแล้วเท่านั้น

พื้นที่สำรองที่เพิ่มมากขึ้นของหน่วยความจำแฟลช NAND ยังสามารถจัดสรรไว้เป็นพื้นที่จัดเก็บข้อมูลสำรองส่วนเกิน (OP) ได้เช่นกัน ทั้งนี้ขึ้นอยู่กับกลุ่มแอพพลิเคชั่นและความจุของ SSD พื้นที่ OP จะถูกซ่อนไว้จากใช้งานโดยผู้ใช้และระบบปฏิบัติการ และสามารถนำมาใช้เป็นบัฟเฟอร์เขียนข้อมูลชั่วคราว ทำให้ประสิทธิภาพในการทำงานสม่ำเสมอมากกว่า และยังสามารถใช้แทนเซลล์หน่วยความจำแฟลชที่มีปัญหาในช่วงอายุการใช้งานของ SSD ทำให้ SSD มีเสถียรภาพในการทำงานและความทนทานที่สูงกว่า

สรุป

มีข้อแตกต่างที่ชัดเจนระหว่าง SSD สำหรับองค์กรและไคลเอนท์ ไม่ว่าจะเป็นหน่วยความจำแฟลช NAND ความทนทานในการเขียนโปรแกรมและลบข้อมูล รวมทั้งเทคนิคที่ซับซ้อนในการบริหารจัดการพื้นที่เพื่อให้สอดคล้องกับภาระในการทำงานของกลุ่มแอพพลิเคชั่นใช้งาน

ความเข้าใจข้อแตกต่างของกลุ่มการใช้งานซึ่งเกี่ยวข้องทั้งในด้านประสิทธิภาพ เสถียรภาพในการทำงาน และความทนทานถือเป็นเครื่องมือที่สำคัญในการลดและจัดการปัจจัยเสี่ยงของความเสียหายที่อาจทำให้เสียเวลาภายใต้สภาพแวดล้อมในการทำงานที่เปราะบางและมีความสำคัญขององค์กร