メモリー
ソリッド ステート ドライブ
USBドライブ
Flashカード
サポート
メモリ検索

成功事例

エンタープライズ SSD 対クライアント SSD

以前はサーバーのハードディスクドライブ (HDD) に依存していたが、高い処理能力と低いトランザクションレイテンシを必要とする多くのエンタープライズデータセンターが、現在ではパフォーマンスのボトルネックに直面し、そのデータセンターの性能、効率、信頼性、および全体的な運用コスト (OpEx) を改善するために実行可能なストレージソリューションとして、ソリッドステートドライブ (SSD) を探しています。

まず SSD のクラス間の違いを理解するには、データの保存に使われる SSD の 2 つの主要コンポーネントである「フラッシュストレージプロセッサ」と「不揮発性の NAND フラッシュメモリ」を区別する必要があります。

今日のマーケットでは、SSD と NAND フラッシュメモリの消費量は主に 3 つのグループ、すなわち消費者向けデバイス (タブレット端末、カメラ、携帯電話など)、クライアントデバイス (ネットブック、ノートパソコン、ウルトラブック、AIO、デスクトップパソコンなど)、組み込み/産業用 (ゲーム用キオスク) およびエンタープライズコンピュータ (HPC、データセンタサーバーなど) に分かれています。

しかしエンタープライズデータセンター向けに正しい SSD ストレージデバイスを選択するのは、すべての SSD と NAND フラッシュメモリが実際には等しく造られているわけではないため、多くの異なる SSD ベンダーや製品のタイプを調べて、検証する長く困難なプロセスになる可能性があります。

SSD は、回転式の磁気プラッターベースのハードディスクドライブ (HDD) の代替品または補完品として容易に展開でき、またサーバーの CPU (中央演算処理装置) に対してデータの送受信を行うために、2.5 インチを含むさまざまなフォームファクタ、SATA (Serial ATA) および SAS (Serial Attached SCSI) を含む通信プロトコル/インターフェースを容易に展開できるように製造されています。

しかし容易に展開できることはすべての SSD が、それらが展開されたエンタープライズアプリケーションで長期にわたり適することを保証するわけではなく、間違った SSD を選択した場合の費用が、SSD の過度の書込み動作、予想の寿命を越えてはるかに低い持続的な書き込み性能、またはストレージアレイに追加レイテンシを引き起こし、結果的に現場での早期の交換が必要になった時に、初期のコスト削減や性能上の利点をしばしば相殺することになります。

この論文では、エンタープライズデータセンタでストレージの交換または増加が必要になった時に、購入のための正しい判断ができるように支援するために、エンタープライズとクライアントクラスの SSD を区別する 3 つの主な資質について議論します。

性能

SSD は、マルチチャンネルアーキテクチャ、および FSP から NAND フラッシュダイへのパラレルアクセス方式を用いることにより、CPU からのシーケンシャルおよびランダムデータ要求に対して、非常に速い読取りおよび書込み性能を発揮できます。

技術的な CAD 図面、分析用の地震データ (大規模データなど)、あるいは銀行取引のための世界的な顧客データのアクセス (OLTP など) を含む何百万バイトものランダム企業データを扱う典型的なデータセンタのシナリオの場合、ストレージデバイスは待ち時間を最小限に抑えながらアクセス可能でなければならず、また応答時間を遅らせずに多数のクライアントが同じデータに同時にアクセス可能でなければなりません。

1 つのクライアントアプリケーションは、どんなユーザーやシステム動作の場合でも、最小から最大の応答時間の範囲内で、より高い許容デルタ値で、一人のユーザーまたは 1 つのアプリケーションのアクセスにのみ対応します。

また SSD を使った複雑なストレージアレイ (ネットワーク接続ストレージ、ダイレクト接続ストレージ、ストレージエリアネットワークなど) は、性能の不一致によって大きな影響を受け、ストレージアレイの待ち時間の増加、性能の低下、そして最終的にサービス品質の低下を引き起こす可能性があります。

クライアント SSD と異なり、Kingston E100 ソリッドステートドライブのようなエンタープライズクラスの SSD は、アクセスの最初の数秒間のピーク性能だけでなく、より大きなオーバープロビジョニング領域 (OP) を使って、さらに長時間にわたり、持続的に高い定常状態を保つように最適化されています。[1]

これにより、トラフィックのピーク負荷時でも、組織が期待するサービス品質を維持するストレージアレイの性能が保証されます

信頼性

NAND フラッシュメモリには、それに関連する多くの固有の問題があるが、2 つの最も重要な問題点は、寿命が有限であることと、自然に発生するエラーの比率です。

NAND フラッシュの製造工程では、各 NAND フラッシュダイが、生のビットエラーレート (BER または RBER) を用いてテストされ、特徴付けられます。

BER の値は、エラー訂正コード (ECC) の利点を用いずに、NAND フラッシュ内で自然に発生するビットエラーの比率を判断するもので、ユーザーまたはシステムのアクセスを妨げずにアドバンスト ECC を使った FSP 訂正も行いません。

これらのビットエラーを訂正する「フラッシュストレージプロセッサ」の能力は、「訂正不可能ビットエラーレート (UBER) 」と解釈することができるが、これは「指定された任意のエラー訂正方法を適用した後に読み出したビット当りのデータエラー数に等しいデータ破損率のメトリック値」になります。 [2]

2010 年に JEDEC Committee が JESD218A: Solid State Drive (SSD) Requirements (SSD の要件) および、Endurance Test Method および JESD219:Solid State Drive (SSD) Endurance Workloads (SSD の耐久性作業負荷) により定義および標準化したように、エンタープライズクラスはクライアントクラスの SSD とは多くの方法が異なっているが、それは書込みの作業負荷に対応する能力に限らず、更に極端な環境条件や、クライアント SSD とりも高い BER からの回復が含まれます。 [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

表 1 - JESD218A:ソリッドステートドライブの要件と耐久性試験の方法 著作権は JEDEC に帰属。複製には JEDEC の許可が必要です。

エンタープライズ対クライアントの SSD の比較に関する JEDEC 提案の UBER 要件を用いたた場合、1 兆ビット (~0.11 ペタバイト) の処理当り 1 ビットエラーが発生するクライアント SSD に対し、エンタープライズクラス SSD は 10 兆ビット (~1.11 ペタバイト) 当り 1 ビットエラーの発生が予想されます。

LSI® SandForce® のR.A.I.S.E.™ (独立シリコンエレメントの冗長アレイ) テクノロジー) を含む追加的な保護方法は、FSP ECC がビットエラーから復旧できない時に、NAND フラッシュダイのストライプパリティを使用することにより、エンタープライズクラスの SSD に導入可能です。

R.A.I.S.E.™ テクノロジーは、UBER 値を 10-29 当り 1 ビットのエラーに、または~111022302462515.66 ペタバイト当り 1 ビットのエラーに効果的に下げることができ、また標準的な SSD よりも UBER 値を約 1 兆倍少ない値にします [5]

Kingston E100 SSD で R.A.I.S.E.™ テクノロジーを補完するために、定期的なチェックポイントの作成と CRC (巡回冗長検査) のエンドツーエンドの内部保護方式が行われ、フラッシュを経由したホストからのデータや、ホストへのデータの完全性が保証されます。

ビットエラーに対する ECC 保護機能を持つエンタープライズクラス SSD と同様に、これらは Lingston E100 の停電時のサポート機能と同じ停電時保護ロジックを持つ制御用電子回路を持ち、供給電源をモニターし、停電時にはタンタルコンデンサーを使って一時的に電力を供給して、データ書込みの内部的および外部的な問題を解決する必要があります。

耐久性

フラッシュストレージデバイスに含まれるすべての NAND フラッシュメモリは、NAND フラッシュメモリセルのプログラムおよび消去 (P/E) サイクルが繰り返されるに従って、データビットの格納能力が低下し、これは NAND フラッシュがそれ以上はデータを格納できない状態になるまで続き、その時点でユーザーがアドレス指定可能なストレージプールから取り外し、その論理アドレスを NAND フラッシュストレージアレイの新しい物理アドレスに移す必要があります。

メモリセルではプログラムと消去が常に行われるため、BER の値も直線的に増加します。そのため、データを格納するメモリセルの能力の信頼性を管理するために、複雑な管理技法の組合せを行わねばなりません。 [6]

所定の NAND フラッシュメモリの P/E の耐久性は、現在のリソグラフィー製造プロセスと、生産される NAND フラッシュのタイプによって大きく変化する可能性があります。

NAND フラッシュメモリのタイプ TLC MLC e-MLC SLC
アーキテクチャ 3 ビット/セル 2 ビット/セル 2 ビット/セル 1 ビット/セル
容量 最大容量 大容量 大容量 小容量
耐久性 (P/E) 低い耐久性 中程度の耐久性 高い耐久性 最高の耐久性
コスト ¥ ¥¥ ¥¥¥ ¥¥¥¥
NAND ビットエラーレート (BER)、約 10^4 10^7 10^8 10^9

表 2 – NAND フラッシュメモリのタイプ [6] [7] [8] [9]

Kingston E100 エンタープライズクラス SSD で使用しているエンタープライズグレードの「マルチレベル セル」(e-MLC) NAND フラッシュメモリは、一般グレードの MLC NAND フラッシュメモリの動作と似ているが、クライアントクラスの SSD で使用されている標準的な MLC よりも BER 値が低く、より高い P/E の耐久性を達成するために、追加のスクリーニングと認証要件が用いられています。

エンタープライズクラスの SSD は、一週間に 7 日、そして毎日 24 時間、データにアクセスする必要がある典型的なデータセンターのサーバーのシナリオで行われる大量の書込み動作に耐える必要があるが、これと比べてクライアントクラスの SSD は一般的に一週間の内の 1 日だけ、8 時間ほど利用されるに過ぎず、高い性能、容量、および耐久性を持つ SSD として e-MLC が完全に適合します。

任意のアプリケーションまたは SSD の書込みの耐久性を理解するのは複雑なため、JEDEC 委員会も、SSD に含まれる NAND フラッシュが記憶媒体として信頼できなくなり、そのドライブの使用を中止する前に、SSD に書き込むことができる生のデータ量を示す「テラバイト書込み (TBW) 値」を使った耐久性測定メトリックを提案しました。

JEDEC 提案の JESD218A テスト方法と、JESD219 のエンタープライズクラス作業負荷の値を使うことで、TBW を介した SSD メーカーの耐久性の計算作業が容易になり、また任意のデータセンタに適用できる、より理解しやすい耐久性の尺度が得られます。

JESD218 と JESD219 の文書で述べられているように、アプリケーションクラスのさまざまな作業負荷は、ホストによる実際の書込みよりも高い書込み増幅率 (WAF) の影響を受け、手に負えない NAND フラッシュの摩耗を容易に引き起こし、時間の経過と共に過度の書込み動作から NAND フラッシュの BER 値が高くなり、SSD 間に広く分布する無効なページにより性能が低下します。 LSI® SandForce® DuraWrite™ テクノロジーによる Kingston E100 で利用される短時間の圧縮メカニズムは、エンタープライズクラスのアプリケーションで、全体の WAF 値を低下させ、NAND フラッシュの定格耐久性を広げます。

TBW は、エンタープライズクラス SSD とクライアントクラス SSD 間の違いについて論議する重要な要因の一つであるが、TBW は NAND フラッシュレベルの耐久性の予想モデルの一つに過ぎず、平均故障間隔 (MTBF) は、コンポーネントレベルの耐久性と、そのデバイスで利用するコンポーネントの信頼性を基本にした信頼性予想モデルを考慮すべきであります。 エンタープライズクラス SSD の予想には、SSD の予想寿命を通じてすべての NAND フラッシュメモリに印加される電圧の管理において、長期にわたる難しい作業が含まれます。

エンタープライズクラス SSD に対する S.M.A.R.T.のモニタリングとレポート機能により、現在の書込み増幅率と摩耗レベルに基づいて障害発生前に容易に照会することが可能です。 電力の喪失、物理インターフェースから発生するビットエラー、不均一な摩耗分布などの障害に関する故障発生前の事前警告も、しばしばサポートされます。

クライアントクラスの SSD は、標準的な用途または障害後に SSD をモニターする最小の S.M.A.R.T.出力の機能を持つのみです。

アプリケーションクラスと SSD の容量に応じて、NAND フラッシュメモリの増加した予備容量もオーバープロビジョニング (OP) のスペア容量として割り当てることができます。 OP の容量はユーザーには表示されないが、オペレーティングシステム (OS) は一時的な書込みバッファとしてこれにアクセスし、高いパフォーマンスを維持するために利用することができます。、また SSD の予想寿命の期間内に、障害のあるフラッシュメモリセルを交換して、SSD の信頼性と耐久性を高めることができます。

結論

エンタープライズクラス SSD とクライアントクラス SSD の間には、その NAND フラッシュメモリのプログラムと消去の耐久性から、異なるアプリケーションクラスの作業負荷を扱う複雑な管理技法まで、独特の違いがあります。

性能、信頼性および耐久性に関して、アプリケーションクラスでこれらの違いを理解することは、要求が厳しく、極めて重要なエンタープライズ環境で、破壊的なダウンタイムのリスク最小限に管理する時の効果的なツールの一つにすることが可能です。