エンタープライズ SSD 対クライアント SSD

多くのエンタープライズデータセンターは高い処理能力と低いトランザクションレイテンシを必要とし、これまではサーバーのハードディスクドライブ (HDD) に依存していましたが、現在ではパフォーマンスのボトルネックに直面し、そのデータセンターの性能、効率、信頼性、および全体的な運用コスト (OpEx) を改善するために実行可能なストレージソリューションとして、ソリッドステートドライブ (SSD) を探しています。

まず SSD のクラス間の違いを理解するには、データの保存に使われる SSD の 2 つの主要コンポーネントである「フラッシュストレージコントローラ」と「不揮発性の NAND フラッシュメモリ」を区別する必要があります。

今日のマーケットでは、SSD と NAND フラッシュメモリの消費量は、次の 3 つの主要なグループに分けられます:
  • コンシューマーデバイス (タブレット端末、カメラ、携帯電話)
  • クライアントシステム (Netbook、ノートパソコン、Ultrabook パソコン、AIO、デスクトップパソコン)、組み込み/産業用システム (ゲーム用キオスク、専用システム、電子看板)
  • エンタープライズコンピュータ・プラットフォーム (HPC、データセンタサーバー)

エンタープライズデータセンター向けに正しい SSD ストレージデバイスを選択するということは、すべての SSD と NAND フラッシュメモリが実際には等しく造られているわけではないため、多くの異なる SSD ベンダーや製品のタイプを調べて、検証する長く困難なプロセスになる可能性があります。

SSD は、回転式の磁気プラッターベースのハードディスクドライブ (HDD) の代替品または補完品として容易に展開でき、またサーバーの CPU (中央演算処理装置) に対してデータの送受信を行うために、2.5 インチを含むさまざまなフォームファクタ、SATA (Serial ATA) および SAS (Serial Attached SCSI) を含む通信プロトコル/インターフェースを容易に展開できるように製造されています。

しかし容易に展開できることはすべての SSD が、それらが展開されたエンタープライズアプリケーションで長期にわたり適することを保証するわけではなく、間違った SSD を選択した場合の費用が、SSD の過度の書込み動作、予想の寿命を越えてはるかに低い持続的な書き込み性能、またはストレージアレイに追加レイテンシを引き起こし、結果的に現場での早期の交換が必要になった時に、初期のコスト削減や性能上の利点をしばしば相殺することになります。

エンタープライズデータセンタでストレージの交換または増加が必要になった時に、購入のための正しい判断ができるように支援するために、エンタープライズとクライアントクラスの SSD を区別する 3 つの主な資質について議論します。

性能

SSD は、マルチチャンネルアーキテクチャの使用、および SSD のコントローラから NAND フラッシュチップへのパラレルアクセス方式の使用により、CPU からのシーケンシャルおよびランダムデータ要求に対して、非常に速い読取りおよび書込み性能を発揮できます。

技術的な CAD 図面、分析用の地震データ (大規模データなど)、あるいは銀行取引のための世界的な顧客データのアクセス (OLTP など) を含む何百万バイトものランダム企業データを扱う典型的なデータセンタにおけるシナリオの場合、ストレージデバイスは待ち時間を最小限に抑えながらアクセス可能でなければならず、また応答時間を遅らせずに多数のクライアントが同じデータに同時にアクセス可能でなければなりません。ユーザーエクスペリエンスは、ユーザーの生産性を高める低レイテンシを有することに基づいています。

1 つのクライアントアプリケーションは、どんなユーザーやシステム動作の場合でも、最小から最大の応答時間 (またはレイテンシ) の範囲内で、より高い許容デルタ値で、一人のユーザーまたは 1 つのアプリケーションのアクセスにのみ対応します。

また SSD を使った複雑なストレージアレイ (ネットワーク接続ストレージ、ダイレクト接続ストレージ、ストレージエリアネットワークなど) は、性能の不一致によって大きな影響を受け、ストレージアレイの待ち時間の増加、性能の低下、そして最終的に、ユーザーによって知覚されるサービス品質の低下を引き起こす可能性があります。

クライアント SSD と異なり、Kingston のエンタープライズクラス SSD は、アクセスの最初の数秒間のピーク性能だけでなく、より大きなオーバープロビジョニング領域 (OP) を使って、さらに長時間にわたり、持続的に高度で安定した状態を保つように最適化されています。特定のデバイスの詳しい内容は、Kingston の以下の Web サイトで見ることができます: エンタープライズ SSD.{{Footnote.N48213}}

これにより、トラフィックのピーク負荷時でも、組織が期待する サービス品質 (Qos)を維持するストレージアレイの性能が保証されます。

信頼性

を維持するストレージアレイの性能が保証されます。

これらのビットエラーを訂正する SSD コントローラの能力は、「訂正不可能ビットエラーレート (UBER)」と解釈することができますが、これは「指定された任意のエラー訂正方法を適用した後に読み出したビット当りのデータエラー数に等しいデータ破損率のメトリック値」になります。{{Footnote.N48213}}

2010 年に業界標準協会の JEDEC Committee が JESD218A: Solid State Drive (SSD) Requirements (SSD の要件)、および Endurance Test Method および JESD219:Solid State Drive (SSD) Endurance Workloads (SSD の耐久性作業負荷) により定義および標準化したように、エンタープライズクラスはクライアントクラスの SSD とは多くの方法が異なっているが、それは書込みの作業負荷に対応する能力に限らず、更に極端な環境条件や、クライアント SSD よりも高い BER からの回復が含まれます。{{Footnote.N52081}}{{Footnote.N52082}}

アプリケーションクラス作業負荷(JESD219 を参照)動作時(電源オン状態)保存時(電源オフ状態)UBER 要件
クライアント クライアント 40° C 8 時間/日 30° C 1 年 ≤10 -15
エンタープライズ エンタープライズ 55° C 24 時間/日 40° C 3 ヶ月 ≤10 -16

表 1 - JESD218A: ソリッドステートドライブ (SSD) の要件と耐久性試験の方法
著作権は JEDEC に帰属します。複製には JEDEC の許可が必要です。

エンタープライズ対クライアントの SSD の比較に関する JEDEC 提案の UBER 要件を用いた場合、1 兆ビット (~0.11 ペタバイト) の処理当り 1 ビットエラーが発生するクライアント SSD に対し、エンタープライズクラス SSD は 10 兆ビット (~1.11 ペタバイト) 当り 1 ビットエラーの発生が予想されます。

また Kingston のエンタープライズ SSD は、他の NAND ダイに保存したパリティデータを使用して、データの破損ブロックを回復可能にする新たなテクノロジーを追加します (これは RAID 構成のドライブと類似しており、これにより他のブロックに保存したパリティデータを用いて再構築可能な特定のブロックの回復が可能になります)。

Kingston のエンタープライズ SSD に組み込まれた冗長なデータブロックの回復テクノロジーを補完するために、定期的なチェックポイントの作成、CRC (巡回冗長検査)、および ECC エラー訂正もエンドツーエンドの内部保護方式に組み込まれ、フラッシュを経由したホストからのデータや、ホストへの返送の完全性が保証されます。エンドツーエンドのデータ保護は、ホストから受け取ったデータの整合性が SSD の内部キャッシュへの保存時にチェックされ、また NAND ストレージエリアに対する書き込みまたは読み出し時にチェックされます。

エンタープライズクラス SSD が持つビットエラーに対する高度な ECC 保護機能と同じように、SSD にも、(SSD の蓄電コンデンサを管理する) 電力喪失検出のための物理的な回路が含まれています。ハードウェアの「電源喪失サポート」機能は、SSD への供給電源を監視し、突然の停電時にはタンタル・コンデンサを使用して SSD 回路に一時的な電力を供給して、SSD の電源が落ちる前に内部または外部の未処理の書き込みを完了します。通常、データの損失を回復できないようなアプリケーションの場合、停電保護回路が必要です。

また停電保護機能は、NAND ストレージに対する SSD コントローラのキャッシュ領域 (FTranslation Layer テーブルなど) の中のデータを頻繁にフラッシングして、SSD ファームウェア内に実装できますが、これは停電時にデータ喪失が起こらないことを保証するものではなく、危険な電源遮断の影響を最小限にするものです。また「ファームウェアの電源喪失保護」機能は、危険な電源遮断の発生後に、SSD が動作不良にならないようにします。

多くの場合、「ソフトウェアで定義されたストレージ」またはサーバーのクラスタ構成を用いた場合、各データは、異なるサーバーまたはサーバー群の個別の独立したストレージデバイスに複製されるため、ハードウェアベースの「電源障害の保護機能」の必要性は少なくなります。Web スケールのデータセンタは、「ソフトウェアで定義されたストレージ」を使用して「電源障害」のサポートを行い、実際には、RAID 構成のサーバーで同じデータの冗長コピーを保存しています。

耐久性

フラッシュストレージデバイスに含まれるすべての NAND フラッシュメモリは、NAND フラッシュメモリセルのプログラムおよび消去 (P/E) サイクルが繰り返されるに従って、データビットの格納能力が低下し、これは NAND フラッシュがそれ以上はデータを格納できない状態になるまで続き、その時点でユーザーがアドレス指定可能なストレージプールから取り外し、その論理ブロックアドレス (LBA) を NAND フラッシュストレージアレイの新しい物理アドレスに移す必要があります。新しいストレージブロックは、SSD のオーバープロビジョニング (OP) ストレージの一部である 「スペアブロック」プールを使用して、不良の一つを置き換えます。

メモリセルではプログラムと消去が常に行われるため、BER の値も直線的に増加します。そのため、SSD の予想寿命を通じてデータを格納するメモリセルの能力の信頼性を管理するために、複雑な管理技法の組合せをエンタープライズ SSD コントローラ上で行わねばなりません。{{Footnote.N52083}}

所定の NAND フラッシュメモリの P/E の耐久性は、現在のリソグラフィー製造プロセスと、生産される NAND フラッシュのタイプによって大きく変化する可能性があります。

NAND フラッシュメモリのタイプTLCMLCSLC
アーキテクチャ 3 ビット/セル 2 ビット/セル 1 ビット/セル
容量 最大容量 大容量 最小容量
耐久性 (P/E) 低い耐久性 中程度の耐久性 最高の耐久性
コスト $ $$ $$$$
NAND ビットエラーレート (BER)、近似値 10^4 10^7 10^9

表 2 – NAND フラッシュメモリのタイプ{{Footnote.N52084}}{{Footnote.N52085}}

またエンタープライズ SSD は、デューティサイクル時にクライアント SSD から変化します。エンタープライズクラスの SSD は、一週間に 7 日、そして毎日 24 時間、データにアクセスする必要がある典型的なデータセンタのサーバーのシナリオで行われる大量の書込み動作に耐える必要がありますが、これに比べてクライアントクラスの SSD は一般的に一週間の内の 1 日だけ、8 時間ほど利用されるに過ぎません。20/80 デューティサイクル (コンピュータの使用時間は 20% の時間がアクティブ状態で、80% はアイドリングまたはスリープ状態) のクライアント SSD と比較して、エンタープライズ SSD は 24x7 のデューティサイクルを持ちます。

任意のアプリケーションまたは SSD の書込みの耐久性を理解するのは複雑なため、JEDEC 委員会も、SSD に含まれる NAND フラッシュが記憶媒体として信頼できなくなり、そのドライブの使用を中止する前に、SSD に書き込むことができる生のホストデータ量を示す「テラバイト書込み (TBW) 値」を使った耐久性測定メトリックを提案しました。

JEDEC 提案の JESD218A テスト方法と、JESD219 のエンタープライズクラス作業負荷の値を使うことで、TBW を介した SSD メーカーの耐久性の計算作業が容易になり、また任意のデータセンタに適用できる、より理解しやすい耐久性の尺度が得られます。

JESD218 と JESD219 の文書で述べられているように、アプリケーションクラスのさまざまな作業負荷は、ホストによる実際の書込みよりも高い「書込み増幅率 (WAF)」 の影響を受け、手に負えない NAND フラッシュの摩耗を容易に引き起こし、時間の経過と共に過度の書込み動作から NAND フラッシュの BER 値が高くなり、SSD 間に広く分布する無効なページにより性能が低下します。

TBW は、エンタープライズクラス SSD とクライアントクラス SSD 間の違いについて論議する重要な要因の一つであるが、TBW は NAND フラッシュレベルの耐久性の予想モデルの一つに過ぎず、平均故障間隔 (MTBF) は、コンポーネントレベルの耐久性と、そのデバイスで利用するコンポーネントの信頼性を基本にした信頼性予想モデルを考慮すべきであります。エンタープライズクラス SSD の予想には、SSD の予想寿命を通じてすべての NAND フラッシュメモリに印加される電圧の管理において、長期にわたる難しい作業が含まれます。すべてのエンタープライズ SSD は、少なくとも 100 万時間の MTBF を持つ必要がありますが、これは言い換えると 114 年以上になります!Kingston の仕様では SSD は非常に保守的で、SSD の更に高い MTBF の仕様を参照することは珍しいことではありません。この 100 万時間という数字は、エンタープライズ SSD にとっては十分以上の値であることに注意しなければなりません。

エンタープライズクラス SSD に対する S.M.A.R.T.のモニタリングとレポート機能により、現在の書込み増幅率 (WAF) と摩耗レベルに基づいて障害発生前に容易に照会することが可能です。電力の喪失、物理インターフェースから発生するビットエラー、不均一な摩耗分布などの障害に関する故障発生前の事前警告も、しばしばサポートされます。Kingston SSD マネージャ・ユーティリティは、Kingston Web サイトからダウンロード可能で、ドライブ状態の確認に使用できます。

クライアントクラスの SSD は、標準的な用途または障害後に SSD をモニターする最小の S.M.A.R.T.出力の機能を持つのみです。

アプリケーションクラスと SSD の容量に応じて、NAND フラッシュメモリの増加した予備容量もオーバープロビジョニング (OP) のスペア容量として割り当てることができます。OP の容量はユーザーには表示されませんが、オペレーティングシステム (OS) は一時的な書込みバッファとしてこれにアクセスし、高いパフォーマンスを維持するために利用することができます。また (多数のスペアブロックを持つ) SSD の予想寿命の期間内に、障害のあるフラッシュメモリセルを交換して、SSD の信頼性と耐久性を高めることができます。

結論

エンタープライズクラス SSD とクライアントクラス SSD の間には、その NAND フラッシュメモリのプログラムと消去の耐久性から、異なるアプリケーションクラスの作業負荷を扱う複雑な管理技法まで、独特の違いがあります。

性能、信頼性および耐久性に関して、アプリケーションクラスでこれらの違いを理解することは、要求が厳しく、極めて重要なエンタープライズ環境で、破壊的なダウンタイムのリスク最小限に管理する時の効果的なツールの一つにすることが可能です。その他の疑問点については、Kingston の担当者に連絡するか、または Kingston.com の "Ask An Expert" または "Tech Support Chat features"をご覧ください。