現在、英国のサイトにアクセスしていることに気づきました。代わりにメインサイトにアクセスしますか?

エンタープライズ SSD 対クライアント SSD

1 つは左向き、もう 1 つは右向きの 2 つの白い矢印が描かれた壁に向かい合う専門家。

高データスループットと低トランザクション遅延を必要とするデータセンターで、これまでハードディスクドライブ (HDD) のサーバーに依存していた場合、パフォーマンスのボトルネックに直面する例が増えています。そうしたデータセンターは、パフォーマンス、効率、信頼性を向上させ、全体的な運用コスト (OpEx) を削減するソリューションとして、ソリッドステートドライブ (SSD) に注目しています。

SSD クラス間の違いを明確にするため、ここでは SSD の 2 つの主要コンポーネント、フラッシュストレージコントローラー (または単に SSD コントローラー) と、データの保存に使用される不揮発性 NAND フラッシュメモリを区別します。

今日のマーケットでは、SSD と NAND フラッシュメモリの消費量は、次の 3 つの主要なグループに分けられます:
  • コンシューマーデバイス (タブレット端末、カメラ、携帯電話)
  • クライアントシステム (Netbook、ノートパソコン、Ultrabook パソコン、AIO、デスクトップパソコン)、組み込み/産業用システム (ゲーム用キオスク、専用システム、電子看板)
  • クライアントシステム (ネットブック、ノートパソコン、ウルトラブック、AIO、デスクトップ PC)、組み込み/産業用 (ゲーミングキオスク、専用システム、デジタルサイネージ)

エンタープライズコンピューティングプラットフォーム (HPC、データセンターサーバー)。 すべての SSD と NAND フラッシュメモリが同等とは限らないため、エンタープライズデータセンター向けに適切な SSD ストレージデバイスを選択するには、多様な SSD メーカーと製品タイプを学び、長い面倒な作業をかけてどれが適切かを確認しなければなりません。

SSD は、HDD の代替または補完として簡単に導入できるように製造されており、2.5 インチを含む、数種類のフォームファクタで提供されます:シリアル ATA (SATA)、シリアルアタッチド SCSI (SAS)、最近ではサーバーの中央処理装置 (CPU) との間でデータを転送する NVMe PCIe などの通信プロトコル/インターフェイスなどです

しかし容易に展開できることはすべての SSD が、それらが展開されたエンタープライズアプリケーションで長期にわたり適することを保証するわけではなく、間違った SSD を選択した場合の費用が、SSD の過度の書込み動作、予想の寿命を越えてはるかに低い持続的な書き込み性能、またはストレージアレイに追加レイテンシを引き起こし、結果的に現場での早期の交換が必要になった時に、初期のコスト削減や性能上の利点をしばしば相殺することになります。

サーバーにストレージを交換または追加する時期が来たときに、正しく購入できるよう、エンタープライズクラスとクライアントクラスの SSD を区別する 3 つの主な特徴について説明します。

パフォーマンス

SSD は、マルチチャネルのアーキテクチャを備え、SSD コントローラーから NAND フラッシュチップへ並列アクセスできるため、CPU からのシーケンシャルデータ要求とランダムデータ要求の両方に対して、非常に高い読み取り性能と書き込み性能を発揮します。

技術的な CAD 図面の共有作業、分析用の地震データ (ビッグデータなど) 、銀行取引用に世界中の顧客データへアクセス (OLTP など) など、数百万バイトのランダムな企業データを処理する一般的なデータセンターの環境では、ストレージデバイスのアクセス遅延を最小限に抑える必要があります。これにより、応答時間を増やさず、多くのクライアントが一度に同じデータにアクセスできるようになります。ユーザーエクスペリエンスは、低レイテンシでユーザーの生産性を向上できるか否かに大きく左右されます。多数の従業員が使用する場合、低レイテンシのメリットが何倍にも実感できるはずです。

クライアントアプリケーションでは、ユーザーまたはアプリケーションアクセスは1つのみです。各操作につき、ユーザーまたはシステムの最小応答時間 (またはレイテンシ) と最大応答時間の許容差は大きくとれます。

SSDを使用する複雑なストレージアレイ (ネットワーク接続ストレージ、 ダイレクトアタッチドストレージ、ストレージエリアネットワークなど) では、性能の不一致によっても悪影響を受けます。ストレージアレイのレイテンシ、連続動作時の性能、ひいてはユーザーが認識するサービス品質を大きく損なう可能性があります。

クライアント SSD とは異なり、Kingston のエンタープライズクラス SSD は、アクセス後の最初の数秒間でピーク性能が得られるよう最適化されているだけでなく、オーバープロビジョニング領域 (OP) を拡張することで、より長い期間にわたって安定したパフォーマンスを維持します。特定のドライブの詳細については、Kingston のウェブサイトの エンタープライズ SSD1 を参照してください。

ここれにより、トラフィック負荷のピーク時にも、ストレージアレイのパフォーマンスが期待される サービス品質 (QoS) 要件を満たすと保証されます。

サーバールームのラックマウント LED コンソール。

信頼性

NAND フラッシュメモリには、固有の問題がいくつかあります。最も重要な 2 つの問題は、NAND フラッシュセルへ繰り返し書き込みを行うと消耗するため寿命が有限であることと、自然発生のエラー率です。

NAND フラッシュの製造工程では、シリコンウエハーから切り出された各 NAND フラッシュダイがテストされ、生のビットエラー率 (BER または RBER) で特性評価されます。

BER は、エラー訂正コード (ECC) を使用せずに NAND フラッシュで自然に発生するビットエラーのレートを意味します。SSD コントローラーは、オンザフライの高度な ECC (SSD コントローラーメーカーごとに、BCH ECC、ストロング ECC、または LDPC エラー訂正と呼ばれます) を使用して、ユーザーまたはシステムアクセスを中断することなく、このビットエラーを修正します。
SSD コントローラーがこれらのビットエラーを修正する能力は、修正不可能なビットエラー率 (UBER) で示されます。これは、「指定されたエラー修正方法を適用した後に読み取られたビットあたりのデータエラーの数に等しい、データ破損率の指標」です。1

業界標準協会 JEDEC が 2010 年に文書 JESD218A:ソリッドステートドライブ (SSD) の要件と耐久性テスト方法および JESD219:ソリッドステートドライブ (SSD) の耐久性ワークロードで定義および標準化したように、エンタープライズクラスは、クライアントクラスの SSD とはさまざまな点で異なります。これには、クライアント SSD よりも重い書き込みワークロード、より過酷な環境条件、および高い BER からの回復率が含まれますが、これらに限定されません。23

アプリケーションクラス作業負荷(JESD219 を参照)動作時(電源オン状態)保存時(電源オフ状態)UBER 要件
クライアント クライアント 40° C 8 時間/日 30° C 1 年 ≤10 -15
エンタープライズ エンタープライズ 55° C 24 時間/日 40° C 3 ヶ月 ≤10 -16

表 1 - JESD218A: ソリッドステートドライブ (SSD) の要件と耐久性試験の方法
著作権は JEDEC に帰属します。複製には JEDEC の許可が必要です。

JEDEC が提案したエンタープライズ SSD とクライアント SSD の UBER 要件を使用すると、エンタープライズクラスの SSD では、10,000 兆ビット (約 1.11 ペタバイト) 処理につき 1 ビットエラーの割合で、回復不能なビットエラーが 1 つしか発生しないと予想されます。一方、クライアント SSD では、1000 兆ビット (約 0.11 ペタバイト) 処理につき 1 ビットエラーです。

Kingston のエンタープライズ SSD には、他の NAND ダイに保存されているパリティデータを使用して破損したデータブロックを回復できる技術も追加搭載されます (RAID ドライブのように、他のブロックに保存されているパリティデータを使用して、特定のブロックを再構築できます)。

Kingston エンタープライズ SSD に組み込まれている冗長データブロック回復技術を補完するために、定期的なチェックポイント作成、巡回冗長検査 (CRC)、ECC エラー訂正もエンドツーエンドの内部保護機構に実装されており、ホストからフラッシュを経由して送信され、ホストに戻るデータの整合性を保証します。エンドツーエンドのデータ保護とは、ホストから受信したデータが SSD の内部キャッシュに保存されるとき、および NAND ストレージ領域に書き込まれるとき、または NAND ストレージ領域から読み戻されるときに、整合性がチェックされることを意味します。

ビットエラーに対する ECC 保護を強化するエンタープライズクラスの SSD と同様に、SSD には、SSD 上の電力ストレージコンデンサを管理する、電力損失検出用の物理回路も含まれる場合があります。ハードウェアの電源障害サポートは、SSD への入力電力を監視し、予期しない電源喪失時には、コンデンサを使用して SSD 回路に一時的な電力を供給し、SSD の電源を切る前に内部または外部から指令された未処理の書き込みを完了します。電源喪失保護 (PLP) 回路は、通常、データ損失が回復できないアプリケーションで必要です。

電源喪失保護は、SSD コントローラーのキャッシュ領域 (フラッシュ変換レイヤーテーブルなど) のデータを NAND ストレージに頻繁にフラッシュする方法で、SSD ファームウェアに実装することもできます。これは、電源喪失時のデータ損失保護を保証することはできませんが、安全でない電源シャットダウンの影響を最小限に抑えます。ファームウェア電源喪失保護により、安全でないシャットダウンが発生した後でも SSD が動作不能になる可能性が低くなります。

多くの場合、ソフトウェア定義ストレージまたはサーバークラスタリングを使用すると、データが別のサーバー上の独立したストレージデバイスに複製されるため、ハードウェアベースの電源障害サポートの必要性が軽減されます。ウェブスケールのデータセンターでは、多くの場合、ソフトウェア定義ストレージを使用して電源障害サポートを省き、RAID サーバーに同じデータの冗長コピーを保存します。

耐久性

専門家が、クラウドコンピューティングなどの技術概念を示す記号が描かれた、モザイク状の六角形を重ね合わせたグラフィックに六角形を突き刺す

フラッシュストレージデバイスに含まれるすべての NAND フラッシュメモリは、NAND フラッシュメモリセルのプログラムおよび消去 (P/E) サイクルが繰り返されるに従って、データビットの格納能力が低下し、これは NAND フラッシュがそれ以上はデータを格納できない状態になるまで続き、その時点でユーザーがアドレス指定可能なストレージプールから取り外し、その論理ブロックアドレス (LBA) を NAND フラッシュストレージアレイの新しい物理アドレスに移す必要があります。新しいストレージブロックは、SSD のオーバープロビジョニング (OP) ストレージの一部である 「スペアブロック」プールを使用して、不良の一つを置き換えます。

セルが継続的にプログラムまたは消去されると、BER も比例的に増加します。このため、SSD の予想寿命にわたって確実にデータを保存できるようセルの機能を管理するには、エンタープライズ SSD コントローラーで複雑な管理手法を組み合わせる必要があります。4

所定の NAND フラッシュメモリの P/E の耐久性は、現在のリソグラフィー製造プロセスと、生産される NAND フラッシュのタイプによって大きく変化する可能性があります。

NAND フラッシュメモリのタイプQLCTLCMLCSLC
アーキテクチャ セルあたり 4 ビット 3 ビット/セル 2 ビット/セル 1 ビット/セル
容量 最高容量 より高い容量 大容量 最小容量
耐久性 (P/E) 最低耐久性 より低い耐久性 中程度の耐久性 最高の耐久性
コスト $ $$ $$$ $$$$
NAND ビットエラーレート (BER)、近似値 10^4 10^4 10^7 10^9

表 2 – NAND フラッシュメモリのタイプ56

エンタープライズ SSD は、デューティサイクルに関してもクライアント SSD とは異なります。エンタープライズクラスの SSD は、データセンターサーバーが週 24 時間にわたってデータにアクセスする必要がある一般的な環境で、大量の読み取りまたは書き込み操作に耐えられる必要があります。これを、通常 1 週間のうち 1 日 8 時間しかフル稼働しない、クライアントクラスの SSD と比較してください。

エンタープライズ SSD は 24 時間 365 日のデューティサイクルですが、クライアント SSD は 20/80 デューティサイクル (コンピュータ使用中の 20% の時間はアクティブ、80% はアイドルまたはスリープモード) です。

アプリケーションや SSD の書き込み耐久性を理解するのは複雑な場合があります。そのため、JEDEC 委員会は、SSD に含まれる NAND フラッシュが信頼性の低いストレージメディアになってドライブを廃棄する必要が出てくる前に、SSD に書き込める生のホスト データの量を示す目的で、テラバイト書き込み (TBW) 値を使用する耐久性測定指標も提案しました。

JEDEC が提案する JESD218A テスト方法と JESD219 エンタープライズクラスのワークロードを使用すれば、TBW を介して SSD メーカーの耐久性計算を解釈し、より簡単にわかりやすく耐久性を推定して、あらゆるデータセンターに適用できます。

JESD218 および JESD219 のドキュメントに記載されているように、さまざまなアプリケーションクラスのワークロードは、ホストによって送信された実際の書き込みよりも 1 桁高い、書き込み増幅率(WAF)の影響を受けることもあります。これにより、NAND フラッシュの管理不能な摩耗、時間の経過に伴う過度の書き込みによる NAND フラッシュ BER の増加、SSD 全体に無効なページが広く分散することによるパフォーマンスの低下、などの現象が発生しやすくなります。

TBW はエンタープライズクラスとクライアントクラスの SSD 間の議論において重要なトピックですが、TBW は NAND フラッシュレベルの耐久性予測モデルにすぎません。平均故障間隔 (MTBF) は、デバイスで使用されるコンポーネントの信頼性に基づくコンポーネントレベルの耐久性と信頼性の予測モデルとしてとらえる必要があります。エンタープライズクラスの SSD コンポーネントに期待される性能の1つに、SSD の寿命全体にわたって、すべての NAND フラッシュ メモリで、より長期間かつ徹底的な電圧管理があります。すべてのエンタープライズ SSD は、少なくとも 200 万時間の MTBF 定格でなければなりません。これは 230 年以上になります。Kingston は SSD の仕様を非常に保守的に設定しており、SSD の MTBF 仕様がさらに高いことも珍しくありません。エンタープライズ SSD であれば、200 万時間は最低要求を余裕で満足させられる点にご注意ください。

エンタープライズクラスの SSD で S.M.A.R.T. 監視およびレポートを実施すれば、現在の書き込み増幅 (WAF) 率と摩耗レベルに基づいて、故障が起こるまでのデバイスの寿命を簡単に予測できます。電源喪失、物理インターフェイスから発生するビット エラー、または摩耗の不均一な分布などの障害イベントに対する障害前予測警告も、多くの場合サポートされています。Kingston SSD マネージャーユーティリティは Kingston のウェブサイトからダウンロードでき、ドライブの状態を表示するために使用できます。

クライアントクラスの SSD には、標準使用時または障害発生後の SSD を監視するための最小限の S.M.A.R.T. 出力しか備わっていない場合があります。

アプリケーションクラスと SSD の容量に応じて、NAND フラッシュメモリの予備容量を増やして、オーバープロビジョニング (OP) スペア容量として割り当てることもできます。OP 容量は、ユーザーとオペレーティングシステムからのアクセスからは隠されています。より高い持続パフォーマンスのための一時的な書き込みバッファとして利用したり、SSD の耐用年数中に故障したフラッシュメモリセルの交換品として利用したりして、SSD の信頼性と耐久性を高めることができます (スペアブロックの数も増やします)。

結論

エンタープライズクラスとクライアントクラスの SSD には、NAND フラッシュメモリのプログラムと消去の耐久性から、さまざまなアプリケーションクラスのワークロードに合わせた複雑な管理手法まで、明確な違いがあります。

こうしたアプリケーションクラスごとの違いを理解することは、要求が厳しく、多くの場合ミッション クリティカルなエンタープライズ環境で、中断を伴う休止のリスクを最小限に抑え、管理するための効果的なツールとなります。

さらに質問がある場合、または Kingston のエンタープライズ SSD について詳しく知りたい場合は、Kingston の担当者、当社の Ask An Expert(専門家に照会)チーム、またはテクニカルサポートチャットにお問い合わせください。

関連動画

関連記事