신뢰성
NAND 플래시 메모리에는 이와 관련된 수많은 내재 문제가 있으며, 그 중 두 가지 가장 중요한 문제로는 반복적으로 쓰기 작업을 수행하는 동안 NAND 플래시 셀이 노후됨으로 인한 한정된 예상 수명과 자연적으로 발생하는 오류율이 있습니다.
NAND 플래시 생산 과정 중 실리콘 와이퍼에서 컷팅한 각각의 NAND 플래시 다이는 기본 비트 오류율(BER 또는 RBER)로 시험을 거쳐 특성화됩니다.
BER은 NAND 플래시에서 자연적으로 발생하는 비트 오류가 ECC(오류 수정 코드)의 이점 없이 발생하고 SSD 컨트롤러가 사용자 또는 시스템 액세스 없이 고급 ECC(일반적으로 여러 SSD 컨트롤러 제조업체에 의한 BCH, ECC, Strong ECC 또는 LDPC 오류 수정이라 칭함)를 이동 중 사용해 수정하는 속도를 정의합니다.
이러한 비트 오류를 수정하는 SSD 컨트롤러 기능은 "특정 오류 수정 방법을 적용한 후 비트 읽기별 데이터 오류 수와 동등한 데이터 오류률의 메트릭"인 UBER(수정 불가 비트 오류율)로 해석될 수 있습니다. {{Footnote.N48213}}
JESD218A:SSD(Solid State Drive) 요구사항 및 내구성 테스트 방법과 JESD219:SSD(Solid State Drive) 내구성 워크로드 문서에 따라 2010년 업계 표준 협회인 JEDEC 위원회에서 정의 및 표준화된 대로 기업용SSD는 수많은 방식으로 고객용 SSD와 다르며 보다 많은 쓰기 워크로드, 보다 거친 환경 조건과 클라이언트 SSD보다 높은 BER의 복구를 지원하는 능력을 포함하되 이에 국한되지 않습니다.{{Footnote.N52081}}{{Footnote.N52082}}
응용 프로그램 클래스 | 워크로드(JESD219 참조) | 사용 활성화(전원 켜기) | 사용 유지(전원 끄기) | UBER 요건 |
고객 |
고객 |
40° C 8시간/일 |
30° C 1년 |
≤10 -15 |
기업용 |
기업용 |
55° C 24시간/일 |
40° C 3개월 |
≤10 -16 |
표 1 - JESD218A: SSD(Solid State Drive) 요건 및 내구성 테스트 방법
저작권 소유 JEDEC. JEDEC의 승인을 받아 복제됨.
JEDEC에 의해 제안된 UBER 요건을 사용해 기업용과 고객용 SSD를 비교하면, 매 1,000조 비트(약 0.11페타바이트) 처리마다 1비트 오류의 고객 SSD와 비교해 기업용 SSD는 매 10,000조 비트(약 1.11페타바이트) 처리마다 1비트 오류율로 1복구 불가 비트 오류만 예측됩니다.
Kingston의 기업용 SSD는 추가 기술을 더해 다른 NAND 다이에 보관된 패리티 데이터를 사용하여 데이터의 손상된 블록을 복구시킵니다(구성된 RAID 드라이브와 유사하게 특정 블록을 복구해 다른 블록에 보관된 패리티 데이터를 재구축할 수 있음).
Kingston 기업용 SSD에 구축된 이중화 데이터 블록 복구 기술을 보완하기 위해, 정기적인 검사시점을 생성하고 CRC(Cyclic Redundancy Check) 및 ECC 오류 수정 또한 엔드 투 엔드 내부 보호 계획을 구현해 호스트에서 플래시로 그리고 다시 호스트로의 데이터 무결성을 보장합니다. 엔드 투 엔드 데이터 보호는 SSD 내부 캐시에 보관하는 동안이나 NAND 스토리지 영역에서 쓰거나 다시 읽기를 하는 경우 호스트에서 수신한 데이터에 대해 무결성을 검사하는 것을 의미합니다.
기업용 SSD가 비트 오류에 대해 향상된 ECC 보호를 제공하는 것과 유사하게, SSD도 전력 손실 감지를 위한 물리적인 회로를 포함해 SSD의 전력 스토리지 콘덴서를 관리할 수 있습니다. 하드웨어에서의 전원 장애 지원은 예상치 못한 전력 손실 중 SSD로 들어오는 전력을 모니터링하고 탄탈륨 콘덴서를 사용해 SSD로의 임시 전력을 제공해 SSD 전력이 차단되기 전 내외부적으로 발생한 미처리된 쓰기를 완료시킬 수 있습니다. 전원 장애 보호 회로는 일반적으로 손실된 데이터를 복구할 수 없는 분야에 필요합니다.
또한 전원 장애 보호는 SSD 컨트롤러 캐시 영역(예: FTranslation 레이어 테이블)에서 NAND 스토리지에 이르기까지 데이터를 자주 삭제함으로써 SSD 펌웨어 내 구현될 수 있는데, 이는 전력 손실 중 어떠한 데이터도 손상되지 않도록 보장해주는 것은 아니지만 불안정한 전력 중단으로 인한 영향을 최소화시킵니다. 펌웨어 전원 장애 보호 또한 불안정한 중단이 발생한 후에 SSD를 실행할 수 없게 되는 일이 없도록 보장합니다.
다양한 여러 상황에서, 소프트웨어 정의 스토리지나 서버 클러스터를 사용하면, 어떠한 데이터라도 여러 서버에 있는 개별적이고 독립적인 스토리지 장치로 복제됨에 따라 하드웨어 기반의 전원 장애 지원에 대한 필요성을 줄일 수 있습니다. 웹 스케일 데이터센터는 종종 소프트웨어 정의 스토리지를 사용한 전원 장애 지원이 필요하지 않으며, 사실상 RAID 서버에서 동일한 데이터에 대한 중복 사본을 보관합니다.