기업용 SSD 대 고객용 SSD

이전에는 기업 서버가 HDD(하드 디스크 드라이브)에 의존하였지만 성능 병목 현상을 겪으면서 이제는 높은 데이터 처리량과 낮은 거래 대기 시간을 요구하는 기업 데이터센터 수가 증가하고 있으며, 데이터센터의 성능, 효율성, 안정성을 증가시키고 전체 운영 비용(OpEx)을 절감하기 위한 실행 가능한 스토리지 솔루션으로 SSD(Solid State Drive)를 찾고 있습니다.

SSD 클래스 간의 차이점을 이해하려면 SSD의 두 가지 핵심 구성품인 플래시 스토리지 컨트롤러(또는 줄여서 SSD 컨트롤러라 칭함)와 데이터 보관에 사용되는 비휘발성 NAND 플래시 메모리를 구별해야 합니다.

오늘날 업계에서, SSD 및 NAND 플래시 메모리 소비는 세 가지 주요 그룹으로 나뉩니다.
  • 소비자 장치(태블릿, 카메라, 휴대폰)
  • 고객 시스템(넷북, 노트북, 울트라북, AIO, 개인용 데스크탑 컴퓨터), 임베디드/산업용(게임 키오스크, 특수 설계 시스템, 디지털 옥외광고)
  • 기업용 컴퓨팅 플랫폼(HPC, 데이터센터 서버)

기업 데이터센터에 적합한 SSD 스토리지 장치를 선택하는 일은 모든 SSD와 NAND 플래시 메모리가 동등하게 제조된 것이 아니므로 수많은 SSD 공급업체와 제품 유형을 알아보고 적격 여부를 평가하는 길고 고된 과정을 거쳐야 할 수 있습니다.

SSD는 마그네틱 플래터 기반 HDD(하드 디스크 드라이브)를 보완해 쉽게 배치 가능하도록 제조되었으며, SATA(Serial ATA)와 SAS(Serial Attached SCSI) 및 (2.5인치를 포함하는)최근엔 PCIe 등 서버의 중앙 처리 장치(CPU)와 장치에서 데이터를 전송하는 통신 프로토콜 / 인터페이스 수 많은 폼 팩터로 사용됩니다.

하지만 쉽게 배치할 수 있다고 해서 선택한 모든 SSD가 장기간의 엔터프라이즈 응용 프로그램에 적합하다는 의미가 아니며, 잘못된 SSD를 선택하면 종종 SSD가 과도한 읽기로 인해 조기에 노후화되어 초기 비용 절약과 성능 이점으로 획득한 비용 효과를 무효화할 수 있고, 예상 수명보다 쓰기 성능이 훨씬 적어지거나 스토리지 어레이에서 대기 시간을 늘일 수 있어 조기 현장 교체를 해야 할 수 있습니다.

당사는 기업 및 고객용 SSD를 구별짓는 세 가지 주요 품질에 대해 논의해 엔터프라이즈 데이터센터의 스토리지를 교체하거나 추가할 때 올바른 구매를 할 수 있도록 도움을 드립니다.

성능

SSD는 SSD 컨트롤러부터 NAND 플래시 칩까지 다중 채널 아키텍처 및 병렬 액세스 사용을 통해 CPU로부터의 순차적 데이터 요청은 물론 무작위 데이터 요청에 대해 놀라운 고속 읽기 및 쓰기 성능을 제공할 수 있습니다.

기술 CAD 도면 협업과 지진데이터 분석(예:빅데이터) 혹은 금융 거래를 위한 전세계 고객 데이터 분석(예: OLTP)을 위한 접속 등 수백만 바이트의 임의 회사 데이터를 처리하는 데 관여하는 일반적인 데이터 센터 시나리오에서 저장 장치는 최소한의 대기 시간으로 액세스할 수 있어야 하며, 반응 시간 저하 없이 동시에 동일한 데이터에 액세스해야 하는 수많은 고객들이 관여할 수 있어야 합니다. 사용자는 짧은 대기 시간을 경험하게 되며, 이는 생산성을 향상시킵니다.

클라이언트 응용 프로그램은 어떠한 사용자 또는 시스템 조치에 대해 최소 및 최대 응답 시간(또는 대기 시간) 간의 높은 허용 가능 델타값을 가지고 단일 사용자 또는 응용 프로그램 액세스에만 관여하게 됩니다.

SSD를 사용하는 복잡한 스토리지 어레이(예: NAS(네트워크 연결 스토리지), DAS(직접 연결 스토리지) 또는 SAN(스토리지 영역 네트워크) 또한 미스매치된 성능에 의해 불리한 영향을 받을 수도 있고, 스토리지 어레이 대기 시간과 지속되는 성능 그리고 궁극적으로 사용자 인지에 따른 서비스 품질에 문제를 일으킬 수 있습니다.

클라이언트 SSD와 달리 Kingston 의 기업용 SSD는 액세스 최초 몇 초간의 최고 성능뿐 아니라 장기간 지속적으로 안정적인 성능을 제공하는 대규모 오버 프로비저닝 영역(OP)을 사용하는 데 최적화되어 있습니다. 특정 드라이브와 관련된 자세한 정보는 Kingston 웹 사이트의 기업용 SSD 에서 찾아보실 수 있습니다.{{Footnote.N48213}}

이는 스토리지 어레이 성능이 최고 트래픽 부하 중 조직의 예상 서비스 품질(QoS) 과 지속적으로 일관되도록 보장합니다.

신뢰성

NAND 플래시 메모리에는 이와 관련된 수많은 내재 문제가 있으며, 그 중 두 가지 가장 중요한 문제로는 반복적으로 쓰기 작업을 수행하는 동안 NAND 플래시 셀이 노후됨으로 인한 한정된 예상 수명과 자연적으로 발생하는 오류율이 있습니다.

NAND 플래시 생산 과정 중 실리콘 와이퍼에서 컷팅한 각각의 NAND 플래시 다이는 기본 비트 오류율(BER 또는 RBER)로 시험을 거쳐 특성화됩니다.

BER은 NAND 플래시에서 자연적으로 발생하는 비트 오류가 ECC(오류 수정 코드)의 이점 없이 발생하고 SSD 컨트롤러가 사용자 또는 시스템 액세스 없이 고급 ECC(일반적으로 여러 SSD 컨트롤러 제조업체에 의한 BCH, ECC, Strong ECC 또는 LDPC 오류 수정이라 칭함)를 이동 중 사용해 수정하는 속도를 정의합니다.

이러한 비트 오류를 수정하는 SSD 컨트롤러 기능은 "특정 오류 수정 방법을 적용한 후 비트 읽기별 데이터 오류 수와 동등한 데이터 오류률의 메트릭"인 UBER(수정 불가 비트 오류율)로 해석될 수 있습니다. {{Footnote.N48213}}

JESD218A:SSD(Solid State Drive) 요구사항 및 내구성 테스트 방법과 JESD219:SSD(Solid State Drive) 내구성 워크로드 문서에 따라 2010년 업계 표준 협회인 JEDEC 위원회에서 정의 및 표준화된 대로 기업용SSD는 수많은 방식으로 고객용 SSD와 다르며 보다 많은 쓰기 워크로드, 보다 거친 환경 조건과 클라이언트 SSD보다 높은 BER의 복구를 지원하는 능력을 포함하되 이에 국한되지 않습니다.{{Footnote.N52081}}{{Footnote.N52082}}

응용 프로그램 클래스워크로드(JESD219 참조)사용 활성화(전원 켜기)사용 유지(전원 끄기)UBER 요건
고객 고객 40° C
8시간/일
30° C
1년
≤10 -15
기업용 기업용 55° C
24시간/일
40° C
3개월
≤10 -16

표 1 - JESD218A: SSD(Solid State Drive) 요건 및 내구성 테스트 방법
저작권 소유 JEDEC. JEDEC의 승인을 받아 복제됨.

JEDEC에 의해 제안된 UBER 요건을 사용해 기업용과 고객용 SSD를 비교하면, 매 1,000조 비트(약 0.11페타바이트) 처리마다 1비트 오류의 고객 SSD와 비교해 기업용 SSD는 매 10,000조 비트(약 1.11페타바이트) 처리마다 1비트 오류율로 1복구 불가 비트 오류만 예측됩니다.

Kingston의 기업용 SSD는 추가 기술을 더해 다른 NAND 다이에 보관된 패리티 데이터를 사용하여 데이터의 손상된 블록을 복구시킵니다(구성된 RAID 드라이브와 유사하게 특정 블록을 복구해 다른 블록에 보관된 패리티 데이터를 재구축할 수 있음).

Kingston 기업용 SSD에 구축된 이중화 데이터 블록 복구 기술을 보완하기 위해, 정기적인 검사시점을 생성하고 CRC(Cyclic Redundancy Check) 및 ECC 오류 수정 또한 엔드 투 엔드 내부 보호 계획을 구현해 호스트에서 플래시로 그리고 다시 호스트로의 데이터 무결성을 보장합니다. 엔드 투 엔드 데이터 보호는 SSD 내부 캐시에 보관하는 동안이나 NAND 스토리지 영역에서 쓰거나 다시 읽기를 하는 경우 호스트에서 수신한 데이터에 대해 무결성을 검사하는 것을 의미합니다.

기업용 SSD가 비트 오류에 대해 향상된 ECC 보호를 제공하는 것과 유사하게, SSD도 전력 손실 감지를 위한 물리적인 회로를 포함해 SSD의 전력 스토리지 콘덴서를 관리할 수 있습니다. 하드웨어에서의 전원 장애 지원은 예상치 못한 전력 손실 중 SSD로 들어오는 전력을 모니터링하고 탄탈륨 콘덴서를 사용해 SSD로의 임시 전력을 제공해 SSD 전력이 차단되기 전 내외부적으로 발생한 미처리된 쓰기를 완료시킬 수 있습니다. 전원 장애 보호 회로는 일반적으로 손실된 데이터를 복구할 수 없는 분야에 필요합니다.

또한 전원 장애 보호는 SSD 컨트롤러 캐시 영역(예: FTranslation 레이어 테이블)에서 NAND 스토리지에 이르기까지 데이터를 자주 삭제함으로써 SSD 펌웨어 내 구현될 수 있는데, 이는 전력 손실 중 어떠한 데이터도 손상되지 않도록 보장해주는 것은 아니지만 불안정한 전력 중단으로 인한 영향을 최소화시킵니다. 펌웨어 전원 장애 보호 또한 불안정한 중단이 발생한 후에 SSD를 실행할 수 없게 되는 일이 없도록 보장합니다.

다양한 여러 상황에서, 소프트웨어 정의 스토리지나 서버 클러스터를 사용하면, 어떠한 데이터라도 여러 서버에 있는 개별적이고 독립적인 스토리지 장치로 복제됨에 따라 하드웨어 기반의 전원 장애 지원에 대한 필요성을 줄일 수 있습니다. 웹 스케일 데이터센터는 종종 소프트웨어 정의 스토리지를 사용한 전원 장애 지원이 필요하지 않으며, 사실상 RAID 서버에서 동일한 데이터에 대한 중복 사본을 보관합니다.

내구성

플래시 스토리지 장치에 있는 모든 NAND 플래시 메모리는 NAND 플래시 블록이 더 이상 저장된 데이터를 의존하지 않을 때까지 NAND 플래시 메모리 셀의 모든 프로그램 또는 지우기(P/E) 주기로 데이터 비트를 안정적으로 보관하는 기능을 저하시킵니다. 이 시점에, 기능이 저하된 블록이나 불량 블록이 사용자 주소 지정 가능 스토리지 풀에서 제거되고 논리적 주소 블록(LBA)이 NAND 플래시 스토리지 어레이상의 새로운 물리적 주소로 옮겨집니다. 새로운 스토리지 블록은 SSD의 오버 프로비저닝(OP) 스토리지의 일부인 예비 블록 풀을 사용해 불량 블록을 교체합니다.

셀이 일관적으로 프로그래밍되거나 지워지면서 BER 또한 선형으로 증가하게 되며 이것이 SSD의 예상 수명에 걸쳐 데이터를 안정적으로 보관하도록 셀 용량을 관리하기 위해 복잡한 관리 기술을 기업용 SSD 컨트롤러에 구현해야 하는 이유입니다. {{Footnote.N52083}}

해당 NAND 플래시 메모리의 P/E 내구성은 현재 리소그래피 제조 과정과 생성된 NAND 플래시 유형에 따라 상당히 달라질 수 있습니다.

NAND 플래시 메모리 유형TLCMLCSLC
아키텍처 셀당 3비트 셀당 2비트 셀당 1비트
용량 최고 용량 대용량 최저 용량
내구성(P/E) 최저 내구성 중간 내구성 최고 내구성
비용 $ $$ $$$$
근사 NAND 비트 오류율(BER) 10^4 10^7 10^9

표 2 – NAND 플래시 메모리 유형 {{Footnote.N52084}}{{Footnote.N52085}}

기업용 SSD는 고객용 SSD 작동 주기에 따라서도 매우 달라집니다. 기업용 SSD는 일반적으로 일주일 동안 하루 8시간만 온전히 사용하는 고객용 SSD와 비교해 일주일 동안 매일 24시간 내내 데이터에 액세스해야 하는 데이터센터 서버의 시나리오에서 많은 읽기 및 쓰기 작업을 견딜 수 있어야 합니다. 고객용 SSD가 20/80 작동 주기를 갖는 데 비해 기업용 SSD는 연중무휴 작동 주기를 갖습니다(컴퓨터 사용 중 20%의 활성화 시간, 80%의 유휴 모드 또는 절전 모드).

응용 프로그램이나 SSD를 사용하는 것에 대한 이해는 어려울 수 있습니다. 이에 JEDEC 위원회는 TBW(Total Bytes Written)의 가치를 활용해 내구성 측정 메트릭을 제안하고 SSD에 포함된 NAND 플래시가 불안정한 저장 매체가 되어 드라이브를 사용 중지하기 전에 기본 호스트 데이터의 양을 나타냅니다.

JEDEC에 의해 제안된 JESD218A 시험 방법 및 JESD219 기업용 워크로드를 사용하면 TBW를 통해 SSD 제조업체의 내구성 계산을 해석하고 어떠한 데이터센터에든지 적용할 수 있어 보다 쉽게 내구성 측정 업무를 할 수 있습니다.

문서 JESD218 및 JESD219에 나타난 대로 여러 응용 프로그램용 워크로드는 호스트가 제출하고 관리할 수 없는 NAND 플래시 웨어로 발전할 수 있는 실제 쓰기보다 높은 규모의 WAF(Write Amplification Factor)와 시간이 흐름에 따라 과도한 쓰기로 인해 높아진 NAND 플래시 때문에 BER, SSD 전반에 걸쳐 광범위한 분산된 유효하지 않은 페이지의 느린 성능을 겪을 수도 있습니다.

TBW가 기업 및 고객용 SSD 간의 중요한 논의 주제인 반면, TBW는 NAND 플래시급 내구성 예측 모델이며 MTBF(평균 고장 간격)는 장치에서 활용된 구성품의 안정성을 기반으로 한 구성품 등급 내구성 및 안정성 예측 모델로서 평가되어야 합니다. 기업용 SSD 구성품은 SSD 수명 기간 동안 모든 NAND 플래시 메모리 전체에 걸쳐 전압을 관리할 때 오래가면서 활발하게 작동하는 모습을 기대할 수 있습니다. 모든 기업용 SSD는 최소 MTBF 1백만 시간(즉 114년)으로 정격되어야 합니다! Kingston SSD 사양은 잘 변하지 않으며 SSD에서 보다 높은 MTBF 사양을 찾기는 힘듭니다.그리고 1백만이라는 시간은 기업용 SSD 사용을 결정하는데 충분히 중요한 이유입니다.

기업용 SSD의 S.M.A.R.T. 모니터링 및 보고를 통해 장치는 현재 쓰기 강화(WAF) 요소 및 노후 등급을 기반으로 한 수명 예측의 사전 장애에 대해 쉽게 질의할 수 있습니다. 전력 손실, 불균형 노후 분배 등 장애 상황에 대한 사전 장애 예측 경고 또한 종종 지원됩니다. Kingston 웹사이트에서 Kingston SSD Manager 유틸리티를 다운로드하여 드라이브 상태를 확인할 수 있습니다.

고객용 SSD는 표준 사용 또는 사후 장애 SSD 모니터링을 위한 S.M.A.R.T. 최소 출력을 특징으로 합니다.

SSD의 응용 프로그램 등급 및 용량에 따라 NAND 플래시 메모리의 예비 용량 또한 오버 프로비저닝(OP) 예비 용량으로 할당할 수 있습니다. OP 용량은 사용자 및 운영 체제 액세스로부터 숨김 처리되고 SSD의 예측 수명 중 보다 높은 지속 가능한 성능을 위해 임시 쓰기 버퍼로서 그리고 결함 플래시 메모리 셀 교체에 활용되어 SSD의 안정성과 내구성을 강화할 수 있습니다(많은 수의 예비 블록 활용).

결론

기업 및 고객용 SSD간에는 NAND 플래시 메모리 프로그램 및 지우기 내구성부터 여러 응용 프로그램 등급 워크로드에 적합한 복잡한 관리 기술까지 분명한 차이점이 있습니다.

성능, 안정성 및 내구성과 유지되는 응용 프로그램 등급의 이러한 차이점을 이해하는 것은 업무 처리량이 많고 종종 까다로운 업무를 진행해야 하는 기업환경에서 중단 시간의 위험을 최소화하고 위기를 관리하는데 효과적인 도구일 수 있습니다. 질문이 있으시다면, Kingston 대리점에 문의하시거나 Kingston.com에서 전문가에 문의하거나 기술 지원 채팅 기능을 활용하십시오