Redundant Array of Inexpensive/Independent Disk

 


저장장치 여러 개를 묶어 고용량·고성능 저장 장치 한 개와 같은 효과를 얻기 위해 개발된 기법이다.

초기에는 업그레이드 후 '폐기하기엔 아깝고, 그렇다고 단독으로 쓰기에는 성능이 부족한'(Inexpensive) 저장장치를 재활용할 목적으로 사용하였다. 저장장치 기술이 발전한 현재는 Inexpensive보다는 Independent로 해석하는 추세.

RAID의 주 사용 목적은 크게 무정지 구현(안정성)과 고성능 구현으로 구분된다. 무정지 구현을 극도로 추구하면 RAID 1, 고성능 구현을 극도로 추구하면 RAID 0이 되며, RAID 5, 6은 둘 사이에서 적당히 타협한 형태.

 

종류

동작 방식에 따라 Level 0 ~ 6으로 분류한다. 주로 사용되는 것은 0, 1, 5, 6이며 컨트롤러 개발사에 따라 다른 방식을 제공하기도 한다.

 

RAID 0

Striping.

여러 개의 멤버 하드디스크를 병렬로 배치하여 거대한 하나의 디스크처럼 사용한다. 데이터 입출력이 각 멤버 디스크에 공평하게 분배되며, 디스크의 수가 N개라면 입출력 속도 및 저장 공간은 이론상 N배가 된다. 다만 멤버 디스크 중 하나만 손상 또는 분실되어도 전체 데이터가 파손되며, 오류검출 기능이 없어 멤버 디스크를 늘릴수록 안정성이 떨어지는 문제가 있다.

이미지 프로세싱, 데이터베이스 캐시 등 빠른 입출력 성능을 필요로 하며, 데이터 손실이 문제되지 않는 환경에서 쓰일 수 있지만, 상용 환경에서는 위험성 문제로 RAID 5나 6을 이용하는 경우가 많다고 한다.

이 때문에 고성능을 경험하고 싶은 파워유저가 구축해 보는 경우가 많다. SSD를 단독 사용하기에는 용량이 많이 부족하니, 여러 개를 묶어서 초고속 저장 장치를 구축하는 것. 이런 점을 간파하고 컴퓨터 제조 업체에서 공식적으로 RAID0 기술을 구현한 최초의 사례로는 소니의 노트북 브랜드인 VAIO의 프리미엄 모델인 Z 시리즈가 최초[1]인데, 노트북 업계 최초로 SSD로 RAID0 기술을 구현했으며, 앞으로도 소니는 자사의 프리미엄 노트북 라인업에 이 RAID0 기술을 구현한 SSD를 계속 탑재 할 전망이다.[2]하지만 소니는 2014년 현재 노트북 사업부를 매각했다(...)

 




 

VAIO
Z시리즈의 홍보영상에서 RAID0(0^4) SSD와 5400rpm 2.5인치 하드디스크를 비교대상으로 놓고 1GB 용량의 파일을 복사하는데 걸리는 시간을 측정하는 장면이 있는데 RAID0 SSD의 경우 1GB 파일을 복사하는데 걸리는 시간이 겨우 4초에 불과할 정도로 엄청난 속도다. 사실 VAIO Z에 장착된 SSD의 경우 일반적인 공식 SSD 규격이 아닌 소니의 자체적인 소형화 규격으로 재설계하였기 때문에 그 비좁은 메인보드 공간 안에 탑재 될 수 있었던 것이다.흠좀무" id="rfn3" href="https://mirror.enha.kr/wiki/RAID#fn3">[3] 국내에서 판매되었던 VPCZ1의 일반형 모델의 경우 용량이 128GB로서 64GB SSD 두 개를 RAID0로 묶은 것이며, 고급형 모델의 경우 용량이 256GB로서 64GB SSD 4개를 RAID0로 묶은 형태다. 게다가 일본 내수용 주문제작 방식의 오너메이드의 모델의 경우, 현재 RAID0로 128GB SSD 4개를 묶은 512GB 용량과, 256GB SSD 4개를 묶은 1TB 용량까지도 선택이 가능하다. 물론 이들을 선택하면 견적이 어마어마하기에 이를 선택하는 사람은 실제로 얼마나 될 지 의문이지만...
삼성의 SSD 24개를 한 개의 볼륨으로 묶기 같은 것도 할 수 있으며, 2.0GB/s(Gb가 아니다!)의 속도가 나오는 6TB볼륨을 구축한 삼성 SSD 광고 영상도 있다.
여담이지만 2009년에 찍힌 저 광고영상의 속도를 달성하려면 2013년 4월 기준으로 삼성 840Pro 256G 4~6개만으로도 동등하거나 더 빠른 속도를 낼 수 있다.

RAID 0의 경우 Stripe size를 지정할 수 있다. 컨트롤러에 따라 다르지만 Intel RST에서는 4~128KB를 지원한다. 이 Stripe size는 기록시 한 디스크에 한번에 기록할 데이터 크기이다. 즉, Stripe size가 4KB이고, 멤버 디스크가 4개라면 16KB짜리 파일을 기록할때 디스크당 4KB씩 돌아가면서 한 번씩 기록한다. Stripe size가 128KB이고, 멤버 디스크가 2개, 기록할 파일이 2MB(2048KB)라면, 첫 번째 디스크에 128KB, 두 번째 디스크에 128KB를 순차적으로 기록하는 것을 디스크당 8번씩 반복한다. SSD에서는 128KB 이상이 추천되며, 하드디스크라면 32KB정도가 추천된다. 하지만 사용자의 환경에 따라 최적의 성능을 내는 Stripe size가 다르므로 하나하나 적용해 보는것이 좋다.

 

RAID 1

Mirroring.

각 멤버 디스크에 같은 데이터를 중복 기록한다. 멤버 디스크 중 하나만 살아남으면 데이터는 보존되며 복원도 1:1 복사로 매우 간단하기 때문에, 서버 또는 연구목적 PC에서 혹시 모를 데이터 손실에 대비하기 위해 사용한다.

멤버 디스크를 늘리더라도 저장 공간은 증가하지 않으며, 대신 안정성이 크게 증가하게 된다. 상용 환경에서는 디스크를 2개 이상 쓰는 경우가 드물지만, 극한 환경에서는 3개 이상의 멤버 디스크를 사용하기도 한다. 데이터 가치가 하드디스크 가격이 껌값으로 여겨질 정도로 높은 경우 사용한다. 읽기 성능은 약간 향상되지만, 쓰기 성능은 약간 떨어진다.

데이터 복구 서비스를 쓰면 되지 않냐고 반박할 수도 있지만,
복구에 장시간이 소모됨 데이터를 100% 복구하기 어려움 극비 데이터의 유출 가능성등의 이유로 복구 서비스에만 의존할 수는 없기 때문에 RAID 1을 쓰는 것이다. 아예 데이터를 중복 저장해서 하드가 망가졌을 때 백업 등 최소한의 대처할 시간을 버는 것. 그런데 한가지 주의할 점이 있는데 RAID 1 사용 중 HDD Fail 발생시 최우선 순위는 하드 교체가 아니고 데이터 백업이다. RAID 1을 구성할 때에는 같은 제조회사의 같은 모델 같은 주차 생산품을 쓰게 되는데(그게 권장되기도 하고) 이 말은 한쪽이 맛간 상태면 다른 쪽도 맛가기 일보직전 상황일 확률이 크다는 얘기가 된다. 이 상태에서 디스크만 교체하면 RAID 컨트롤러가 리빌드(Rebuild)작업을 하면서 남은 한쪽의 하드디스크에 큰 부담을 주게 되고 결국 리빌드 중간에 남은 하나의 하드마저 뻗어버리는 사태를 당하게 된다.

 

RAID 2, 3, 4

Fault Tolerance using Dedicated Parity Bit.

오류정정부호(ECC)를 기록하는 전용의 하드디스크를 이용해서 안정성을 확보한다. RAID 2는 비트 단위에 Hamming code를 적용하며, RAID 3, 4는 각각 바이트, 워드 단위로 패리티를 저장한다. 하나의 멤버 디스크가 고장나도 ECC를 이용하여 정상적으로 작동할 수 있지만, 추가적인 연산이 필요하여 입출력 속도가 매우 떨어진다.

모든 I/O에서 ECC 계산이 필요하므로 입출력 병목 현상이 발생하며, ECC 기록용으로 쓰이는 디스크의 수명이 다른 디스크들에 비해 짧아지는 문제가 있어 현재는 사용하지 않는다.

 

RAID 5

Fault Tolerance using Distributed Parity Bit.

기본 원리는 RAID 4와 비슷하나, 패리티를 한 디스크에 밀어넣지 않고 각 멤버 디스크에 돌아가면서 순환적으로 저장하여 입출력 병목현상을 해결한다. N개의 디스크를 사용하면 (N-1)배의 저장 공간을 사용할 수 있다. RAID 4처럼 하나의 멤버 디스크 고장에는 견딜 수 있지만 디스크가 두 개 이상 고장나면 데이터가 모두 손실된다.

매번 쓰기 작업 때마다 패리티 연산 과정이 추가되어, 성능을 보장하려면 고가의 패리티 연산 전용 프로세서와 메모리를 사용해야 한다. 멤버 디스크도 최소 3개 이상 사용해야 하므로 초기 구축비용이 비싸다는 단점이 있다. 다만 멤버 디스크의 수가 5개 이하인 중소규모 파일서버라면 소프트웨어 RAID도 괜찮다. 부팅용 하드가 별도로 필요하다는 게(그리고 부팅하드가 뻑나면 RAID까지 풀려서 복구하기 짜증난다는) 애로점이긴 하지만...

읽기 작업은 전체 디스크에 분산되어 속도가 향상되지만, 쓰기 작업은 적어도 둘 이상의 디스크(데이터+패리티)에서 진행되어야 하므로 성능이 약간 떨어진다.

데이터베이스 서버 등 큰 용량과 무정지 복구 기능을 동시에 필요로 하는 환경에서 주로 쓰인다.

 

RAID 6

Fault Tolerance using Distributed Double Parity Bit.

RAID 5와 원리는 같으며, 서로 다른 방식의 패리티 2개를 동시에 사용한다. 성능과 용량을 희생해서 안정성을 높인 셈. N개의 디스크를 사용하면 (N-2)배의 저장 공간을 사용할 수 있다.

스토리지 서버와 같이 디스크를 빼곡히 꽂는(기본 10개 단위) 환경에서 RAID 5는 유지보수가 어려우며[4], 안정성을 높이기 위한 목적으로 주로 사용된다. 컨트롤러가 RAID 5보다 더 비싸고, 멤버 디스

 

크도 기본 4개 이상 확보해야 하므로 초기 구축비용이 비싸다.

하드디스크를 대단위로 물려야 하고, 데이터 안정성의 필요성이 RAID 5보다 높아야 하는 상황에서 쓰인다.

 

그 외의 RAID Level

 

JBOD (Just Bunch of Disks)

그냥 여러 디스크를 하나의 디스크처럼 보이게 수평적으로 섹터를 이어붙인 개념이다. RAID0처럼 멤버 디스크 중 하나만 깨져도 모든 데이터가 손실되지는 않고 고장난 디스크에 해당하는 부분만 날아간다. 때문에 로그 기록같이 부분적으로 데이터가 파손되어도 괜찮은 환경에서 가끔 사용된다.[5]


디스크를 Spanning한 환경이기 때문에 다중 사용자 환경에서 분산도가 높은 데이터를 다루는 경우 RAID0에 근접하는 성능을 얻을 수도 있으나... 현실은 20%의 핵심 데이터에 모든 액세스가 집중되므로 현실은 시궁창... 같은 환경에서 RAID0은 20%의 핫존이 모든 디스크에 고루 분포돼있지만 JBOD는 한두개의 디스크에 몰려있다.

RAID는 모든 멤버 디스크의 성능(저장 공간이나 I/O 성능 등)이 같은 환경을 전제하기 때문에 멤버 디스크 성능에 차이가 있으면, 가장 낮은 성능으로 하향 평준화된다. (예를 들어 100GB짜리와 74GB짜리 하드디스크를 RAID 0으로 묶으면 74 × 2인 148GB만 쓸 수 있고, 26GB는 버려진다) 반면 JBOD는 멤버 디스크의 성능이 서로 달라도 무방하므로 어떻게 돈지랄을 해도 저장해야 할 데이터 크기만큼의 하드를 확보할 수 없을 때[6]에 쓴다.

이러한 문제로 Western Digital社에서는 Raid Edition 이라는 기업 대상 레이드 전용 제품군을 출시한 적도 있다. 이 녀석은 무상 A/S기간도 5년이나 된다.

 

 

Nested RAID

레이드 볼륨의 멤버로 다른 레이드 볼륨을 사용하는 형태. 볼륨 확장 과정에서 구성 편의성 문제로 형성되는 경우가 많다. 이 때 멤버 디스크를 묶는 배열을 하위 배열, 하위 배열을 묶는 배열을 상위 배열이라고 한다.

대표적인 예시로 10, 0+1, 15, 50, 0+5, 51 등이 존재한다. 표기 방법은 m(하위 배열)n(상위 배열)이다.
아래 예시는 1TB 디스크 6개로 구성한다는 상황을 가정하여 작성해 두었다.

 


RAID 10


하위 배열은 RAID 1, 상위 배열은 RAID 0이다. RAID 1로 미러링 된 볼륨을 RAID 0으로 스트라이핑 한다.
퍼포먼스 및 용량 위주로 구성한다면, 디스크 2개를 RAID 1로 묶은 미러 볼륨 3개를 RAID 0으로 스트라이핑 한다. 이 경우 사용 가능한 총 용량은 3TB가 된다.
안정성 위주로 구성한다면, 디스크 3개를 RAID 1로 묶은 미러 볼륨 2개를 RAID 0으로 스트라이핑 한다. 이 경우 사용 가능한 총 용량은 2TB가 된다. RAID 0+1에 비해 디스크 장애 발생시 복구가 수월하다. RAID 0+1
하위 배열은 RAID 0, 상위 배열은 RAID 1이다. RAID 0으로 스트라이핑 된 볼륨을 RAID 1로 미러링 한다.
퍼포먼스 및 용량 위주로 구성한다면 디스크 3개를 RAID 0으로 묶은 스트라이프 볼륨 2개를 RAID 1로 미러링 한다. 이 경우 사용 가능한 총 용량은 3TB가 된다.
안정성 위주로 구성한다면, 디스크 2개를 RAID 0으로 묶은 스트라이프 볼륨 3개를 RAID 1로 미러링 한다. 이 경우 사용 가능한 총 용량은 2TB가 된다.
RAID 10에 비해 RAID 볼륨이 깨졌을 경우 복구가 힘들다. RAID 10과 비교하자면, 미러 볼륨으로 구성된 어레이에서 디스크 하나가 고장이 났다면, 미러 볼륨 자체는 깨지지 않는다. 즉, 디스크만 바꿔 넣어주면 알아서 Rebuliding 하여 원래 상태로 돌아간다. 하지만 RAID 0+1의 경우 디스크 하나가 고장이 났다면, 해당 RAID 0 어레이 전체가 깨져버린다. 디스크를 교체한 뒤, RAID 0 어레이를 다시 구성하고 다시 미러링 해야 한다. RAID 15
하위 배열은 RAID 1, 상위 배열은 RAID 5다. 개인 사용자 레벨에서는 사용할 일이 거의 없는 RAID 레벨이다. RAID 1로 미러링 된 볼륨을 RAID 5 볼륨으로 묶는다. RAID 5의 경우 최소 3개 이상의 디스크가 필요하기 때문에 디스크 6개로 구성할 수 있는 경우의 수는 하나밖에 없다.
디스크 2개를 RAID 1로 묶은 미러 볼륨 3개를 RAID 5로 묶는다. 이 경우 사용 가능한 총 용량은 2TB가 된다. RAID 50
하위 배열은 RAID 5, 상위 배열은 RAID 0이다. 마찬가지로 개인 사용자 레벨에서는 사용할 일이 거의 없다. RAID 5 볼륨을 RAID 0으로 스트라이핑 한다. 마찬가지로 RAID 5의 경우 최소 3개 이상의 디스크가 필요하기 때문에 디스크 6개로 구성할 수 있는 경우의 수는 하나밖에 없다.
디스크 3개를 RAID 5 볼륨으로 묶은 것을 RAID 0으로 스트라이핑 한다. 이 경우 사용 가능한 총 용량은 4TB가 된다.
RAID 0+5에 비해서 디스크 장애 발생 시 복구가 수월하다. RAID 0+5
하위 배열은 RAID 0, 상위 배열은 RAID 5이다. 역시 개인 사용자 레벨에서는 사용할 일이 거의 없다. RAID 0 볼륨을 RAID 5 볼륨으로 묶는다. 역시 RAID 5의 경우 최소 3개 이상의 디스크를 필요로 하므로 디스크 6개로 구성할 수 있는 경우의 수는 하나밖에 없다.
디스크 2개를 RAID 0으로 묶은 스트라이프 볼륨 3개를 RAID 5로 묶는다. 이 경우 사용 가능한 총 용량은 4TB가 된다.
RAID 50에 비해 장애 조치가 힘들다. 이유는 RAID 0+1에도 나와 있지만 디스크 장애 발생시 해당 RAID 0 볼륨이 깨져버리기 때문. RAID 51
하위 배열은 RAID 5, 상위 배열은 RAID 1이다. 이 역시 개인 사용자 레벨에서는 사용할 일이 거의 없다. RAID 5 볼륨을 RAID 1로 미러링 한다. 역시 RAID 5 볼륨의 경우 디스크 3개 이상을 필요로 하므로 역시 구성할 수 있는 경우의 수는 하나밖에 없다.
디스크 3개를 RAID 5 볼륨으로 묶고, 그 볼륨 두개를 RAID 1로 미러링 한다. 이 경우 사용 가능한 총 용량은 2TB가 된다. RAID 15나 51이나 장애 발생시 복구하는 데 필요한 노력은 비슷하다. RAID 1 환경에서 디스크가 깨진 경우에도 디스크를 교체해 주면 Rebuilding 하여 복구가 되지만, 그건 RAID 5도 마찬가지다.

 

개인 환경에서의 사용

전통적으로 별도의 RAID 컨트롤러를 사용하는 것이 안정성이 좋고 유지보수 등에 있어서 간편한 것으로 알려져 있으나, 최근의 메인보드 내장 RAID 컨트롤러 또한 상당한 성능을 보여주고 있다. 인텔의 경우 Intel Rapid Storage Technology라고 부르는 그것. 많이 나아지긴 했지만, 내장 컨트롤러라는 한계가 있어 여러 디스크를 RAID 0으로 묶을 경우 제 성능을 못 내는 경우도 있다. 안정성 면에서도 별도의 RAID 컨트롤러에 비해 부실하기 때문에 RAID 1을 제외하면 RAID Array가 깨졌을 시 데이터 복구는 포기하는게 편하니 주의하도록 하자.

흔히 파코즈2CPU 등에서 이를 구축한 사람을 쉽게 볼 수 있다. 만약 하드디스크 사망으로 인한 데이터 손실을 경험해 보았다면, RAID 1 정도는 구축해 보아도 나쁘지 않을 것이다. 물론 용량 및 성능 대비 금액 크다는 단점이 있다.

최근들어 NAS 의 보급으로 인해 개인환경에서 사용하는 경우도 많아졌다. 주로 사진과 같이 다량의 데이터를 보관하거나 미디어 서버의 용도로 사용하는 경우가 많은데 예전에 비해 많이 저렴한 가격으로 사용할 수 있다. 또한 4-bay 이상의 NAS 도 많이 저렴[7]해져 개인 level 에서 RAID 5 이상을 구현하는 경우도 예전보다는 늘었다.

하지만, 명심해야 할것은 레이드는 백업이 아니다!. 실제로 저 문구는 레이드를 설명하는 글에서 자주 등장한다. 데이터 안정성 목적으로 레이드는 전통적인 백업을 절대로 대체하지 못하며, 데이터 안정성보다는 디스크 몇 개가 고장나서 갈아끼워야 할때도 나머지 디스크로 중단없이 서비스를 하려는 목적이 오히려 더 강하다. 사실 하드디스크가 뻑날 확률은 디스크 개수만큼, 그리고 돌아가는 시간만큼 뻥튀기가 되기 때문에 수십개를 주렁주렁 달아놓고 24시간 돌아가는 서버의 경우에는 커다란 문제이고 레이드가 가뭄에 단비와도 같은 존재지만, 4-5개 정도의 디스크만 사용하며 실제 하드디스크를 사용하는 정도도 훨씬 덜한 개인 사용자들의 경우에는 사실 디스크가 뻑나서 날려먹는 경우보다 본인 실수로 잘못 지운다거나 해서 날려먹는 경우가 훨씬 많다고 볼 수 있다. 이 때문에 개인사용자의 경우에는 레이드보다 백업이 훨씬 가치가 크다. 레이드에 대한 지식이 별로 없는 개인사용자들이 흔히 범하는 실수가, 몇개 안되는 디스크로 데이터 안정성을 목적으로 백업 없이 4개 정도의 디스크를 RAID 1로 구축해 버리는 경우다. 차라리 안정성 구현을 원한다면 RAID 10을 구성하고 주기적으로 백업하는 편이 훨씬 낫다.

 

Hot Spare

RAID 5, 6, 1 등 소수의 하드디스크가 고장나더라도 운영에 지장이 없는 RAID Level 을 위해 존재한다. Hot Spare 는 전체 멤버디스크에서 1개 이상의 디스크를 spare 로 지정해서 data를 읽고 쓰는 행위를 하지 않고 그냥 대기(stand-by) 시키다가 디스크가 고장 났을때 자동으로 rebuilding 하여 원래의 raid 상태로 복구[8]시킨다.

일반적으로 RAID 1 에서는 2 + 1 의 구성으로, RAID 5 에서는 멤버디스크+1로, RAID 6 에서는 멤버디스크 + 2 로 구성하며 Hot Spare 는 사용하지않고 노는 disk 를 양산하기 때문에 구성 disk 대비 사용 용량이 매우 적고 비용이 증가한다. 단 안전성을 좀 더 높일 수 있다. 또한 raid group 을 여러개 지정하는 중형 이상의 storage에서는 Global Spare 라 하여 여러 group 이 공용으로 Hot Spare 를 사용하게 하는 경우도 있다.

 

성능 비교

이론상 최적화되었을 때의 비교값이다.

안정성 : 1 >> 6 > 5 > non-RAID >> 0 > 0^3 > 0^4 ······
멤버 디스크가 하나라도 망가지면 데이터 전체가 날아가는 만큼 RAID 0은 묶은 디스크의 개수가 많아질수록 안정성이 떨어진다. 읽기속도 : ······ 0^4 > 0^3 > 0 > 1 > 5 ≥ 6 >> non-RAID.
멤버 디스크 개수가 늘어날수록 속도는 더더욱 빨라진다. 쓰기속도 : ······ 0^4 > 0^3 > 0 > 5 ≥ 6 > non-RAID ≥ 1
사실 쓰기 속도의 증가는 기대하지 않는 게 좋다. 가격대비 용량 : non-RAID = 0 > 5 > 6 > 1 초기구축비용 : 6 > 5 > 1 > 0 = non-RAID.
일반적인 개인/SOHO 환경을 기준으로 했을 때의 이야기이다. 하드디스크가 서버랙 전체에 빼곡히 꽂혀나가는 상황이라면 의미가 없는 것이나 마찬가지.
----
[1] 엄밀히는 Z의 초기 시리즈인 VGN-Z의 라인업에서 고급형 모델에 한시적으로 탑재된 것이 시초이며, 본격적으로 적용되기 시작한 것은 후속 라인업인 VPCZ1에서라고 할 수 있다. [2] 소니의 2011년 신모델로 나온 바이오 SB 시리즈의 고급형 모델의 경우 128GB SSD 두 개를 RAID0로 묶어서 256GB의 용량을 가진다. [3] 참고로 바이오 Z(VPCZ1)는 13인치급 노트북이지만 배터리 포함 무게는 1.4kg 정도로 넷북과 맞먹는 수준이며, ODD까지 내장하고 있어서 실제 메인보드가 장착되는 면적은 본체 면적의 절반 정도에 불과하다.... 흠좀무 [4] 하드 하나가 고장난 RAID 5 장비에서 교체하려다가 실수로 멀쩡한 하드 하나를 뽑았다 → 데이타는 천국으로. 동일 상황에서 RAID 6는 문제가 없다. [5] 가끔이라는 이유는 굳이 로그용 디스크를 따로 할당하는 경우가 별로 없기 때문. 그냥 RAID5 볼륨에서 로그까지 기록하는 경우가 많다 [6] 예를 들면 과거 HDD의 용량단위가 MB 단위로 나오던 시절 [7] 2011년 4월 기준 2베이 정도는 20-30 에도 NAS 본체를 구입 가능하며 4 베이 이상은 100 만원 정도부터 시작. 2-3년 전에 비해 정말 정말 저렴해졌다. [8] 그렇다고 고장난 하드를 안바꾸는건 아니지만 아무래도 다시 또하나의 디스크가 고장 났을때 그만큼의 시간을 벌 수 있다.

 

출처 - https://mirror.enha.kr/wiki/RAID 외 기타 인터넷

반응형
Posted by 랩터 인터내셔널

 

 

 

인메모리 데이터베이스(In-memory Database)는 데이터 스토리지의 메인 메모리에 설치되어 운영되는 방식의 데이터베이스 관리 시스템이다. 디스크에 설치되는 방식에 비해 처리 속도가 빠르다.


디스크가 아닌 주 메모리에 모든 데이터를 보유하고 있는 데이터베이스. 디스크 검색보다 자료 접근이 훨씬 빠른 것이 가장 큰 장점이다. 데이터 양의 빠른 증가로 데이터베이스 응답 속도가 떨어지는 문제를 해결할 수 있는 대안이 인 메모리 데이터베이스이다. 전형적인 디스크 방식은 디스크에 저장된 데이터를 대상으로 쿼리를 수행하지만, 인 메모리 방식은 메모리상에 색인을 넣어 필요한 모든 정보를 메모리상의 색인을 통해 빠르게 검색할 수 있다.


인메모리 컴퓨팅은 전통적으로 디스크 기반 스토리지에 상주하는 워크로드를 메인 메모리로 옮기는 기술이다. 이는 기존 방식에 비해 수 배에 달하는 성능 개선 효과를 가져온다.


하지만 이 기술은 데이터를 추출해 관계형 데이터 웨어하우스로 옮기는 데 따른 장점보다는 트랜잭셔널 시스템에서 실시간으로 이벤트를 분석하는데 따른 장점이 더 크다. 인메모리 분석은 사실 최신 기술이 아니다. 가상화나 클라우드와 같이 새롭게 조명받는 오래된 아이디어에 가깝다.



인 메모리(In memory) 기술에 대하여 PART1-2-3

출처 - http://blog.naver.com/PostView.nhn?blogId=start_fromus&logNo=140155878569


Part 1 서론


 1) 오늘날의 시장과 실시간 의사결정의 중요성
 2) 폭발적인 데이터의 양과 실시간 의사결정의 어려움
 3) 실시간 경영(Real Time Business)을 가능하게 하는 In-memory

 


서론

 

1) 오늘날의 시장과 실시간 의사결정의 중요성


과거에는 경영자의 '직감'만으로 모든 경영환경을 파악할 수 있었고 이는 곧 빠른 의사결정과 실행으로 이어져 성공을 달성할 수 있었다. 그러나 전 세계가 하나의 시장으로 통합되고, 고객들의 욕구가 빠르게 변해가면서 높은 불확실성과 정보의 홍수로 대변되는 지금의 경영 환경에서는 과거와 같이 경영자의 막연한 '감'에 의지한다면 오히려 해당 기업을 위험에 처하게 할 수 있다. 따라서 오늘날 경영환경에서는 ‘속자생존’과 ‘빅 데이터’에 적응하는 것이 생존의 핵심이 되었다. 속자생존이란 시장에 빠르고 민감하게 대응하는 기업이 생존한다는 의미이다. 오랜 시간을 들여 완벽한 제품을 만드는 것보다 고객의 니즈를 재빨리 파악하고 제품화하여 한시라도 빨리 시장에 출시하는 것이 성공적인 기업의 필수 요소가 되었다. 이러한 속자생존의 경영환경에서 오늘 날 기업들에게는 시장의 무수한 데이터, ‘빅 데이터’를 분석하여 얻은 정보를 바탕으로 실시간으로 의사결정을 내리는 것이 핵심이 되었다.

 

 

2) 폭발적인 데이터의 양과 실시간 의사결정의 어려움


현대 기업이 보유하고 사용해야 하는 데이터양은 엄청나다. 오늘날 글로벌 기업들은 전 세계 시장의 고객 니즈와 수요동향, 각지의 공장의 생산을 관리해야 하며 복잡한 공급망을 비롯하여 최신 트렌드 파악, 고객 민원에 대한 응답 속도 개선, 영업 인력들 관리에 관련된 엄청난 양의 데이터를 수집하고 분석해야 한다. 시장조사기관 포레스터 리서치에 따르면 보통 한 개 기업이 핵심 비즈니스 애플리케이션에 사용하는 데이터양은 매 18개월을 주기로 두 배씩 증가한다고 한다. 급격히 증가하는 데이터 처리를 위해 하드웨어를 구매하고 유지·관리해야 하는 기업 입장에서는 그 비용이 만만치 않다. 더욱이 현재 기업들의 이러한 하드디스크 기반의 데이터 처리 방식은 데이터양이 급증할 경우 과부하 및 병목 현상이 생기며, 이를 방지하기 위해 최선의 방안으로 데이터를 여러 단계에서 처리 하는 프로세스를 가지고 있다. 이러한 단계별 데이터 처리 프로세스는 상대적으로 시간이 많이 소요되기에 실시간 의사결정을 어렵게 한다.

 

 

3) 실시간 경영(Real Time Business)을 가능하게 하는 In-memory 기술


'Real Time'이라는 용어는 시스템 측면에서 시스템에 입력된 데이터 처리가 명령과 동시에 이루어지거나 또는 데이터를 입력하여 결과가 출력되는 시간은 일률적이지는 않지만 대개 수초 이내여야 리얼 타임 시스템이라 부를 수 있다고 정의 된다. 이를 바탕으로 비즈니스 측면에서 본 실시간 경영(Real Time Business)은 기업이 무수히 많은 시장과 기업 내부의 데이터를 빠르게 처리하고 분석하여 시장의 요구와 변화에 대응하면서 비즈니스를 수행함을 의미한다. In-Memory 기술은 기존의 데이터 처리 방식에 비해 훨씬 뛰어난 성능으로 데이터를 처리하며 데이터 처리 과정을 통합하여 데이터 처리 시간을 줄임으로써 실시간 의사결정을 내리는 Real Time Business를 가능하게 한다.



In-Memory 기술 이란?

 

 

1)In-Memory 정의 (인메모리 정의) 

 

In-Memory 기술은 방대한 양의 데이터를 하드디스크가 아닌 메모리에 보관하고 실시간으로 분석할 수 있게 함으로써 각종 데이터베이스를 거치지 않고 즉시 얻을 수 있도록 하는 기술이다. 일반적으로 컴퓨터상에서 하드디스크와 메모리의 데이터 처리 속도는 100배 이상이다. 따라서 In-Memory 기술을 적용한 데이터베이스 관리 시스템은 이전의 디스크 기반 모델에 비해 수십 배에서 수백 배의 성능 향상을 이끌어 낸다. 대량의 데이터 이동, 상호 비교, 갱신이 겨우 몇 초 안에 가능해진다.

 

 

2)In-Memory 등장배경 (인메모리 등장배경)

 

오늘날 기업은 끊임없이 변화하고 불확실한 글로벌 시장에서 경쟁해야 됨에 따라 경영자의 의사결정을 정확하고 빠르게 지원할 수 있는 경영분석(Business Intelligence)이 필요하게 되었다. 경영분석은 기업과 관련된 모든 데이터를 분석하여 보이지 않던 것들을 경영자의 눈에 보이게 한다. 하지만 최근 급격히 증가하는 데이터의 양에 따라 다양한 종류의 데이터베이스가 신속한 의사결정의 발목을 잡고 있다. 기업의 관리자들은 속도가 느린 각종 분석 시스템에 불만을 표출하고 있다. 뜻밖에도 기업 경영 속도를 느리게 만드는 주요 요소 중 하나가 컴퓨터의 하드디스크이다 이러한 디스크의 데이터 처리 방식의 한계로부터 제기 된 것이 메모리 기반의 데이터 처리 방식(In-Memory)의 필요성이다.

 

 

*하드디스크 기반의 DB와 메모리 기반의 DB의 차이

 

하드디스크 기반의 데이터베이스는 데이터양이 많아지거나 트랜잭션 처리와 분석업무를 모두 할 경우 병목 현상이 발생 한다 따라서 데이터웨어하우스와 별도로 데이터 마트와 데이터 큐브를 따로 마련해 두어야 하며 트랜잭션 처리와 분석업무를 따로 처리하여야 한다. 반면에 메모리 기반의 DB는 디스크 기반의 DB보다 훨씬 뛰어난 성능으로 트랜잭션 처리와 분석업무를 동시에 처리할 수 있고 데이터양이 급증하더라도 빠른 시간(초 단위)안에 데이터를 처리, 분석 할 수 있다.

 

 

3)In-Memory 기술의 개발 (인메모리 기술의 개발)

In-Memory에 대한 개념적 논의는 오래전부터 메모리 업계에서 이루어져 왔다. 최초로 In-memory 기술을 사용하여 메모리 기반 DB를 만든 기업은 TimesTen 이다. 그 뒤 제품 사용화를 위해 오라클을 비롯한 많은 기업들이 연구를 진행하였는데, 그 중 SAP가 한국 R&D센터의 한국인 100여 명과 세계 개발자들과 5년 동안 연구하여 In-Memory 기술을 최초로 기업용 애플리케이션에 적용하여 서비스 하였다. 한국에서 개발됐다는 뜻으로 In-Memory 기술이 사용된 SAP의 데이터웨어하우스 제품명 역시 ‘SAP HANA’로 붙여졌다. 현재는 SAP뿐만 아니라 오라클 역시 In-Memory 제품을 내놓았고 다른 기업용 솔루션 기업들 또한 In-Memory 기술 뛰어 들고 있다.



기존의 데이터 처리 방식 


 


DD.png


 


 


1) 데이터 수집 단계


기업 외부와 내부의 원 데이터(Raw Data)가 각각의 정보시스템으로 들어가서 정보시스템 내부의 중앙집권화된 내부 데이터베이스에 저장되는 단계이다. 그 후 각 정보시스템들에 저장된 모든 데이터들이 통합되는 데이터 통합 단계로 넘어간다.


 


* OLTP (OLTP에 대한 설명)


OLTP는 데이터를 수집하는 시스템 또는 프로세스로 정의된다. 거래(Transaction) 데이터를 처리한다. 최신의 그리고 소량의 데이터를 처리한다는 점에서 뒤에 설명되는 ODS와 비슷하나 분명한 차이점이 있다. ODS는 단지 데이터를 통합하고 저장하는 중간 저장소의 역할을 할 뿐이지만 OLTP는 자체적으로 간단한 의사결정을 내릴 수 있다는 것이 ODS와의 차이점이다.


 


2) 데이터 통합 단계


최종 의사결정자의 원만한 의사결정을 위한 통합 보고서를 만들기 위해서 수집되어 저장된 데이터들이 저장되고 통합되는 단계. ODS 또는 ETL의 과정을 거친다.


 


* ODS (Operational Data Store)


정보시스템에서 나온 아웃풋들을 여러 DB에 저장된다. ODS는 분산된 여러 DB들로부터 받은 Raw Data를 일시적으로 저장하는 저장소이다. Raw DataODS와 같은 한 곳의 저장소에 보관하는 이유는, 모든 전사적 데이터들을 한 번에 가공하여 효율성을 증대시키기 위함이다. ODS의 데이터 처리과정은 다음과 같다.


 


1) 분산된 여러 DB로부터 Raw Data를 받는다. ODS는 최신의 그리고 소량의 데이터만을 취한다.


 


2)취한 데이터들을 가공하기 쉬운 형태로 변환시킨다. 쉽게 말해 Data Cleansing의 단계이다.


 


3)이렇게 처리한 자료들을 저장소에 저장한다.


 


* ETL (Extraction, Transformation, Load)


 


DD2.png


 


 



통합된 DB보고서를 얻기 위해 데이터를 추출, 가공, 적재하는 프로세스가 ETL이다. ETL 프로세스의 데이터 처리과정은 다음과 같다.


 


1) Extraction 단계 : 각 경영정보시스템의 DB들로부터 뿐만이 아니라 웹사이트, 운영서버들로부터 필요한 데이터를 추출(Extract)한다.


 


2) Transformation 단계 : 추출된 데이터들은 중앙시스템으로 옮겨진다. 중앙시스템에서 기업의 필요에 따라 적절하게 설계된 비즈니스 로직에 맞춰서 데이터들이 가공(Transformation)되거나 정제(Cleansing)된다. DW에서 이용하기 쉬운 형태로 가공된다.


 


3) Load 단계 : 이렇게 가공된 데이터들은 이 데이터들을 필요로 하는 DW 또는 데이터 마트(Data Mart)로 보내진다(Load).


 


3) 데이터 저장 단계


데이터 저장단계는 DW(Data Warehouse)의 데이터 처리 방식을 중점으로 설명이 가능하다. DW의 데이터 처리 단계에서 데이터는 단순히 정해진 로직에 따라서 관리되는 것에 그치지 않는다. DW에는 최신 데이터만이 아닌 예부터 현재에 이르기까지의 방대한 양의 데이터가 저장되며, 이렇게 저장된 데이터들이 최종 의사결정자의 요청에 맞추어 주제 지향적으로 데이터를 가공한다. DW의 데이터 처리과정은 다음과 같다.


 


1) 다양한 온라인 거래처리 프로그램 등 운영시스템들로부터 다량의 데이터를 공급받는다.


 


2) 데이터들은 DW로 이동되면서 재구조화 된다. 대부분의 DW들은 유용한 데이터를 더욱 유용하게 가공하여 다차원적으로 구조화하고 저장한다.


 


3) 다시 한 번 주제 중심적으로 데이터를 조직하여 의사 결정자의 원만한 의사결정을 돕는다. 대부분의 운영시스템들이 재고 관리 등의 기업 운영에 필요한 정보들을 지원한다면 DW는 주제를 중심으로 고객 정보, 제품 정보 등을 지원한다.


 


4) 이렇게 조직화된 데이터들은 최종 의사결정자의 의사결정에 이용된다.


Data Mart는 산업 군이나 회사별로 조금씩 다르게 사용될 수 있지만 일반적으로는 DW에서 대용량 데이터들을 비즈니스 요구에 맞게 기능이나 분야별로 분류한 데이터 모델이다. 또한 Data Mart는 정보 접근을 돕는다. 예를 들어, DW에서 Data Mart를 통하여 WEB에 정보를 노출시켜서 잠재적 소비자의 정보 접근을 돕는다.


 


4) BI 소프트웨어


OLAP는 최종 사용자가 BI 툴을 이용하여 정보를 통계학적으로 분석하고 추후상황을 예측하거나 의사결정을 내릴 때, 그 일련의 과정을 지원한다. 다른 분석 툴과 다르게 OLAP는 다차원적으로 구조화된 데이터를 분석할 수 있다. OLAP 분석툴로 데이터를 분석할 때는 쿼리를 사용한다. 그렇기 때문에 쿼리에 익숙하지 않은 사용자들은 OLAP 툴을 이용한 데이터 분석에서 어려움을 겪을 수 있다.


 


DD3.png


 


 


왼쪽 다차원 큐브를 예시로 OLAP 분석의 예를 들 수 있다. 왼 쪽 큐브는 고객, 시간, 상품의
3차원 각도로 이루어져 있다. 이것이 뜻하는 것은‘언제 어느 고객에게 어느 상품을 공급할 것인가?’
정도로 해석 가능하다. 분석가는 OLAP 툴에 요구되는 상황에 맞는 쿼리를 전송하고 OLAP 툴은
분석 결과를 도출한다. 분석가는 그것을 바탕으로 추후상황을 예측하거나 의사결정을 내린다.




인메모리 관련 기사 / 출처 http://www.ciokorea.com/tags/9733/IM/17530?page=0,1


인메모리 기술은 또 USPS가 부정사용을 적발하고 우편물에 적절한 요금이 부과되었는지를 신속하게 파악할 수 있게 해준다. 그들은 인메모리 데이터베이스를 USPS가 동적 경로 설정법, 익일 배송, 예측 전송 등의 작업을 활용할 수 있도록 하는 기술로 보고 있다.


휴스턴과 앳킨스는 "인메모리 데이터베이스를 통해 우리는 과거 몇 시간 또는 며칠이 소요되었던 것들을 실시간으로 처리할 수 있다"라고 말했다.


재정적 효과 그 이상, 통신 산업


사실 인메모리 기술이 특별히 새로운 것은 아니다. 인메모리 분석 플랫폼 벤더 코그니티오(Kognitio)의 CTO 로저 가스켈은 최초의 시스템이 런던의 중개기업 세이버리 밀른(Savory Milln)을 위해 1980년대에 구축됐다고 말했다. 이 기업은 실제적으로 제 때에 거래 노출 위험을 계산하기 원했다고 가스켈이 말했다.


인메모리 시스템 이전에는 계산에 밤을 새워야 했다. 인메모리는 "우리가 사용례 기준을 충족시킬 수 있는 충분한 CPU 처리능력을 확보할 수 있도록 데이터를 빠르게 처리할 수 있는 유일한 방법이었다"라고 가스켈이 말했다.


약 25년이 지난 지금, 새로워진 것은 인메모리 기술에 대한 관심이 급격히 증가했다는 점이다. 가스켈은 "지난 2년 동안 굉장한 변화가 있었다. 인메모리는 큰 인기를 얻었으며, 적용 분야는 폭발적으로 증가했다"라고 말했다.


그는 이어 금융 서비스 및 통신 기업들이 코그니티오의 주요 고객이었지만, 인메모리에 대한 수요는 소매 시장 등에서 더 나타나고 있다고 말했다.


테라코타의 앨런은 금융 서비스, 물류, 전자상거래, 정부, 의료 부문 등에서 인메모리에 대한 관심을 보였다며, “어디에서든 폭넓게 적용할 수 있다. 사람들은 '이것을 어떻게 활용하지?'라고 말한다"라고 전했다.


수요가 증가하면서 인메모리 기술을 제공하는 벤더의 수 또한 증가하고 있다. 예를 들어, 지난 5월에는 테라데이터(Teradata)가 자사의 데이터 저장소에 내재된 기능을 통해 고객들이 메모리를 활용할 수 있도록 하는 인텔리전트 메모리(Intelligent Memory) 서비스를 도입했다.


테라데이터의 대변인 앨런 그린스팬은 "별도의 기기가 필요 없다"면서, 이 기술로 데이터를 추적해 자주 사용되는 데이터를 메모리로 옮긴다고 덧붙였다.


인메모리 기술을 이용한 터치 처리 및 색인


 인메모리 데이터베이스는 기관들이 신속하게 많은 데이터를 처리해야 할 때, 극적인 결과물을 생성할 수 있는 잠재력을 갖고 있다. 하지만 문제점이 아주 없는 것은 아니다. 기술의 특성에 대한 오해가 이런 문제점 중 하나다.


업계 전문가들은 인메모리 배치를 위해서는 단순히 데이터를 메모리로 옮기는 작업 이상의 것이 필요하다고 설명하고 있다. 먼저 반드시 메모리를 활용하기 위한 데이터 관리 소프트웨어를 설계해야 한다.


SAP의 데이터 저장소 솔루션 및 HANA 플랫폼 담당 부사장 크리스 핼렌벡은 "단순히 메모리에 데이터를 옮기는 것이 아니다. 처음부터 데이터베이스 전체를 다시 작성하여 디스크 대신에 메모리를 주된 저장 매체로 사용하도록 하는 것이다"라고 말했다. (SAP HANA 실시간 플랫폼은 인메모리 데이터베이스를 포함하고 있다)


또 다른 문제점도 있다. 인메모리 기술의 속도 때문에 프로세서에 대한 부담이 가중된다. 결과적으로, 기관들은 반드시 데이터에 접근하는 코드를 병렬화하고 클러스터 전반에 걸쳐 부하 균형을 적용해야 한다. 린드퀴스트는 "부하 균형은 인메모리 데이터베이스를 활용하는 능력에 있어서 중요한 부분을 차지하고 있다"라고 말했다.


실제로 애드저글러는 상용 하드웨어와 자체 개발한 소프트웨어를 사용한 풀(Pull) 기반의 부하균형 시스템을 개발했다. 애드저글러의 거래처리 엔진의 각 인스턴스는 부하균형 구성요소로부터 작업을 가져오고 작업을 완료한 후, 다시 더 많은 작업을 가져온다. 시스템은 추가적인 용량이 필요한 경우에 더 많은 인스턴스를 불러온다.


또 인메모리 제품을 사용하는 기업들은 반드시 데이터베이스 색인을 조심해야 한다. 전통적인 데이터베이스를 사용하는 기업들은 상당한 디스크 공간을 색인에 할당할 수 있다. 하지만 인메모리 데이터베이스는 더 높은 정확성이 요구된다.


린드퀴스트는 "데이터베이스 등의 인메모리 저장소를 사용하는 경우에는 성능을 위해 색인을 작성해야 한다. RAM이 더욱 비싸고 한정적이기 때문에 더욱 정확해야 한다"라고 말했다.


RAM의 휘발성 때문에 인메모리 도입 시 또 다른 문제점이 야기된다. 시스템에 문제가 발생하는 경우, 데이터를 반드시 다시 불러와야 한다. 이 때문에 시간이 소요될 수 있다.


USPS에서 휴스턴과 앳킨스는 인메모리 데이터베이스를 사용하는데 있어서 데이터 보호가 가장 큰 문제점 중 하나라고 지적했다. USPS는 현재 인메모리로 무거운 작업을 처리하고 나서 관련된 결과를 관계형 데이터베이스에 다시 전송하고 있다. 또한 USPS는 인메모리를 통한 처리의 체크포인트 파일을 유지하여 문제가 발생하는 경우에 제한적인 복구를 수행하고 있다. 그는 "우리는 합리적인 보완책을 통해 중요한 데이터를 보호하고 있다"라고 말했다.


하지만 체크포인트 파일에서 인메모리 시스템을 복구하는 작업은 쉽지 않다. 휴스턴과 엣킨스는 "예상했겠지만, 전통적인 저장매체에서 16TB를 복구하기 위해서는 상당한 시간이 소요된다"라며, USPS의 인메모리 데이터 저장소 규모를 언급했다.


그들은 "이 문제를 해결하기 위해서 우리는 현재 다시 불러오는 시간이 크게 줄어들기를 바라는 마음에 처리에 플래시(Flash) 카드 기술을 추가하는 것을 연구하고 있다"라고 전했다.

반응형
Posted by 랩터 인터내셔널

타이틀

세부설명

Alignment (정렬)

Alignment는 저장 장치의 파티션 정렬을 의미합니다. 이것은 최적의 성능을 만들기 위하여 파티션의 시작점을 결정하는 것입니다. (보다 자세한 정보는 파티션을 참조하세요)

BIOS

Basic input/output system의 약자입니다. 간혹 CMOS라고 언급되는데, BIOS는 컴퓨터의 하드웨어와 소프트웨어를 연결하는 역할을 합니다. BIOS는 하드웨어에 어떻게 접속되는지를 결정합니다.

Bit (비트)

2진법 단위. 컴퓨터가 인식하는 데이터 ( 1 혹은 0 ) 의 조각 중 최소 조각

(Buffer) 버퍼

버퍼는 각각의 다른 속도와 다른 우선 순위의 장치들이 데이터를 공유하고자 할 때 보관하는 영역입니다. 버퍼는 다른 장치가 발생하는 지연 현상에 관계없이 원래 장치가 정상 동작하도록 하는 역할을 합니다.

Byte (바이트)

8비트의 정보. 바이트는 컴퓨터 동작의 기본 단위입니다. 컴퓨터의 모든 사양, 성능 등은 바이트나 그 배수인 킬로바이트 (KB), 메가바이트 (MB)로 표시됩니다. 바이트와 비트를 혼돈하지 마시고, 일반적으로 바이트는 8비트의 정보를 표시하기 때문에 대문자 B, 비트는 소문자 b로 표시됩니다.

Cache (캐쉬)

한시적으로 데이터를 저장하기 위하여 사용되는 매우 빠른 메모리입니다. 우리 웹사이트에서는 Crucial Adrenaline Solid State Cache Solution (크루셜 아드레날린 SSD 캐쉬 솔루션) 이라는 용어를 볼 수 있는데, 이것은 하드디스크를 보충하여 일반적으로 자주 사용되는 파일들을 SSD에 저장하여 캐쉬 시킴으로써 데이터 전송 속도를 획기적으로 증가시키는 역할을 합니다.

Dataplex (데이터플렉스)

데이터플렉스는 크루셜 아드레날린을 캐쉬로 동작시키기 위하여 사용하는 소프트웨어입니다.(위 참조) 이 소프트웨어는 NVELO사가 제공합니다.

EZ Gig (이즈 긱)

이 소프트웨어는 윈도우 베이스의 하드드라이 내용을 SSD에 모두 복제할 때 사용하는 소프트웨어 입니다. 이 소프트웨어를 사용함으로써 SSD로 업그레이드 할 때 OS나 어플리케이션을 새로 설치할 필요가 없습니다. EZ Gig은 SSD로의 업그레이드 과정을 매우 편리하게 합니다.

FAT (에프에이티)

File Allocation Table의 약자로서 컴퓨터의 파일철과 같은 것입니다. 이것은 시스템에게 모든 파일들이 어떤 위치에 있고 어떻게 접근될 수 있는지 알려 줍니다. FAT는 HDD나 SSD 같은 저장 장치에 널리 사용되며 Mac과 일반 PC 시스템에 모두 동작합니다. FAT에는 FAT16, FAT32, exFAT 같은 버전이 있습니다.

File System (파일시스템)

파일시스템은 저장 장치에서 데이터를 어떻게 저장하고 어떻게 접근하는지 결정하는 시스템입니다. 일반적인 파일시스템에는 FAT와 NTFS가 있습니다.

Form Factor (폼팩터)

시스템에서 하드웨어 부품의 물리적 크기를 말합니다. 예를 들어 SSD의 폼팩터에는 2.5”또는 1.8”가 있는데, SSD의 외형 크기를 알려줍니다.

Formatting (포맷)

포맷은 저장 장치를 파일시스템에 맞도록 조정하여 저장장치를 사용할 수 있게 준비하는 단계입니다. 그러므로 포맷하기 전에 반드시 이전 데이터는 모두 지워야 합니다.

Garbage Collection
(가비지 콜렉션)

Garbage Collection은 더 이상 사용되지 않은 메모리 섹터를 모두 비워 SSD가 최상의 성능을 낼 수 있도록 유지하는 단계입니다. Garbage Collection은 SSD의 일부분이며, OS 시스템과는 연관되지 않습니다.

Interface (인터페이스)

인터페이스는 두 독립된 시스템을 서로 통신하게 하는 수단입니다. 사용자 인터페이스 (키보드, 마우스 등)은 사용자와 시스템OS을 통신하게 하고 연결하는 수단입니다. 그런 것처럼 일반적으로 알려진 소프트웨어 인터페이스 즉 언어와 코드(code)는 어플리케이션이 어플리케이션간 또는 하드웨어와의 통신을 하게 합니다. SSD에 있어서는 인터페이스는 커넥터를 의미하게 되는데, SSD를 컴퓨터에 연결하여 전원과 데이터를 받습니다.

Latency (레이턴시, 지연)

Latency는 시스템 메모리가 명령에 반응하는 시간의 양을 나타냅니다. 일반적으로 말할 때 낮은 지연시간은 빠른 장치를 의미하게 됩니다.

LBA

Logical Block Addressing (논리 블록 주소지정) 의 약자로서 컴퓨터 저장 장치의 위치를 지정하는 방법입니다

LPM

Link Power Management (연결 정원 관리)의 약자로서 SATA의 특징 중 하나 입니다. 컴퓨터가 꺼졌을 때 SSD로 공급되는 전원을 줄여주는 역할을 합니다.

MLC

Multi-Level Cell (MLC) 플래시 메모리는 하나의 메모리 셀 당 2 비트의 데이터를 저장하여 4가지 상태의 동작을 할 수 있게 합니다. 이것은 적은 비용으로 많은 용량의 데이터를 사용할 수 있게 하며, MLC 플래시 메모리를 소비자용 SSD의 최적 솔루션이 되게 하였습니다.

mSATA

mSATA는 얇은 모듈처럼 생긴 마이크로 사이즈의 SSD입니다. 이것은 하드디스크를 대체하여 맥북에어와 같은 얇은 울트라 노트북용으로 설계되었습니다. (낮은 프로파일 또는 mini SATA 인터페이스를 사용하기 때문에 개체 자체를 mSATA라고 부릅니다.)

MTBF

데이터 오류 사이의 평균시간, 즉 HDD나 SSD에서 한 개의 데이터 오류가 일어나고 다음 오류 시까지의 평균 시간을 말합니다.  데이터 오류는 SSD 보다 HDD에서 더 자주 일어납니다.

NAND

NAND는 플래시 메모리를 의미하며 플래시 드라이브와 같은 것입니다. 사용자가 컴퓨터에서 플래서 드라이브를 빼 내어도 그 안에 저장된 정보는 유지 됩니다. 플래시 메모리 (NAND)는 이와 같이 전원을 제거하여도 그 안에 저장된 정보는 유지됩니다. 크루셜 SSD와 렉사 (Lexar) 플래시 드라이버에 사용되는 NAND는 마이크론사 제품으로서 전세계 가장 큰 NAND 제조사 중의 하나입니다.

Native Command Queuing (NCQ)

Native Command Queuing는 SATA 드라이브가 수행할 읽기/쓰기 명령의 순서를 최적화 하는 기능으로써 SSD의 전반적인 성능을 증가시켜 줍니다.

NTFS

New Technology File System의 약자로서 윈도우즈 시스템의 저장 장치에서 사용하는 표준 파일 시스템입니다.

OS

OS는 컴퓨터를 구동하는 operating system의 약자입니다. Windows, Mac OS, Windows XP, Window 7 등이 대표적인 OS 입니다.

파티션

파티션으로 알려진 디스크 파티션은 저장 드라이브의 공간을 몇 개의 분리된 데이터 영역으로 나누는 작업입니다. 데이터의 서랍장으로 생각해 봅시다. 데이터가 한 개의 저장 공간 즉 한 개의 서랍 내에 있다면 파티션은 서랍들을 나누는 나무로 생각하면 됩니다.

PATA

Parallel Advanced Technology Attachment의 약자로서 종래의 HDD, CD/DVD 및 플로피 디스크 드라이브 등을 컴퓨터 메인보드와 연결하는 구형 접속 표준입니다. 이것은 드라이브와 메인보드 둘 사이의 데이터를 흐르게 하는 역할 을 하므로 탯줄과 같은 것입니다. PATA 기술은 최근에 SATA 기술로 대부분 대체 되었습니다.

RAID

Redundant Array of Independent Disks의 약자로서 성능 향상과 보안 강화를 위하여 둘 또는 그 이상의 저장 장치를 엮어서 하나의 저장 장치로 사용하는 기능입니다.

Read (읽기)

컴퓨터 용어에서의 읽기는 저장 장치나 메모리에서 데이터 한 조각을 가져오는 것을 의미합니다.

S.M.A.R.T.

Self-Monitoring, Analysis, and Reporting Technology (SMART) 기술은 HDD나 SSD가 시스템 오류를 예견하고 피하기 위하여, 여러 가지 신뢰성에 대한 경고를 인식하고 보고하는 자체 모니터링 시스템 입니다.

SATA

Serial Advanced Technology Attachment의 약자로서 저장 장치나 광드라이브 등을 컴퓨터 메인보드와 연결하는 접속 표준입니다. 이것은 드라이브와 메인보드 둘 사이의 데이터를 흐르게 하는 역할 을 하므로 탯줄과 같은 것입니다. SATA는 장치와의 데이터 전송 속도로 표시되는데 SATA I (1.5Gb/s), SATA II (3.0Gb/s) 및 SATA III (6.0Gb/s) 세가지가 있습니다..

SLC

Single-Level Cell (SLC) 는 한 개의 메모리 셀에 한 개의 비트 데이터를 저장하여 두가지 상태의 동작을 하는 간단한 플래시 메모리입니다. 이 기술은 대규모 저장 솔루션에 많이 사용됩니다.

Speed (속도)

속도에는 주파수와 대역폭 두 가지 종류가 있습니다. 주파수는 일초에 데이터가 몇 사이클 움직일 수 있는지를 의미하는 데 일반적으로 초당 MHz로 표시 합니다. (1MHz = 1초당 백만 사이클) 대역폭은 시스템 선로(배관)를 통해 얼마나 많은 데이터가 공급되는가를 의미합니다. 큰 배관일수록 보다 많은 물을 한번에 공급할 수 있습니다. 일반적으로 대역폭은 초당 시스템이 수행할 수 있는 기가바이트의 수로 표시합니다.

SSD

Solid state drive 는 기존의 HDD를 대체하는 것으로서 플래시 메모리로 이루어져 있습니다. 기존의 HDD에 비해 빠를 뿐만 아니라 내구성이 있어 부팅시간을 단축시키고 전력을 절약할 수 있습니다. HDD와 달리 SSD는 움직이는 부품이 없어서 손상이나 부품 고장이 적습니다.

Storage
저장 장치

저장 장치는 HDD, SSD, 플래시 드라이브, CD 등, 데이터를 저장할 수 있는 장치를 말합니다.

SuperDuper

SuperDuper는 맥 HDD를 크루셜 SSD로 복제할 수 있는 소프트웨어로서 맥 OS 전용입니다.

Swapping (스와핑)

Swapping은 RAM이 모두 사용 중일 때 시스템이 HDD의 메모리 일부를 빌려올 때 일어납니다. Swapping은 가상 메모리를 의미합니다.

KB, MB, GB, TB

이들은 저장 장치나 메모리의 집적도를 나타내는 단위입니다. 1 킬로바이트(KB)는 1024바이트, 1 메가바이트(MB)는 1024KB, 1 기가바이트(GB)는 1024MB, 1 테라바이트(TB)는  1024GB 입니다. 대문자 B는 바이트이므로 1024 킬로 비트를 나타내는 Kb와 혼돈이 없기를 바랍니다. (KB가 Kb보다 8배 많음).

TRIM (트림)

트림 명령은 데이터 블록이 더 이상 사용 중이지 않으므로 OS가 SSD에 지시하여 내부적으로 제거될 수 있도록 합니다. 이러한 과정은 전체적으로 SSD의 효율을 증가시킵니다.
이것은 OS가 주관하는 Garbage Collection과 같은 것입니다.

Virtual Memory (가상메모리)

가상메모리는 RAM이 모두 사용 중일 때 시스템이 HDD의 메모리 일부를 빌려올 때 일어납니다. 가상 메모리를 swapping으로 되기도 합니다.

Wear Leveling

Wear Leveling은 플래시 기반의 장치 내에 모든 NAND 셀이 공평히 사용되도록 하는 기술로 메모리카드, 플래시 드라이브 및 SSD의 수명을 연장시켜 줍니다. 데이터들은 특정 영역의 셀에 저장되며 각각의 셀들은 제한된 수명을 가지고 있습니다. 만일 데이터 지속적으로 같은 셀에만 사용된다면 그 셀은 시간이 지나면서 점점 닳게 될 것입니다. Wear Leveling 기술은 데이터가 보다 공평히 분산되어 사용될 수 있도록 하여 셀이 닳아서 못쓰게 되는 상황을 없애 줍니다.

Write (쓰기)

컴퓨터 용어에서의 쓰기는 저장 장치나 메모리로 데이터 저장하는 것을 의미합니다 (서류 저장이 쓰기 기능의 하나의 예입니다.

반응형
Posted by 랩터 인터내셔널