스토리지 개념 및 종류
- 스토리지: 저장장치를 다수 장착한 대용량 고속 저장 장비로 서버 및 클라이언트와 네트워크로 연결해서 사용
- 저장장치: 컴퓨터의 데이터를 저장하기 위한 비 휘발성의 기억 장치
- 스토리지는 데이터 저장뿐만 아니라 데이터 공유 목적으로 주로 사용됨
- 서버에 장착된 디스크 용량이 부족할 경우, 다수의 사람들과 데이터를 공유할 필요가 있을 경우 스토리지를 활용
- 데이터 관리 및 보호를 위한 별도의 소프트웨어 탑재
RAID
- 스토리지 데이터 저장 방식: RAID, Redundant Array of Inexpensive/Independent Disks
- 비싸지 않은/독립적인 다수의 디스크들의 배열, 집합
- 여러 개의 디스크를 하나의 디스크 모듈로 구성, 디스크 읽기/쓰기 성능 향상 및 장애 발생 시 원활한 복구를 위해 사용
※ RAID - 다수의 디스크를 마치 하나의 디스크처럼 사용할 수 있게 해주는 기술
- 대표적인 RAID 방식 #1: RAID 0, RAID 1
- RAID 0: 데이터를 여러 디스크에 분산 저장하여 하나의 디스크처럼 사용, 성능이 좋지만 장애 시 데이터는 모두 손실됨
- 100MB 데이터를 25MB 4개로 나눠서 저장, 속도는 4배 빠르지만 1개만 고장나도 데이터 읽기 불가
- 데이터를 여러 디스크에 분산 저장
- 같은 용량의 디스크로 구성
- 빠른 성능 / 장애 시 데이터 모두 손실됨
- RAID 1: 데이터를 다른 디스크에 동일하게 중복 저장하여 안정성이 높지만 비용이 많이 듬
- 총 4TB 디스크를 각각 2TB로 미러링해서 사용, 실제 용량은 2TB
- 데이터를 다른 디스크에 동일하게 중복 저장
- 최소 2개 디스크 필요, 필요한 용량의 2배 준비
- 장애 대비에 유리하나 비용이 비쌈
- RAID 0 vs RAID 1
방식 | 장점 | 단점 |
RAID 0 | 분산 저장으로 인해 읽기/쓰기 성능이 빠름 | 분산 저장으로 인해 디스크 1개만 고장나도 데이터 읽기 불가 |
RAID 1 | 미러링으로 인해 1개 고장나도 사용 가능 (2개 중 1개는 백업 용도 - 장애 대비 유리) | 미러링으로 인해 전체 용량의 50% 용량만 사용 가능 |
- 대표적인 RAID 방식 #2: RAID 5, RAID 6
- RAID 5: 디스크에 패리티 정보를 저장해 장애 시 패리티를 토대로 복구할 수 있음, 일정 수준의 성능과 안정성 확보
※ Parity(패리티): 데이터의 무결성과 복구를 위한 오류 검출 및 복구 정보, 디스크 장애 발생 시 데이터 복구할 수 있도록 도와줌
- 디스크마다 Parity(패리티) 정보 저장
- 디스크 장애 시 Parity 정보를 토대로 복구 가능
- 최소 3개 디스크 필요, 보통 5개 이상 사용
- RAID 6: RAID 5 방식에 패리티를 하나 더 추가하여 안정성을 더욱 향상시킨 방법
- RAID 5와 비슷하나 Parity 정보를 하나 더 저장
- RAID 5 구조에 데이터 복구 능력을 향상시킨 형태
- 그래서 성능은 RAID 5보다 조금 떨어짐
- 디스크 최소 4개 필요
- RAID 5 vs RAID 6
방식 | 장점 | 단점 |
RAID 5 | 디스크에 패리티 정보를 저장해 장애 시 복구 가능(1개 디스크가 실패해도 데이터 복구 가능) | 쓰기 작업 시 패리티 계산으로 인한 성능 저하 |
RAID 6 | 디스크에 패리티 정보를 하나 더 저장해 장애 시 복구 가능(RAID 5 대비 복구 능력 향상 - 2개 디스크가 동시에 실패해도 데이터 복구 가능) | RAID 5보다 읽기/쓰기 성능 떨어짐, RAID 5보다 더 높은 용량 손실 |
- 대표적인 RAID 방식 #3: RAID 1+0
- RAID 1+0: RAID 0의 높은 성능과 RAID 1의 뛰어난 안정성을 합친 형태
- RAID 0의 고성능 + RAID 1의 복구 능력을 합친 형태
- 쓰기는 디스크 2개 성능, 읽기는 디스크 4개 성능 발휘
- 전체 용량의 50%만 사용 가능
- 최소 4개 디스크 필요
※ 최하위 디스크 2개씩 미러링 후 스트라이핑 = 높은 성능 + 안정성
JBOD
- JBOD: Just a Brunch of Disks(Drives), 2개 이상의 디스크를 하나의 디스크처럼 만들어 주는 것(Non-RAID)
- 여러 디스크의 용량을 단순히 이어 붙인 것으로, RAID 0과 같이 다수의 디스크를 사용한다고 성능이 향상되지 않음
- 과거 디스크 용량이 작았을 때 개별 디스크 용량보다 더 큰 용량의 데이터를 저장하기 위해 사용함
- 구성된 디스크의 데이터가 가득차면 다음 디스크에 데이터를 기록하는 형태
- 기존에 사용하던 스토리지의 용량을 늘리기 위해 디스크를 더 꽂을 수 없을 경우, 스토리지 하드웨어를 추가해 기존의 스토리지와 연경하는 용도로 주로 사용됨
- JBOD로 연결하는 디스크의 용량이 같지 않아도 됨
- 디스크에 동시에 접근하지 않기 때문에 성능이 향상되지 않음
- 최초 구성한 스토리지 성능은 변하지 않으며, 용량만 늘어나는 형태
- RAID 0과는 달리, 디스크 장애 시 일부 복구 가능(최대 50%)
스토리지 종류
- 스토리지 종류: DAS(Direct Attached Storage), 직접 연결한 스토리지
- 서버와 클라이언트가 전용 케이블로 연결한 스토리지, 서버와 직접 연결하는 외장하드
- 전송 속도가 빠르고, 스토리지와 연결된 서버에서 개별적인 파일 시스템을 사용해 관리
- DAS에 연결된 서버별로 관리해야 함, 3개 서버면 3개를 개별 관리(통합 관리 어려움), 서버에 부족한 저장 공간을 스토리지에 가져다가 쓴다.
- 스토리지 종류: NAS(Network Attached Storage)
- 데이터 공유를 위한 파일 서버 용도로 주로 사용되며 파일 스토리지라고도 불림
- 스토리지 전용 OS로 데이터를 관리하는 독립적 다기능 스토리지
- 네트워크로 파일 공유
- NAS 자체가 메인보드, CPU, RAM, 스토리지를 갖춘 하나의 서버 역할을 수행하기에 파일 공유뿐만 아니라 다양한 서버 용도로 사용할 수 있음(멀티미디어 파일 재생, 웹사이트 운영 등)
- 스토리지가 하나의 네트워크 공유 드라이브로 독립적으로 동작
- 클라이언트가 데이터에 접근하기 위해서는 반드시 네트워크 스위치를 거쳐 NAS에 접근해야 하기에 DAS 보다 데이터 전송 속도가 느림
데이터 전송 순서
1. 클라이언트 → 스위치
2. 스위치 → NAS
3. NAS → 스위치
4. 스위치 → 클라이언트
- 서버 역시 데이터에 접근하기 위해서는 반드시 네트워크 스위치를 거쳐 NAS에 접근해야 하기에 DAS보다 데이터 전송 속도가 느림
데이터 전송 순서
1. 서버 → 스위치
2. 스위치 → NAS
3. NAS → 스위치
4. 스위치 → 서버
- 클라이언트가 서버에서 구동되는 애플리케이션의 데이터에 접근할 경우, 서버는 네트워크 스위치를 통해 NAS에 접근해서 데이터를 찾아 클라이언트에게 전달함
데이터 전송 순서
1. 클라이언트 → 스위치
2. 스위치 → 서버
3. 서버 → 스위치
4. 스위치 → NAS
5. NAS → 스위치
6. 스위치 → 클라이언트
- 스토리지 종류: SAN(Storage Area Network)
- 대용량의 데이터를 네트워크를 통해 빠른 속도로 전송할 수 있는 고성능 스토리지
- 일반적인 이더넷 네트워크(UTP 케이블, LAN)가 아닌 FC(Fiber Channel 광케이블)을 사용해 SAN으로 연결하며, 고성능을 요구하는 시스템의 전용 스토리지로 사용
- 이더넷 네트워크 스위치가 아닌 SAN 스위치에 연결하여 사용
- 스토리지 단독으로는 데이터 저장만 가능하며 읽기/쓰기 작업을 할 수 없음
- 반드시 서버와 연결해야 읽기/쓰기 작업이 가능한 서버 종속성 스토리지로 블록 스토리지라고도 불림
- 마치 PC에 디스크를 하나 더 꽂은 것처럼, 블록 스토리지가 서버의 자체 디스크처럼 동작
- 클라이언트에서 스토리지에 데이터를 읽거나 쓰기 위해서는 반드시 서버가 필요(서버 종속성 스토리지)
- FC 네트워크는 이더넷 네트워크보다 성능이 뛰어남 → NAS보다 데이터 전송 속도가 빠름
- 이더넷 스위치 성능(1Gbps, 10Gbps) vs SAN 스위치 성능(8Gbps, 16Gbps, 32Gbps)
- 스토리지 유형: 파일 스토리지, 블록 스토리지, 오브젝트 스토리지
- 데이터 유형: 정형 데이터, 비정형 데이터
- 정형(Structured) 데이터: 미리 정해 놓은 형식과 구조에 따라 고정된 필드에 저장된 텍스트 형태의 데이터(엑셀)
- 비정형(Unstructured) 데이터: 식별 가능한, 미리 정의된 구조가 없는 사진, 음성, 동영상, PDF 파일 등의 데이터
SAN → 정형 데이터
NAS → 비정형 데이터
백업 개념 및 종류
- 백업(Backup): 데이터를 임시로 다른 장치에 저장하여 문제가 있을 때 복구(Recovery)할 수 있도록 준비해 두는 것
- 전체 백업(Full Backup): 백업 주기마다 데이터 전체를 백업
- 차등 백업(Differential Backup): 마지막 전체 백업 이후에 추가/변경된 데이터를 모두 포함하여 백업
- 증분 백업(Incremental Backup): 마지막 전체 백업 이후에 추가/변경된 데이터만 백업
- 전체 백업
- 차등 백업
- 증분 백업
스냅샷
- 스냅샷: Snapshot, 마치 사진 찍듯이 특정 시점에 스토리지의 파일 시스템을 포착해 보관하는 기술 = 특정 시점의 데이터 복사본
- Copy-on-write 스냅샷: 쓰기(Write) 작업 발생 시 스냅샷 공간으로 복제(Copy) 후 해당 복제본을 원본에 덮어씀
- 별도의 스냅샷 공간은 일반적으로 전체 스토리지 용량의 20% 이내로 할당
- 데이터가 변경될 때 한번 복제 후 데이터 쓰기 수행 → 읽기 x 1, 쓰기 x 2
- 스냅샷: Snapshot, 마치 사진 찍듯이 특정 시점에 스토리지의 파일 시스템을 포착해 보관하는 기술 = 특정 시점의 데이터 복사본
- Redirect-on-write 스냅샷: 쓰기(Write) 작업 발생 시 새로운 공간으로 쓰기 위치를 재지정(Redirect)
- 데이터 변경될 때 그곳에 바로 데이터 쓰기 수행 → 쓰기 x 1
- 스냅샷 = 원본 데이터, 원본 데이터 B를 얼림
- 스냅샷 = 원본 데이터, 원본 데이터 B는 냅두고 B1에 데이터 쓰기
- COW(Copy on write) 보다 ROW(Redirect on write)가 스토리지 성능이 좋다.
- 백업 하드웨어: 백업 및 복구를 위한 전용 스토리지
- 하드웨어 + 소프트웨어 동시 제공, 가격 비쌈, 성능 우수
- iPhone = 애플 하드웨어 + 애플 OS
- 백업 소프트웨어: 백업 및 복구를 위한 전용 소프트웨어
- 소프트웨어만 구매하여 기존에 가지고 있는 다른 회사의 하드웨어 활용 가능, 비용 절감
- 갤럭시 = 삼성 하드웨어 + 구글 안드로이드 OS
참고
https://webcodur.tistory.com/23
'IT 지식 > IT 인프라 기초' 카테고리의 다른 글
클라우드 (0) | 2025.05.21 |
---|---|
온프레미스 (0) | 2025.05.12 |
데이터베이스 (0) | 2025.05.09 |
네트워크의 정의 및 역할 (1) | 2025.04.26 |
서버의 정의 및 역할 (0) | 2025.04.18 |