IT 지식/IT 인프라 기초

스토리지와 백업

Security Engineer 2025. 5. 7. 22:00

스토리지 개념 및 종류

- 스토리지: 저장장치를 다수 장착한 대용량 고속 저장 장비로 서버 및 클라이언트와 네트워크로 연결해서 사용

- 저장장치: 컴퓨터의 데이터를 저장하기 위한 비 휘발성의 기억 장치

 

 

- 스토리지는 데이터 저장뿐만 아니라 데이터 공유 목적으로 주로 사용됨

- 서버에 장착된 디스크 용량이 부족할 경우, 다수의 사람들과 데이터를 공유할 필요가 있을 경우 스토리지를 활용

- 데이터 관리 및 보호를 위한 별도의 소프트웨어 탑재

 

RAID

- 스토리지 데이터 저장 방식: RAID, Redundant Array of Inexpensive/Independent Disks

- 비싸지 않은/독립적인 다수의 디스크들의 배열, 집합

- 여러 개의 디스크를 하나의 디스크 모듈로 구성, 디스크 읽기/쓰기 성능 향상 및 장애 발생 시 원활한 복구를 위해 사용

※ RAID - 다수의 디스크를 마치 하나의 디스크처럼 사용할 수 있게 해주는 기술

 

 

- 대표적인 RAID 방식 #1: RAID 0, RAID 1

- RAID 0: 데이터를 여러 디스크에 분산 저장하여 하나의 디스크처럼 사용, 성능이 좋지만 장애 시 데이터는 모두 손실

- 100MB 데이터를 25MB 4개로 나눠서 저장, 속도는 4배 빠르지만 1개만 고장나도 데이터 읽기 불가

- 데이터를 여러 디스크에 분산 저장

- 같은 용량의 디스크로 구성

- 빠른 성능 / 장애 시 데이터 모두 손실됨

 

 

- RAID 1: 데이터를 다른 디스크에 동일하게 중복 저장하여 안정성이 높지만 비용이 많이 듬

- 총 4TB 디스크를 각각 2TB로 미러링해서 사용, 실제 용량은 2TB 

- 데이터를 다른 디스크에 동일하게 중복 저장

- 최소 2개 디스크 필요, 필요한 용량의 2배 준비

- 장애 대비에 유리하나 비용이 비쌈

 

 

- RAID 0 vs RAID 1

방식 장점 단점
RAID 0 분산 저장으로 인해 읽기/쓰기 성능이 빠름 분산 저장으로 인해 디스크 1개만 고장나도 데이터 읽기 불가
RAID 1 미러링으로 인해 1개 고장나도 사용 가능 (2개 중 1개는 백업 용도 - 장애 대비 유리) 미러링으로 인해 전체 용량의 50% 용량만 사용 가능

 

 

- 대표적인 RAID 방식 #2: RAID 5, RAID 6

- RAID 5: 디스크에 패리티 정보를 저장해 장애 시 패리티를 토대로 복구할 수 있음, 일정 수준의 성능과 안정성 확보

※ Parity(패리티):  데이터의 무결성과 복구를 위한 오류 검출 및 복구 정보, 디스크 장애 발생 시 데이터 복구할 수 있도록 도와줌

- 디스크마다 Parity(패리티) 정보 저장

- 디스크 장애 시 Parity 정보를 토대로 복구 가능

- 최소 3개 디스크 필요, 보통 5개 이상 사용

 

 

- RAID 6: RAID 5 방식에 패리티를 하나 더 추가하여 안정성을 더욱 향상시킨 방법

- RAID 5와 비슷하나 Parity 정보를 하나 더 저장

- RAID 5 구조에 데이터 복구 능력을 향상시킨 형태

- 그래서 성능은 RAID 5보다 조금 떨어짐

- 디스크 최소 4개 필요

 

 

- RAID 5 vs RAID 6

방식 장점 단점
RAID 5 디스크에 패리티 정보를 저장해 장애 시 복구 가능(1개 디스크가 실패해도 데이터 복구 가능) 쓰기 작업 시 패리티 계산으로 인한 성능 저하
RAID 6 디스크에 패리티 정보를 하나 더 저장해 장애 시 복구 가능(RAID 5 대비 복구 능력 향상 - 2개 디스크가 동시에 실패해도 데이터 복구 가능) RAID 5보다 읽기/쓰기 성능 떨어짐, RAID 5보다 더 높은 용량 손실

 

 

- 대표적인 RAID 방식 #3: RAID 1+0

- RAID 1+0: RAID 0의 높은 성능과 RAID 1의 뛰어난 안정성을 합친 형태

- RAID 0의 고성능 + RAID 1의 복구 능력을 합친 형태

- 쓰기는 디스크 2개 성능, 읽기는 디스크 4개 성능 발휘

- 전체 용량의 50%만 사용 가능

- 최소 4개 디스크 필요

※ 최하위 디스크 2개씩 미러링 후 스트라이핑 = 높은 성능 + 안정성

 

 

JBOD

- JBOD: Just a Brunch of Disks(Drives), 2개 이상의 디스크를 하나의 디스크처럼 만들어 주는 것(Non-RAID)

- 여러 디스크의 용량을 단순히 이어 붙인 것으로, RAID 0과 같이 다수의 디스크를 사용한다고 성능이 향상되지 않음

- 과거 디스크 용량이 작았을 때 개별 디스크 용량보다 더 큰 용량의 데이터를 저장하기 위해 사용함

- 구성된 디스크의 데이터가 가득차면 다음 디스크에 데이터를 기록하는 형태

- 기존에 사용하던 스토리지의 용량을 늘리기 위해 디스크를 더 꽂을 수 없을 경우, 스토리지 하드웨어를 추가해 기존의 스토리지와 연경하는 용도로 주로 사용됨

- JBOD로 연결하는 디스크의 용량이 같지 않아도 됨

- 디스크에 동시에 접근하지 않기 때문에 성능이 향상되지 않음

- 최초 구성한 스토리지 성능은 변하지 않으며, 용량만 늘어나는 형태

- RAID 0과는 달리, 디스크 장애 시 일부 복구 가능(최대 50%)

 

 

스토리지 종류

- 스토리지 종류: DAS(Direct Attached Storage), 직접 연결한 스토리지

- 서버와 클라이언트가 전용 케이블로 연결한 스토리지, 서버와 직접 연결하는 외장하드

- 전송 속도가 빠르고, 스토리지와 연결된 서버에서 개별적인 파일 시스템을 사용해 관리

- DAS에 연결된 서버별로 관리해야 함, 3개 서버면 3개를 개별 관리(통합 관리 어려움), 서버에 부족한 저장 공간을 스토리지에 가져다가 쓴다.

 

 

- 스토리지 종류: NAS(Network Attached Storage)

- 데이터 공유를 위한 파일 서버 용도로 주로 사용되며 파일 스토리지라고도 불림

- 스토리지 전용 OS로 데이터를 관리하는 독립적 다기능 스토리지

- 네트워크로 파일 공유

 

 

- NAS 자체가 메인보드, CPU, RAM, 스토리지를 갖춘 하나의 서버 역할을 수행하기에 파일 공유뿐만 아니라 다양한 서버 용도로 사용할 수 있음(멀티미디어 파일 재생, 웹사이트 운영 등)

- 스토리지가 하나의 네트워크 공유 드라이브로 독립적으로 동작

 

 

- 클라이언트가 데이터에 접근하기 위해서는 반드시 네트워크 스위치를 거쳐 NAS에 접근해야 하기에 DAS 보다 데이터 전송 속도가 느림

데이터 전송 순서

1. 클라이언트 → 스위치

2. 스위치 → NAS

3. NAS → 스위치

4. 스위치 → 클라이언트

 

 

- 서버 역시 데이터에 접근하기 위해서는 반드시 네트워크 스위치를 거쳐 NAS에 접근해야 하기에 DAS보다 데이터 전송 속도가 느림

데이터 전송 순서

1. 서버 → 스위치

2. 스위치 → NAS

3. NAS → 스위치

4. 스위치 → 서버

 

 

- 클라이언트가 서버에서 구동되는 애플리케이션의 데이터에 접근할 경우, 서버는 네트워크 스위치를 통해 NAS에 접근해서 데이터를 찾아 클라이언트에게 전달함

데이터 전송 순서

1. 클라이언트 → 스위치

2. 스위치 → 서버

3. 서버 → 스위치

4. 스위치 → NAS

5. NAS → 스위치

6. 스위치 → 클라이언트

 

 

- 스토리지 종류: SAN(Storage Area Network)

- 대용량의 데이터를 네트워크를 통해 빠른 속도로 전송할 수 있는 고성능 스토리지

- 일반적인 이더넷 네트워크(UTP 케이블, LAN)가 아닌 FC(Fiber Channel 광케이블)을 사용해 SAN으로 연결하며, 고성능을 요구하는 시스템의 전용 스토리지로 사용

- 이더넷 네트워크 스위치가 아닌 SAN 스위치에 연결하여 사용

 

 

- 스토리지 단독으로는 데이터 저장만 가능하며 읽기/쓰기 작업을 할 수 없음

- 반드시 서버와 연결해야 읽기/쓰기 작업이 가능한 서버 종속성 스토리지로 블록 스토리지라고도 불림

- 마치 PC에 디스크를 하나 더 꽂은 것처럼, 블록 스토리지가 서버의 자체 디스크처럼 동작

 

 

- 클라이언트에서 스토리지에 데이터를 읽거나 쓰기 위해서는 반드시 서버가 필요(서버 종속성 스토리지)

- FC 네트워크는 이더넷 네트워크보다 성능이 뛰어남 → NAS보다 데이터 전송 속도가 빠름

- 이더넷 스위치 성능(1Gbps, 10Gbps) vs SAN 스위치 성능(8Gbps, 16Gbps, 32Gbps)

 

 

- 스토리지 유형: 파일 스토리지, 블록 스토리지, 오브젝트 스토리지

 

 

- 데이터 유형: 정형 데이터, 비정형 데이터

- 정형(Structured) 데이터: 미리 정해 놓은 형식과 구조에 따라 고정된 필드에 저장된 텍스트 형태의 데이터(엑셀)

- 비정형(Unstructured) 데이터: 식별 가능한, 미리 정의된 구조가 없는 사진, 음성, 동영상, PDF 파일 등의 데이터

SAN → 정형 데이터

NAS → 비정형 데이터

 

 

백업 개념 및 종류

- 백업(Backup): 데이터를 임시로 다른 장치에 저장하여 문제가 있을 때 복구(Recovery)할 수 있도록 준비해 두는 것

- 전체 백업(Full Backup): 백업 주기마다 데이터 전체를 백업

- 차등 백업(Differential Backup): 마지막 전체 백업 이후에 추가/변경된 데이터를 모두 포함하여 백업

- 증분 백업(Incremental Backup): 마지막 전체 백업 이후에 추가/변경된 데이터만 백업

 

- 전체 백업

 

 

- 차등 백업

 

 

- 증분 백업

 

 

스냅샷

- 스냅샷: Snapshot, 마치 사진 찍듯이 특정 시점에 스토리지의 파일 시스템을 포착해 보관하는 기술 = 특정 시점의 데이터 복사본

- Copy-on-write 스냅샷: 쓰기(Write) 작업 발생 시 스냅샷 공간으로 복제(Copy) 후 해당 복제본을 원본에 덮어씀

- 별도의 스냅샷 공간은 일반적으로 전체 스토리지 용량의 20% 이내로 할당

- 데이터가 변경될 때 한번 복제 후 데이터 쓰기 수행 → 읽기 x 1, 쓰기 x 2

 

 

- 스냅샷: Snapshot, 마치 사진 찍듯이 특정 시점에 스토리지의 파일 시스템을 포착해 보관하는 기술 = 특정 시점의 데이터 복사본

- Redirect-on-write 스냅샷: 쓰기(Write) 작업 발생 시 새로운 공간으로 쓰기 위치를 재지정(Redirect)

- 데이터 변경될 때 그곳에 바로 데이터 쓰기 수행 → 쓰기 x 1

 

- 스냅샷 = 원본 데이터, 원본 데이터 B를 얼림

 

- 스냅샷 = 원본 데이터, 원본 데이터 B는 냅두고 B1에 데이터 쓰기 

- COW(Copy on write) 보다 ROW(Redirect on write)가 스토리지 성능이 좋다.

 

 

- 백업 하드웨어: 백업 및 복구를 위한 전용 스토리지

- 하드웨어 + 소프트웨어 동시 제공, 가격 비쌈, 성능 우수

- iPhone = 애플 하드웨어 + 애플 OS

 

 

- 백업 소프트웨어: 백업 및 복구를 위한 전용 소프트웨어

- 소프트웨어만 구매하여 기존에 가지고 있는 다른 회사의 하드웨어 활용 가능, 비용 절감

- 갤럭시 = 삼성 하드웨어 + 구글 안드로이드 OS

 

 

 

 

 

 

 

 

 

 

참고

https://www.inflearn.com/course/%EB%88%84%EA%B5%AC%EB%82%98-%EC%89%BD%EA%B2%8C-%EC%9D%B4%ED%95%B4%ED%95%98%EB%8A%94-it-%EC%9D%B8%ED%94%84%EB%9D%BC-%EA%B8%B0%EC%B4%88

 

 

https://webcodur.tistory.com/23

 

https://shuu.tistory.com/48