무언가 데이터를 가지고 연산을 할 때, 연산을 해주는 것은 CPU로 알고 있다. 그러나 데이터들은 연산이 되고
어딘가에 저장이 되아야 한다.
저장 장치(스토리지)에는 우리가 어디서 들어본 RAM,SSD, 하드 디스크 등등 다양한 종류가 있다.
왜 저장 장치에 종류가 많은지에 대해서는 간단히 설명하면 속도와 가격이 저장 장치에 따라 다르기 때문이다.
비싼건 빠르고 저장 공간이 적고, 싼건 느리고 저장 공간이 많다.
근데 왜 하나의 저장 장치로 안 쓰고 여러 가지를 같이 사용하는 것일까? 만약 모든 데이터를 RAM 메모리에만
기억시킨다면 어떻게 될까? 아마 컴퓨터를 끄면 여러분의 소중한 동영상들은 사라질 것이다.
그럼 하드 디스크로만 쓴다면?? 아마 여러분의 동영상을 하나 가져오는데 한국인으로 참을 수 없는 시간이 걸릴 것이다.
이 문제점을 해결하기 위해 있는 것이 바로 Hierachical Storage Management : 계층적 기억장치 관리라고 하는데
가장 대표적인 그림은 위와 같다.
우리가 메인 메모리 라고 부르는 RAM은 휘발성이다. 즉 전원을 끄면 데이터가 날아간다. 그리고 우리가 하드라고 부르는 것이 하드 디스크 드라이브라고 하는데 이는 비휘발성 장치로 전원을 꺼도 데이터가 사라지지 않는다. 다만 위로 갈수록 빠르게 데이터를 접근해 가져오지만 내려갈수록 데이터 접근 시간이 오래린다. 당연히 용량도 크기가 반비례한다.
간단히 말해 위에 있는 저장장치일 수록 빠르고 용량이 작다. 또한 휘발성 장치는 빠르지만 데이터를 전원이 없이는 유지하지 못한다. 아래의 저장장치 일 수록 느리고 용량이 크다. 또한 비휘발성임으로 전원이 꺼져도 데이터는 유지된다.
위와 같은 데이터 저장소들의 특징 때문에 여러 계층으로 나누어 사용함으로 성능과 비용을 최적화한다. 자주 사용하고 일시적으로만 사용하는 데이터는 휘발성 장치에서 저장하여 빠르게 사용하고 전원이 꺼져도 그 데이터를 유지하고 싶으면 비 휘발성 저장장치에 내려보내는 방법으로 효율성을 극대화 시킨다.
그래서 여러분의 컴퓨터는 CPU 외에도 RAM과 HDD(하드 디스크) 등등이 같이 필요한 것이다.
심화
아무튼 서버는 데이터를 접근해 가져와야 되는데 이 스토리지 접근 방법에는 여러 방법이 존재한다.
그에 따라 장단점이 있기에 적절한 상황에 맞춰 접근법을 사용한다.
아래는 대표적인 3개의 접근방법 DAS,NAS,SAN을 보여주는 그림이다.
LAN: Local Area Network 로컬 영영 네트워크는 네트워크 매체를 이용하여 집, 사무실, 학교 등의 건물과 가까운 지역을 한대 묶는 컴퓨터 네트워크다. 이와 대조 되는건 광역 통신망.종류로는 이더넷과 TCP/IP가 일반적이다.
스토리지 시스템: 대용량 데이터를 저장하기 위하여 구성된 것
DAS(Direct Attacted Storage)
직접 연결 저장장치 란 서버 또는 컴퓨터에 네트워크를 거치지 않고 직접 연결되는 저장장치를 말하는 것으로, SAN,NAS 와 상반되는 네트워크에 연결되지 않은 저장장치란 뜻이다. 서버 자체를 물리적으로 외부 저장 장치에 연결하는 것이다.
DAS의 특징
연결 방식: DAS는 일반적으로 USB, SATA, SCSI 또는 Thunderbolt와 같은 표준 인터페이스를 사용하여 단일 컴퓨터 시스템에 직접 연결된다.
독립성: DAS는 네트워크에 의존하지 않으며, 연결된 컴퓨터나 서버만이 데이터에 접근할 수 있다.
구성: 외장 하드 드라이브, 내장 하드 드라이브, 솔리드 스테이트 드라이브(SSD) 또는 RAID (Redundant Array of Independent Disks) 시스템의 형태로 존재할 수 있다.
DAS의 장점
성능: 직접 연결로 인해 고속 데이터 전송과 낮은 지연 시간을 제공한다.
간편한 설치와 관리: 복잡한 네트워크 설정이 필요 없으며, 사용자가 쉽게 설치하고 관리할 수 있다.
비용 효율성: 네트워크 기반 솔루션에 비해 초기 설치 비용이 낮다.
보안: 직접 연결되어 있기 때문에, 네트워크 기반 공격에 덜 취약하다.
DAS의 단점
확장성 제한: 연결된 장치의 수에 한계가 있으며, 대규모 스토리지 요구사항을 충족시키기 어렵다.
공유의 어려움: 여러 사용자가 동시에 접근하거나 데이터를 공유하는 것이 어렵다.
유연성 부족: 하나의 컴퓨터나 서버에 종속되기 때문에, 네트워크 기반의 스토리지 솔루션보다 유연성이 떨어진다.
사용 예시
개인 사용자: 개인 컴퓨터의 추가 저장 공간으로 활용. 소규모 사무실: 서버에 연결된 백업 시스템이나 추가 스토리지로 사용. 특정 애플리케이션: 고성능을 요구하는 특정 애플리케이션에서 사용될 수 있음.
컴퓨터에 직접 연결하지 않고 네트워크를 통해 데이터를 주고 받는 저장장치이다. 현대에 들어와 점차 보급화가 되고 있는 클라우드서비스와 유사하다. NAS는 블록보다 상위 개념인 파일을 저장 단위로 사용한다. 따라서 계층구조를 가진다.
주요 프로토콜 HTTP,FTP 등
NAS의 특징
연결 방식: NAS는 네트워크에 연결되어 여러 사용자와 시스템이 접근할 수 있도록 한다. 주로 이더넷 연결을 통해 로컬 네트워크에 연결된다.
독립적인 운영 시스템: NAS는 자체 운영 시스템을 가지고 있어, 파일 서비스와 관련 기능을 제공한다.
저장 공간의 중앙화: 여러 사용자와 시스템이 공유할 수 있는 중앙화된 저장 공간을 제공한다.
NAS의 장점
쉬운 데이터 공유와 접근성: 네트워크를 통해 다양한 장치에서 데이터에 쉽게 접근하고 공유할 수 있다.
확장성: 필요에 따라 추가 스토리지를 네트워크에 쉽게 추가할 수 있다.
원격 접근 가능: 인터넷을 통해 어디서나 데이터에 접근할 수 있다.
NAS의 단점
네트워크 의존도: 네트워크 상태나 성능에 따라 속도와 접근성이 영향을 받을 수 있다.
속도: DAS에 비해 느리다. 대용량 입출력 발생시 네트워크 병목현상에 취약
보안: 로컬 저장소 보다 해킹에 취약
비용: 일반적인 DAS(Direct-Attached Storage)보다 초기 설치 및 유지 관리 비용이 더 높을 수 있다.
사용 예시
중소기업: 파일 서버로서 중요한 문서와 데이터를 중앙에서 관리한다. 홈 네트워크: 가정에서 미디어 파일을 저장하고 여러 장치에서 스트리밍한다.
SAN(Storage Area Network)
SAN (Storage Area Network)은 대규모 스토리지 환경에서 데이터를 관리하고 접근하는 데 사용된다. 이는 고성능의 전용 네트워크를 통해 서버와 스토리지 장치를 연결하는 시스템이다. SAN은 특히 대용량 데이터를 처리하는 대규모 기업이나 데이터 센터에서 선호된다.
SAN의 특징
고성능 네트워킹: SAN은 고속의 데이터 전송을 가능하게 하는 전용 네트워크를 사용한다.
중앙화된 데이터 저장: 데이터를 중앙에서 관리하고, 여러 서버가 공유할 수 있는 스토리지를 제공한다.
스케일러빌리티: SAN은 확장성이 뛰어나며, 필요에 따라 스토리지 용량을 쉽게 늘릴 수 있다.
서버가 fiber channel switch를 통하여 storage를 연결하는 기법
특수 목적용 고속 네트워크로 대규모 네트워크 사용자를 위해 서로 다른 종류의 저장장치를
데이터 서버와 연결하여 별도의 네트워크로 관리하는 시스템. LAN 대신광케이블을 사용한다.
저장장치를 향상시켜 장치가 로컬 연결장치로 서버의 운영 체제에 표시 되도록 한다.
DAS의 접속한계성을 극복하여, n개의서버가 m개의저장장치 접속 가능.
다수의 디스크 어레이, 테이프 라이브러리, 옵티컬 저장 매체 등으로 구성된다.
NAS와 다르게 파일이 아닌 블록 단위로 입출력을 함 호스트의 요청 시 블록을 재구성해 데이터전달하며
온라인 금융거래와 같이 빠른 속도를 요구하고 지연에 민감한 대규모 데이터 베이스에 적합하다.
SAN 스위치의 종류
Fibre Channel 스위치: 가장 일반적인 SAN 스위치로, 고성능 광섬유 채널을 사용하여 서버와 스토리지 간의 데이터 전송을 담당한다.
이더넷 기반 스위치: 일부 SAN은 이더넷 기반 스위치를 사용할 수도 있으며, 이는 iSCSI 프로토콜을 통해 데이터 스토리지 서비스를 제공한다.
브로케이드(Brocade)나 시스코(Cisco)와 같은 브랜드: 이들은 업계에서 널리 알려진 SAN 스위치 제조업체로, 다양한 성능 및 관리 기능을 갖춘 스위치를 제공한다.
SAN의 장점
전용네트워크(Fiber Channel)를 통한 고속 Disk I/O
여러 대의 서버가 Fiber Channel Switch를 통하여 하나의 스토리지 공유
성능 및 용량 확장성 좋음
가상화 구축하기 좋음
SAN의 단점
NAS에 비해구축 비용이 많이 들고시스템관리비용이 필요.
서로 다른 기기를 하나의 SAN에 연결하고자 하면 별도의 관리가 필요.
공유 가능한 파일시스템과 데이터형식이 제한되어 있음
Fiber channel의 거리 제약성 (10Km 이내)→ IP SAN 은 IP네트워크로 이 문제를 해결
사용 예시
대규모 기업: 데이터 센터에서 다양한 서버와 애플리케이션의 데이터를 관리한다. 고성능 컴퓨팅 환경: 과학적 연구나 대규모 분석 작업에서 대량의 데이터를 빠르게 처리한다.