본문 바로가기
네트워크 (LAN,WAN)

NAS 백업/복구 및 DR 구성 방안

by 날으는물고기 2009. 1. 14.

NAS 백업/복구 및 DR 구성 방안

출처 : NETWORK TIMES 

NDMP 프로토콜로 백업 용이
NAS G/W 활용한 랜 프리 백업 유용
D2D 백업 원격지 복제 등 NAS 기반 데이터 보호 방안 시선집중


오늘날 대부분의 전산 업무는 온라인 중심으로 변화됐으며, 24×365 시스템의 구축을 요구하고 있다. 또 하나는 이와 같이 만들어진 전산 환경에 대해 여러 가지 자연, 인위적인 재해로부터 보호받기 위해 미러링 솔루션으로 원격지 복제 시스템을 운용한다. 이것은 과거와 달리 시설투자에 2배 이상의 비용이 들어가는 것을 의미하고, 관리도 그만큼 복잡해지는 것을 뜻한다. 이처럼 점점 복잡해지는 IT 환경을 어떻게 하면 쉽게 관리할 수 있을까 하는 것이 풀어야할 숙제다. 이 글에서는 NAS를 통한 DR 구성에 대해 살펴보자.
이용상 한국IBM 스토리지 사업본부 부장·yongsang@kr.ibm.com


요즘은 홈쇼핑에서도 NAS(Network Attached Storage)를 팔고 있다. 기업용이 아닌 개인용 네트워크 스토리지가 그것이다. 150GB, 300GB 등 개인이 사용하는 용량치고는 제법 크다. 과거 몇 년 전에는 소규모 기업이나 그룹에서 사용하는 만큼의 용량을 개인용으로 사용하고 있는 것이다. IT 기술의 발전으로 고성능, 고용량의 스토리지를 훨씬 저렴한 가격으로 구입이 가능한 세상이 됐다.
90년대에 NC(Network Computing)가 등장하면서 네트워크 스토리지가 각광을 받을 것으로 예상했지만 바로 유행을 타지는 못했다. 그러다가 90년 후반에 접어들면서 NAS가 등장하게 됐는데. NAS는 용어 자체에서 느낄 수 있는 것처럼 네크워크 상에 스토리지를 접속해서 여러 사용자가 데이터를 고속으로 공유할 수 있게 하는 네트워크를 이용한 저장방식이다. 스토리지를 서버에 직접 붙여 운영하는 DAS(Direct Attached Storage)보다 한 단계 진보된 스토리지라고 보면 맞을 것 같다.


NAS의 등장 배경
현시점에서 NAS를 언급하는 것은 약간 지나간 얘기를 하는 것 같지만 오늘날 IT 환경이 SAN(Storage Area Network)을 통한 서버와 스토리지의 통합을 하고 있는 것이 한참인 시점에서 놓고 보았을 때, 그 중간 과정쯤 된다고 보면 될 것 같다.
NAS가 나오게된 배경을 살펴보면 지금 인터넷망의 근간인 TCP/IP(Transmission Control Protocol/Internet Protocol)의 발전에 따른 산출물 중 하나라고 볼 수 있다. TCP/IP는 美 국방성의 전산망인(ARPAT)에서 개발된 프로토콜 중의 하나다. 1983년 ARPAT를 TCP/IP로 대체했고, 현재의 오픈 운영 체계인 유닉스에서 TCP/IP를 기본으로 채택하게 됨에 따라 급속도로 발전하고 보급됐다.
통신 기술의 발전으로 최근에는 기가비트가 지원되는 NAS 제품들이 출시돼 파이버 채널(100MB)을 이용하는 SAN과 시장에서 경합을 벌이고 있다. 그러나 TCP/IP를 프로토콜로 사용하는 이더넷 상에서의 데이터 이동은 트래픽이 몰릴 경우 병목현상(Bottleneck) 등의 문제가 있어, SAN과의 경합에서 불리한 위치에 있다고 볼 수 있다. 실제로 고객은 해당 기업의 규모, 투자 비용 등을 고려해 IT 환경을 NAS와 SAN으로 이원화시켜 가져가는 경우가 많다.



DAS-NAS-SAN
과거에는 개인용 PC건 기업용 대형 호스트건 스토리지를 직접 서버에 붙여 운영하는 것이 대부분이었다. 이와 같이 스토리지와 서버간에 SCSI(Small Computer System Interface: 주변기기를 붙이기 위한 직렬 표준 인터페이스) , FC(Fiber Channel: 광전송 방식), ESCON(Enterprise System CONnection: IBM의 메인프레임용 인터페이스) 등의 매개체를 통해 붙여 사용한 것이 DAS 방식이다.
그러나 DAS 방식은 스토리지가 붙어있는 해당 서버에서만 붙어 있는 스토리지를 사용할 수 있는 제약점이 있었다. 그러다가 이더넷의 발달로 TCP/IP 네트워크상에 고속의 I/O 처리가 가능한 NAS를 붙여 사용할 수 있게 됐다. NAS는 이더넷 상에 손쉽게 붙일 수 있다는 것이 장점이고, 단점으로는 파일 단위로 I/O를 하므로 블록 단위로 I/O를 하는 SAN에 비해서는 성능이 떨어질 수밖에 없다. 그리고 이더넷 상에 많은 클라이언트와 서버가 물려 있을 경우 동일한 네트워크를 이용해 데이터가 왔다갔다해야 하므로 I/O 트래픽이 심한 경우 네트워크의 병목현상이 발생해 성능의 저하를 가져올 수 있다.
이것을 해소하기 위해 기가비트가 지원되는 NAS 제품들이 나와있기는 하지만 근본적인 치유책이 될 수는 없다. 이러한 문제들을 보완하기 위한 솔루션인 SAN은 고속의 스위치를 이용 서버, 스토리지간에 FC를 이용한 고속 통신을 보장함으로서 이더넷을 데이터 통신의 경로로 사용하고 있는 NAS와는 달리 병목 현상이 생기는 것을 방지할 수 있다. 또 한편 스토리지 풀(Pool) 구성이 가능해 서버 사이에 SAN 네트워크에 연결돼 있는 모든 스토리지를 공유해 사용할 수 있다는 장점이 있다. 요즈음에는 이러한 SAN을 통해 스토리지를 통합해 복잡한 IT환경을 단편화해 나가는 것이 추세다.

iSCSI
iSCSI(internet Small Computer Systems Interface)는 스토리지와 IP 네트워크를 통합하기 위한 프로토콜이라고 이해하면 쉽다. 즉 IP 네트워크상에서 SCSI 커맨드 상태로 블록 단위로 I/O를 일으키기 때문에, 마치 DAS와 같은 형태로 스토리지를 네트워크에 붙여서 사용하는 것이라고 볼 수 있다. iSCSI는 전송 매체가 SCSI 형태로 날아다니므로 컨버전(conversion) 작업이 따로 필요하지 않아 NAS 방식의 스토리지에 비해 속도가 빠르다. 그리고 SAN과의 인터페이스가 가능해 IP와 SAN간의 통신을 할 수 있는 환경을 제공함으로서 운용의 폭을 넓힐 수 있는 장점이 있다.

NAS vs. NAS 게이트웨이
NAS와 NAS 게이트웨이간의 차이는 <그림 1>에서와 같이 NAS에 들어있는 스토리지와 컨트롤러 대신에 SAN과의 인터페이스를 제공한다는 것이다. 그러므로 이더넷에 붙여서 NAS로서의 서비스를 클라이언트 쪽에 해주면서도 실제 스토리지는 SAN을 통해 공급받은 스토리지 풀(Pool)에서 제공받을 수 있는 이점이 있다.
그리고 확장성 면에서도 NAS는 스토리지 공간이 필요할 때마다 NAS를 계속 붙여서 확장을 해야 하지만, NAS 게이트웨이에서는 SAN 스토리지 풀에서 필요할 때마다 언제든지 스토리지 공간을 공급받을 수 있다. 최근 추세는 점차 NAS에서 NAS 게이트웨이로 바뀌어 가고 있으며, 이를 통해 IP와 SAN간에 통합을 시도한다.
<그림 2>는 NAS 어플라이언스의 구성도로, NAS 스토리지 공간을 확장하기 위해서는 NAS를 계속 늘려가야 하는 구조다. 반면 <그림 3>은 NAS 게이트웨이 구성도로, SAN 스토리지 풀을 바라볼 수 있어 스토리지의 증설이 필요할 때 NAS 자체의 스토리지를 확장하는 것이 아니라, SAN 스토리지 풀에 디스크들을 추가한 후 NAS 게이트웨이에 할당해 주면 된다. 따라서 스토리지 확장성이 좋고 IP와 SAN간에 통신을 해 줌으로서 IP와 SAN의 통합을 이뤄낼 수 있다.


NAS를 통한 DR 방안
지금까지는 NAS의 기본 개념과 다른 솔루션과의 차이점 등을 알아봤다. 그럼 이제부터 본격적으로 NAS를 통한 DR(Disaster Recovery) 솔루션에 대해 살펴보자. 오늘날 대부분의 전산 업무는 온라인 중심으로 변화됐으며, 24×365 시스템의 구축을 요구하고 있다.
또 하나는 이와 같이 만들어진 전산 환경에 대해 여러 가지 자연, 인위적인 재해로부터 보호받기 위해 미러링(Mi-rroring) 솔루션으로 원격지 복제 시스템을 운용한다. 이것은 과거와는 달리 시설투자에 2배 이상의 비용이 들어가는 것을 의미하고, 관리도 그만큼 복잡해지는 것을 뜻한다. 이처럼 점점 복잡해지는 IT 환경을 어떻게 하면 쉽게 관리할 수 있을까 하는 것이 풀어야할 숙제다.

NDMP 백업의 한계와 대안
NDMP(Network Data Management Protocol)는 많은 NAS 벤더들이 백업/복구를 위해 만든 프로토콜이다. 대부분의 NAS 어플라이언스 속에 들어 있는 운영체계가 백업/복구 등의 기능을 포함하고 있지 않기 때문이다. 이러한 스토리지 관리 기능을 추가로 기능 부여한 것이 NDMP이다.
네트워크어플라이언스나 EMC는 이러한 기능을 이용해 백업을 받고 있다. 그러나 IBM의 경우 NAS 제품 자체가 파워 칩(Power Chip)을 장착한 AIX 5L운영 체제를 사용하고, 그 자체에 백업/복구 등의 기능을 가진 TSM(IBM Tivoli Sotrage Manager)의 에이전트 모듈을 포함하고 있어 굳이 NDMP가 필요하지 않다.
TSM 에이전트는 TSM을 사용하고 있는 기존의 랜 또는 SAN 네트워크에서 쉽게 사용될 수 있고, 베리타스 또는 레가토와 같은 벤더에서 AIX 5L에서 가동되는 소프트웨어 클라이언트나 에이전트가 있다면 이것을 바로 IBM의 NAS에서 돌릴 수 있는 장점이 있다.
그래서 호환성과 이식성을 따져 봤을 때는 NDMP보다는 AIX 5L과 같은 오픈 운영 체제를 갖고 있는 NAS 제품이 사용자에게 유연성(Flexibility)을 더 쉽게 보장해 준다고 볼 수 있다.

NAS 게이트웨이와 랜 프리 백업
NAS 게이트웨이가 갖고 있는 기능 중 하나가 랜 프리 백업(LAN Free Backup)이다. 기존의 DAS 방식에서 데이터 백업을 받기 위해서는 DAS 스토리지로부터 서버를 거쳐 이더넷을 통해 데이터가 저장소로 가야 한다. 이는 이더넷 상에 병목현상이 심하게 걸릴 수 있는데, 이러한 문제점을 보완하기 위해 나온 방식이 바로 랜 프리 백업이다. 랜 프리 백업의 이점은 다음과 같다.

1. 스토리지 자원 사용률을 향상시킬 수 있다.
2. 랜 트래픽을 줄일 수 있다.
3. 백업 윈도를 보다 자유롭게 운영할 수 있다.
4. 스케쥴링과 정책에 의한 관리를 할 수 있다.
5. 저성능의 랜 네트워크 환경에서는 더 좋은 백업 성능의 진가를 발휘할 수 있다.

이제 NAS 게이트웨이를 이용한 랜 프리 백업의 구조를 살펴보자. <그림 4>에서 동작원리를 살펴보면(TSM을 사용한 경우임),

1. TSM 클라이언트(NAS 게이트웨이)는 TSM 서버에게 백업을 하겠다고 통보한다.
2. TSM 클라이언트는 디스크로부터 데이터를 요구한다.
3. TSM 클라이언트는 백업할 데이터를 가져온다.
4. TSM 클라이언트는 가져온 데이터를 바로 테이프 장치로 보낸다.
5. TSM 클라이언트는 메타 데이터(데이터 변경에 대한 정보가 들어있는)를 TSM 서버에게 알려 준다.

이와 같은 과정을 거쳐 SAN 스토리지 풀에 들어있는 저장소로 랜 프리 백업이 이뤄진다. 여기에서 알 수 있는 사실은 데이터의 흐름이 랜을 거치지 않고 SAN 네트워크 상에서 이동해 디스크에서 테이프로 바로 이동한다는 것이다.


NAS 게이트웨이를 통한 스토리지간 IP 미러링 솔루션
NAS 게이트웨이와 SVC(IBM SAN Volume Controller)를 같이 사용하면, 이기종 스토리지간에도 NAS 게이트웨이의 볼륨을 사용할 수 있다. 오늘날의 IT 환경은 특정 벤더의 제품에 묶이는 것을 꺼려한다. 그러다 보니 여러 벤더의 스토리지가 SAN에 묶여 운용되는 것이 현실이다.
그러나 이런 경우 여러 벤더의 스토리지가 묶이다 보니 운영상의 복잡함이나 통합에 있어 어려움이 있다. NAS 게이트웨이를 통한 스토리지간 IP 미러링 구성은 이와 같은 복잡한 환경을 쉽게 만들 수 있는 장점이 있다. 그리고 NAS에서 제공되는 미러링 솔루션으로, 추가 비용 없이 이기종 스토리지간의 데이터 보관이 가능한 것이 특징이다.

NAS 게이트웨이를 이용한 미러링 오버 IP
NAS를 통한 원격지 복제는 대부분의 스토리지 벤더가 엔터프라이즈급에서 구현하고 있는 솔루션과 유사하다고 보면 된다. IBM의 PPRC, EMC의 SRDF, HDS의 트루카피 등이 그러한 솔루션이다. 이러한 DR 솔루션은 대략 동기(SYNC)와 비동기(ASYNC) 방식으로 나뉘는데, 그 차이는 다음과 같다. 참고로 이때 이뤄지는 원격 미러링 모드는 공통적으로 크게 2가지로 구별되며, 나머지는 벤더마다 약간씩의 차이가 있다. 이것을 정리하면 다음과 같다.

1. 동기 방식
로컬 사이트에 데이터를 저장한 후 애플리케이션에게는 데이터가 저장됐음을 알린다. 동시에 데이터는 원격 사이트에 저장하려고 하는데, 이때 약간의 지연 시간이 발생한다. 애플리케이션 입장에서는 데이터가 저장된 것처럼 보이지만, 실제로 원격 사이트에서는 데이터 저장이 완전히 끝나지 않을 수 있다. 이러한 이유로 데이터의 손실이 생길 수 있다.
2. 비동기 방식
원격 사이트에 데이터를 먼저 저장한 후, 로컬 사이트에 데이터를 저장한다. 그 다음 애플리케이션에게 해당 데이터가 기록(Write)됐음을 알린다. 이러한 방식은 데이터의 손실은 없지만, 얼마나 빨리 원격 사이트에 데이터를 저장하느냐가, 온라인 중에 있는 로컬 사이트의 업무 시간 지연을 최소화시킬 수 있는지와 관련 있는 요소 중 하나다.

3. MWC(Mirror Write Consistency) 방식
로컬 사이트에 데이터 저장과 동시에 원격 사이트에 데이터를 저장한다. 이때 원격 사이트에서 데이터 저장의 신호가 오기 전까지는 로컬 쪽에서 기록을 끝낸 것으로 보지 않는다. 동기 방식보다는 속도가 빠르고 비동기 방식보다는 유연하게 데이터를 관리할 수 있다.
NAS 게이트웨이는 IP 통신을 통해 로컬 사이트의 데이터를 원격 사이트의 저장공간으로 원격지 복제를 실시하게 된다. 그러나 NAS 게이트웨이를 통한 원격 미러링인 경우 IP 랜망을 통해 데이터 이동이 일어나므로 병목이 발생할 수 있는 가능성과 고속의 랜 네트워크 구성이 필수적이다.

맺음말
지금까지 NAS의 기본적인 개념에서부터 유사 솔루션, 그리고 DR까지 살펴봤다. NAS를 단순 네트워크에 붙어있는 스토리지로만 생각해서는 안된다. NAS 게이트웨이를 통해 랜과 SAN의 통합에 유용한 솔루션임을 인지해야 한다.
오늘날 대부분의 기업은 SAN으로 통합하고 있으며, 이는 여러 면에서 IP를 통한 스토리지 풀을 갖는 것보다는 이점이 있다. 그러나 IP에 비해 아직 벤더별 표준화가 덜 돼 있는 상태이며 SAN을 구축하기 위한 인프라 구축 비용이 만만치 않게 든다.
반면 IP 스토리지 네트워킹 기술은 현재 구축돼 있는 랜망을 그대로 사용할 수 있기 때문에 인프라 구축 비용이 적게 들며, IP에 대해서는 대부분이 표준화 돼 있어 이식성이 좋다. 그러한 이유 때문에 고가용 고성능의 엔터프라이즈급 시장에서는 SAN을 선호하고 있고, 미드레인지급의 시장에서는 적은 비용으로 동일한 효과를 낼 수 있는 IP 스토리지 네트워킹 방식을 채택하기도 한다.
그러나 현재 시점에서 재난복구(DR)에 대한 수요는 어느 정도 공급이 됐다고 보여진다. 몇 년 전부터 정부에서 금융권을 중심으로 재해 복구 솔루션에 대해 구축 의무를 뒀기 때문에 이미 많은 고객들은 그러한 솔루션을 갖추고 있는 상태다. 따라서 이러한 DR 시장이 갑자기 늘어나기를 기대하기는 어렵다.

728x90

댓글