1. 들어가며
2006년에 IBM의 의료용 AI 왓슨(Watson)에서 출발한 인공지능은 2014년 아마존이 발표한 인공지능 스피커 알렉사(Alexa)에 이어 2015년에 구글이 발표한 딥러닝 라이브러리 텐서플로(Tensorflow)를 기반으로 민주화 시대에 접어들었고 2016년의 알파고(AlphaGo) 대결로 인공지능이 인간 전문가를 이길 수 있다는 가능성을 보여주었습니다. 같은해 서비스를 시작한 허깅페이스(Hugging Face)는 인공지능을 위한 깃허브(GitHub) 역할을 하며 누구나 AI 모델을 개발할 수 있는 기반을 제공하게 되었습니다. OpenAI가 개발한 달리(DALL․E)는 텍스트 묘사를 그림으로 바꾸는 마술을 실현하기에 이르렀습니다.
2022년에 발표된 챗봇 기술, 즉 ChatGPT라는 생성형AI 기술로 인해 인공지능은 일상 생활의 전문가 보조원으로 자리잡고 있으며 국민의 생활 방식, 근로자의 작업 방식에 혁신적 변화를 가져오고 있습니다. 최근 ChatGPT보다 정교한 구글 제미나이(Gemini)와 클로드(Claude)의 출시로 인공지능에 대한 사회적, 경제적 의존도는 더욱더 심화될 것으로 예상되고 있습니다. 인공지능 기술은 미국이 주도하고 있으나 중국도 딥시크(DeepSeek)와 쿠웬(Qwen) 등 막대한 인구가 제공하는 데이터와 자체 기술을 기반으로 미국의 AI를 급속히 추격하고 있습니다.
2. 인공지능 기술 혁명의 동인
마법 같기도 하고 인간을 능가하는 것 같기도 한 인공지능 기술은 DNN, CNN, RNN과 같은 새로운 학습 알고리즘의 출현, 파이썬(Python)이라고 하는 누구나 사용하기 쉬운 개발 언어의 출현, 텐서플로와 파이토치(PyTorch)와 같은 개발 지원 도구의 출현, 깃허브와 허깅페이스와 같은 오픈소스, 오픈 데이터세트, 오픈 커뮤니티의 발전이 주요 동인이라고 할 수 있습니다.
그러나 2020년대 이후 AI의 급속한 발전의 동인은 무엇보다도 컴퓨팅 파워가 비약적으로 발전했다는 것입니다. AI의 근간은 백만, 억단위 차원의 대규모 행렬과 벡터 연산인데 NVIDIA가 게임용 보조 프로세서로 발표한 GPU(Graphics Processing Unit)가 거대 데이터 처리에서 CPU를 능가하는 능력을 발휘하게 되었고, A100, H100, H200, B200, B300, VR(Vera Rubin) 등 매년 연속적으로 수퍼컴퓨팅 용량과 속도를 자랑하는 신규 GPU를 발표하면서 신규 생성형AI 모델을 학습시키는 시간이 혁신적으로 단축되고 있습니다. NVIDIA는 다들 반도체 회사라고 생각하고 있지만 실상은 반도체를 설계하는 SW회사에 해당합니다. NVIDIA가 가진 최대 기술력은 수천~수만대의 GPU 클러스터를 하나의 묶어 동작하도록 하여 거대 컴퓨팅 파워를 실현하는데 있고, 이러한 이면에는 CUDA(Compute Unified Device Architecture)라고 하는 GPU 병렬 처리 기술과 이를 쉽게 사용하도록 하는 SDK가 존재한다는 것입니다. NVIDIA가 설계한 GPU는 대만의 TSMC가 칩으로 제조하고 있고 HP, Dell, 수퍼마이크로(Supermicro) 등이 NVIDIA의 GPU를 장착한 GPU 서버를 제조하고 있습니다. GPU에 대한 대안으로 구글이 개발한 TPU(Tensor Processing Unit), 한국이 주도하는 NPU(Neural Processing Unit)가 존재합니다. TPU는 Gemini의 학습에 사용되어 GPU의 대안으로 거론되며 급부상하고 있고, 한국의 NPU는 아직 사업 초기 단계로 시장 확대를 위해 노력하고 있습니다.
그 다음 단계로 필요한 작업은 이러한 GPU, TPU, NPU를 장착한 서버를 서버 전용 건물인 데이터센터의 랙이라고 하는 공간에 설치하고, GPU 서버를 사용하고 서비스할 수 있도록 하는 오픈스택(OpenStack), 쿠버네티스(K8s), GPU 클러스터SW 등의 AI인프라SW를 설치하여 GPU 클라우드를 설치 운영하는 것입니다.
3. 컴퓨팅 장치의 저장 운영소, 디지털 서비스의 심장인 데이터센터
구글, 아마존, 메타, 테슬라 등 대부분의 미국 빅테크 기업은 수십개의 자체적 데이터센터를 보유하고 있습니다. 구글은 미국, 유럽, 아시아 대륙에 수십개의 데이터센터를 설치하여 운영하고 있습니다. 데이터센터는 24시간, 365일 무중단으로 ICT 서비스를 안전하고 효율적으로 제공하도록 하기 위한 전력과 쿨링 인프라스트럭처를 갖춘 전용 빌딩입니다. 하나의 데이터센터에는 보통 수만대의 서버들과 이를 위한 스토리지와 네트워크 장비가 설치됩니다. 데이터센터는 무중단 서비스 공급을 위한 전력과 쿨링 공급이 제일 중요한 요소이므로 전력과 쿨링 공급을 위한 설비들이 N+1(Tier 2), 2N(Tier 3) 등으로 이중화되어 있고 한전과 같은 계통(grid) 전력의 중단, 즉 정전에 대비하여 배터리에 전력을 충전하는 UPS 설비, UPS 전력 고갈시 비상시 가동하는 비상발전기, 쿨링 공급을 위한 칠러(chiller)와 냉각탑(cooling tower) 등을 갖추고 있습니다. 이러한 시설들은 인프라스트럭처와 기반 설비라고 합니다. 나머지 공간은 전산실(computing room) 또는 데이터실(data room)로 서버를 장착하는 랙(rack), 랙에 전기를 공급하는 PDU, 랙에 쿨링을 공급하는 CRAH 등의 시설이 설치되어 있습니다. 데이터센터의 전산실에서 랙이 설치되는 공간을 상면이라고 합니다.
우리나라는 네이버(Naver), 카카오(Kakao)와 같은 빅테크 기업은 물론 KT(KT Cloud), SKT, LG U+와 같은 통신사, 삼성SDS, LG CNS, SK C&C와 같은 SI기업도 데이터센터를 보유하고 있습니다. 통신사와 SI기업들이 보유한 데이터센터들은 자체적으로 사용하기도 하지만 대부분의 상면을 고객사 서버 운용을 위해 판매하는 코로케이션(co-location) 타입의 데이터센터들입니다. 삼성전자와 같은 반도체기업의 경우 반도체공장을 운영하는 자동화된 시스템인 MES(Manufacturing Execution System)를 갖추고 있고, 이러한 MES를 운영하기 위한 자체 데이터센터를 공장 내부에 설치하여 운영하고 있는데, 이러한 타입의 데이터센터는 프라이빗 데이터센터(private data center) 또는 전용 데이터센터라고 합니다. 한국데이터센터연합회(KDCC)가 조사한 결과에 따르면 우리나라에는 180개 정도의 코로케이션과 프라이빗 데이터센터가 있는 것으로 추정되고 있습니다. 행안부 조사 자료에 따르면 정부기관과 공공기관도 이와 별도로 다양한 종류와 크기의 데이터센터 또는 전산실을 보유하고 있는 것으로 알려져 있습니다.
데이터센터는 그동안 상면 크기, 즉 전산실 크기를 기반으로 분류하여 왔습니다. 상면 500m2 이내를 소형 데이터센터, 2000m2까지를 중형, 7,500m2까지를 대형, 22,500m2까지를 거대, 37,160m2까지를 메가, 37,161m2 이상을 하이퍼스케일 데이터센터로 분류하고 있습니다. 전력 수전 규모로 보면, 공식적인 분류 기준이 정해져 있지는 않지만, 10MW 규모를 중형 데이터센터, 40MW 규모를 대형 데이터센터, 100~120MW 규모를 하이퍼스케일 데이터센터로 구분하고 있습니다.
4. 데이터센터 수요 증가의 원인
우리나라에서 데이터센터 상면이 포화 상태에 이르고 데이터센터 신설이 급증하게 된 원인은 여러 가지가 있습니다. 가장 큰 원인중의 하나는 기존의 레거시 컴퓨팅 방식이 클라우드 방식으로 급격 전환하면서 미국의 클라우드 CSP 3사인 아마존(AWS), MS 애저(Azure), 구글(GCP)이 모두 한국에 상륙했다는 것입니다. 부산 미음지구에 구축한 LG CNS 데이터센터도 MS사에 상면이 팔린 상태이고, 국내 코로케이션센터 최대 규모인 KT IDC도 모두 AWS, MS 등에 유휴 상면을 제공한 상태입니다. 클라우드 CSP에 이어 글로벌 코로케이션 데이터센터 1,2위 업체인 에퀴닉스(Equinix)와 디지털리얼티(Digital Realty)도 한국에 진출한 상태입니다. 글로벌 데이터센터 업체의 한국 진출은 한국의 지진이 없는 지질학적 우수성, 전력과 통신 시설의 우수함을 좋게 판단한 것으로 보입니다. 데이터센터 시장이 급팽창하자 건설사와 벤처캐피털 등의 투자사가 데이터센터 구축과 투자에 관심을 보이기 시작했습니다. 최근 생성형AI, 독자적 파운데이션 모델(foundation model) 개발 붐으로 GPU 컴퓨팅 수요, GPU 클라우드 수요가 증가하면서 다시한번 AI 데이터센터에 대한 관심과 투자가 급증하고 있습니다. 최근 수도권에 신축중인 데이터센터의 특징을 보면 자산운용 투자사가 PF 형태로 구축 자금을 조달하고, LG CNS나 KT클라우드와 같은 데이터센터 전문 운영사가 설계와 구축, 인프라 운영을 담당하고, 최종 고객사나 네이버와 같은 플랫폼 전문 운영사가 GPU클라우드를 제공하는 형태로 역할이 구분되고 있기도 합니다.
5. 데이터센터 설립의 걸림돌
한국의 대부분의 민간 데이터센터는 코로케이션 데이터센터가 대다수입니다. 코로케이션 데이터센터는 고객사에 상면을 판매하고 고객사의 서버를 운용하는 공동의 공간이다 보니 무엇보다 중요한 것이 고객사의 운영자(operator)들이 수시로 접근할 수 있는 접근성입니다. 전철, 버스, 철도, 공항 등 접근성이 뛰어난 곳이 수도권이다 보니 대부분의 고객사들은 수도권에 입지한 데이터센터를 선호하고 있습니다. 데이터센터의 신축 수요가 수도권으로 집중되다 보니, 양질의 전력 공급이 장점의 하나였던 우리나라도 드디어 전력 계통의 한계가 오게 되었습니다. 즉, 수도권에서는 전력의 수요가 공급 가능 용량을 초과하게 된 것입니다. 이에 한전과 기후에너지부(전 산업에너지부)는 이에 대한 타개첵으로 분산 에너지 특별법을 만들어 10MW 이상의 수전 용량이 필요한 데이터센터는 한전에 필요 전력을 신청하고 한전의 계통을 통한 전력 공급이 가능한지를 판별하여 승인하는 전력계통영향평가 제도를 시행하게 되었습니다. 법안 제정 초기에는 승인 평가를 전력이 부족한 수도권 지역에 국한하도록 하였으나 법이 시행되면서 승인 평가가 불필요한 지방까지 포함한 상태입니다. 이로 인해 전력에 여유가 있는 지방 위치에 데이터센터를 신설하는 경우에도 불필요하게 큰 수수료를 부담하면서 전력계통영향평가를 신청해야 하게 되어 많은 사업자들의 불만 요인이 되었습니다.
또한, 데이터센터는 국내에서는 하나의 건물에 해당하므로 건물로서의 다양한 법 규제가 적용되고 있습니다. 정보화기본법 개정 당시 데이터센터를 국토부 법에 하나의 고유한 건물 유형으로 포함시키려 했으나, 국토부의 반대로 통신시설의 하나인 집적정보처리시설의 부속 건물 형태로 반영이 되었습니다. 이로 인해 데이터센터의 고유한 특성이 반영이 안된 일반 건물에 대한 다양한 규제가 적용이 되어 데이터센터에 필요한 이상의 승강기, 주차면 확보, 전기차 충전시설, 미술작품 설치 등이 필요한 상황이 되었습니다. 기후에너지환경부의 탄소거래제, 탄소감축 대상에도 포함되어 디지털 서비스 수요는 급증하나 탄소(전력) 사용을 감축하는 대상에도 포함되는 모순이 발생하고 있습니다.
데이터센터 신축 추진에서 가장 큰 걸림돌은 악성 민원입니다. 해외에서는 전혀 볼수 없는 독특한 님비(NIMBY) 현상이 발생하여 데이터센터를 전자파, 소음, 열섬의 발생원으로 주장하며 손해 배상을 요구하는 악성 민원으로 승인된 데이터센터도 취소가 되는 사례가 발생하고 있습니다. 이로 인하여 한국으로 집중되던 데이터센터 수요가 최근 인도네시아 등 동남아로 이탈하는 상황이 발생하고 있습니다. 데이터센터 건축에 대한 국제 표준(ISO/IEC 22237-2)의 데이터센터 입지 조건을 보면 데이터센터는 전자파 간섭(고압선, 송전탑 등), 진동(해머드릴, 철도 선로), 공기오염(광산, 건설현장, 트래픽), 위험 시설(핵, 폭발물, 독성 등) 등의 리스크를 피해야 하는 시설로 설명하고 있으나, 우리나라 민원에서는 전자파 발생 시설, 소음 발생 시설로 근거없는 주장을 하고 있으며, 심지어는 폐기물 처리장 수준의 유해시설로 호도하기도 합니다. 전자파, 소음, 열섬 등의 전문기관 분석 결과도 기준치보다 아주 적은 미미한 수치로 측정되어, 불필요한 전문가 분석 비용만 발생하고 있는 실정입니다.
6. AI 데이터센터의 수요 등장
데이터센터 신축 과정에 해단 걸림돌로 인해 현재 여건으로는 인공지능 전용 데이터센터(AIDC)의 신축에도 전력계통영향평가, 복합인허가 기간을 포함하면 3년 정도의 기간이 필요한 상태입니다. GPU, TPU, NPU 서버, AI 파운데이션 모델 개발이 급속도로 발전하고 있는 상태에서 3년이라는 인허가 및 건축 기간으로 인해 호기를 놓칠 수 있으므로 기간 단축 및 신축 독려를 위한 법제도적 지원이 필요한 상태입니다.
인공지능 데이터센터는 AI 학습과 실시간 추론을 위한 워크로드를 특징으로 합니다. 따라서 인공지능데이터센터의 경우 GPU 서버의 소비전력 증가에 따라 고밀도 랙(랙당 15kW 이상, 최신 GPU는 80kW 이상)이 필요하고 이러한 전력에서 발생하는 열을 식히기 위한 냉각 방식이 공랭식으로는 한계가 있어 수냉식(liquid cooling) 설비의 확보가 필수적입니다. 그동안 운영중인 국내 기존 데이터센터의 평균 랙 전력 밀도는 3kW~5kW(최대 6~7kW) 수준이므로 이로 인해 NVIDIA H200 서버(10.2kW), B200 서버(14.3kW), GB 200 NVL72(80kW) 등 최신 GPU 서버의 운용이 불가능하거나 여러 랙 공간을 비워두고 운용해야 하는 비효율성을 보이고 있습니다. 서버 랙의 무게도 증가하여 평방미터당 1톤으로 설계된 기존 센터에서는 2.5톤의 하중을 필요로하는 Vera Rubin 랙을 설치할 수 없는 상태입니다. 고밀도 랙과 수냉식 쿨링을 필요로 하는 데이터센터는 기존 데이터센터의 리모델링으로는 한계가 있다는 의견이 다수인 상태입니다. 따라서 AI의 국가 경쟁력 강화를 위해서는 AIDC의 신축 수요가 급증할 수밖에 없는 상황입니다.
7. AI 데이터센터발 전력 수요와 물 수요 이슈
최근에 미국에서 신축중인 데이터센터의 전력 수전량은 1GW 이상인 경우가 다수입니다. 울산에 추진중인 SKT의 AI데이터센터도 1GW 수전을 목표로 하고 있고, 최근 언론에 보도된 데이터센터 관련 기사에서는 5GW 수요도 등장하고 있습니다. 원자력 발전소 1기의 발전량이 1.5GW 정도이므로 1GW 이상의 수전을 필요로 하는 데이터센터의 경우, 원자력, SMR 등이 고려되고 있습니다. 탄소중립의 모범생인 구글은 태양광, 풍력, ESS, 지열 등의 신재생 에너지를 고려하고 있고, 아마존과 MS는 원전, SMR, 핵융합 전력을 고려하고 있습니다. 거대한 땅을 보유한 중국은 서쪽 내륙에 거대 풍력 및 태양광 누적 설비 용량 1200GW를 달성하였고, 서쪽의 전기를 동쪽(북경, 상해 등)으로 공급하는 서전동송 전략을 추진하고 있습니다. 일본은 신재생 에너지가 풍부한 홋카이도와 전력 수요처인 혼슈를 고전압DC(HVDC)로 연결하는 전략을 추진중입니다.
최근 통과한 AI데이터센터 진흥을 위한 특별법에서 논란이 되었던 PPA(Power Purchase Agreement) 조항도 이러한 신재생 에너지 공급과 깊은 관련이 있습니다. 우리나라도 1GW급 전력의 안정적 공급을 위해서는 전력발전소와 데이터센터가 직접 계약을 맺고 전력을 공급하는 PPA가 승인되어야 한다는 것입니다. 분산에너지특구의 경우 500MW 규모의 PPA가 허용이 되고 있다고 하나 이를 1GW급으로 올릴수 있어야 하고, 전력 발전 방법도 LNG 발전이나 원전이 포함되어야 한다고 하나 전력 공급자와 데이터센터 사업자의 시각에 이견이 있는 상태입니다.
AI 데이터센터의 경우 이러한 거대 전력양도 문제이고, 이러한 데이터센터가 갑자기 작동을 멈추게 되는 경우 계통에 주는 악영향도 크다고 알려져 있습니다. 전기는 지속적으로 생산하고 소비를 해야 하는데, 1GW를 소비하던 데이터센터 소스가 갑자기 전기를 사용하지 않으면 전기를 공급하는 계통에 심각한 부담을 줄수 있다고 합니다. 따라서 계통의 전력에 여유가 있을 때 AI 워크로드를 집중적으로 실행하고, 계통의 전력에 여유가 없을때는 AI 워크로드를 중단하는 방식으로 AI 데이터센터가 계통의 부담을 완화해주는 VPP(Virtual Power Plant) 기술이 적용되어야 한다는 의견도 있습니다. 구글과 중국에서는 VPP 기술이 개발되어 활용되고 있는 것으로 알려져 있습니다.
미국 데이터센터는 쿨링 방식으로 기화식 방식을 사용해 물의 수요가 많은 것으로 알려져 있습니다. 액체가 기화하면서 열을 뺏어가는 원리를 적용하여 쿨링을 하고 있고, 이 경우 기화되는 액체는 재활용이 안되는 것으로 보고 있습니다. 미국 5대호 주변에 신축을 추진하던 AI 전용 데이터센터의 경우 주민들이 물 부족을 이유로 반대하였다는 언론 보도가 나온 상태입니다. ISO/IEC 국제표준 30134-9는 물 사용효율지수인 WUE(Water Usage Effectiveness)를 제안하고 있습니다. WUE는 쿨링에 사용된 물의 양을 IT 에너지로 나눈 값으로 m3/MWh 또는 L/kWh로 표현하고 있습니다. 글로벌 평균값은 1.8L/kWh, 미국 평균값은 0.4L/kWh로 추정되고 있습니다. 우리나라는 아직 WUE에 대한 측정이나 관리가 안되는 것으로 알려져 있습니다.
8. 나오며
인공지능 기술은 하루가 다르게 발전하고 있고, AI 모델 개발을 위한 GPU, TPU, NPU 기술도 나날이 발전하고 있습니다. AI 경쟁력 확보를 위해서는 대규모 GPU 서버를 운영하기 위한 AI 데이터센터가 필요하므로 AI 데이터센터는 AI 시대의 국가적 기반 인프라라고 할 수 있습니다. AI 데이터센터는 고밀도 랙(30KW 이상, 80kW~500kW), 수냉식 쿨링 등 새로운 기반 시설을 필요로 하여 기존 데이터센터를 활용하기는 어려운 상태이므로 최근 신축 추진중인 민간 AI 데이터센터와 2028년 12월을 오픈 목표로 추진중인 국가AI데이터센터 외에도 지자체, 공사, 민간 기관 등에서 AI 데이터센터를 신축하려는 움직임을 보이고 있습니다.
그동안 정부는 AI 3강 진입을 목표로 GPU 등 확보에 노력을 기울였으나 이러한 GPU를 설치할 기반 시설인 AI 데이터센터 신축에 3년이라는 기간이 소요되는 문제점을 안고 있어 개선이 시급한 상태입니다. 이동식 모듈형 데이터센터가 짧은 구축 기간으로 관심을 받기도 하였으나 국내 적합 여부는 아직 확인이 필요한 상태입니다. 최근 통과된 'AI 데이터센터 진흥 특별법'은 복합인허가 일괄처리, 일정기간 경과시 승인으로 간주, 관련 법 규제에 대한 특례 지원, 전력․용수․장비 등 지원을 통하여 AI 데이터센터의 신축에 대한 어려움을 극복하고 패스트 트랙을 제공하여 국가적으로 AI 기반 인프라를 확보하는데 큰 도움이 될 것으로 보입니다. 다만 시행령과 하위 법률 추진 과정에서 AI 데이터센터의 정의, 전력, 건축 관련 이슈와 기준을 결정하는 일은 정부 부처와 행정기관, 데이터센터 전문가, 전력 공급 기관, 법률 전문가 등이 모여 많은 고민을 하고 합의를 이루어야 할 것으로 보입니다.
