AI는 왜 아직 돈을 못 버는가: GPU 독점, 추론 비용, 그리고 기업의 새로운 선택

11월 27, 2025

아직 인공지능 산업이 ‘혁신의 상징’으로 소비되는 동안, 정작 글로벌 기업의 재무제표는 매우 다른 메시지를 던지고 있다. AI 서비스의 사용량은 매일 폭증하는데, 대부분의 기업은 이익을 내지 못한다. 그 근본에는 GPU 가격이라는 단일 변수가 AI 산업 전체의 수익성과 비용 구조를 지배해 온 사실이 있다. 엔비디아가 주도하는 고성능 GPU 시장은 사실상 독점적이며, 칩 가격은 장당 수만 달러, 대규모 클러스터 구축에는 수백억에서 수천억 원이 투입된다. 학습 단계에서는 일회성 비용이라고 말하지만 실제로는 모델 개량, 파인튜닝, 재훈련이 반복되며 누적 비용은 눈덩이처럼 불어난다. 더 큰 문제는 추론 단계이다. 전통적인 IT 서비스는 사용량이 증가해도 규모의 경제가 작동하지만, AI는 사용량이 증가할수록 GPU 사용량도 동일한 비율로 증가하여 비용이 함께 늘어난다. 즉, 고객이 늘어날수록 원가도 늘어나는 비정상적 구조다. 최신 학술지에서는 이 문제를 ‘AI의 구조적 제한’으로 규정하며, 추론 비용이 AI 수익성의 최대 장애물이라는 분석을 제시한다. 구글 딥마인드와 MIT 연구진은 최근 논문에서 LLM의 추론 비용은 모델 크기가 커질수록 기하급수적 증가를 보이며, 특정 임계점을 넘어서면 서비스 확장이 불가능해진다고 설명한다. 국제 경제 매체 파이낸셜타임스는 AI 기업의 전력소비 증가가 생산원가를 급격히 악화시키고 있다고 경고하며, GPU·전력·네트워크가 결합된 ‘AI 인프라 비용 폭탄’이 기업 재무에 장기적 부담을 준다고 분석했다. 이처럼 벤처 투자금이 투입된 AI 시장은 지금까지 “사용량 증가 → 수익 증가”라는 디지털 플랫폼의 공식을 따르지 못했고, 그 결과 AI 기업들은 폭발적 성장을 기록하고도 수익성이 뒷받침되지 않는 상태에 놓였다.

이런 현실에서 AI 수익 모델의 한계가 선명하게 드러났다. 첫째, 현존하는 대부분의 AI 서비스는 추론 기반 과금 모델인데, 추론 자체가 GPU 자원을 지속적으로 소모하므로 마진을 확보하기 어렵다. 둘째, AI 기능을 제공하는 기업이 고객사에게 더 많은 기능을 제공할수록 지출이 늘어나는 ‘역(逆)규모의 경제’가 발생한다. 셋째, 기업용 AI가 실질적 수익을 창출하기 위해서는 기존 업무 프로세스를 깊이 있게 대체해야 하지만, 많은 기업이 여전히 AI 도입을 ‘옵션 기능’ 수준으로만 활용해 ROI가 낮다. 넷째, 데이터 확보–정제–보관–보안이라는 비용 구조가 AI 운영 비용에 추가되면서 단순 GPU 비용을 넘는 전방위적 원가 부담이 지속적으로 증가한다. 이런 구조에서 살아남기 위해 제시되는 해결 시나리오는 크게 세 가지로 정리된다. 첫째, 맞춤형 AI 칩 확보 및 내재화 전략이다. 구글 TPU, 아마존 Trainium, 테슬라 AI5/AI6은 모두 엔비디아 의존도를 낮춰 비용을 통제하려는 시도이며, 이는 AI 수익성 회복의 핵심 전략으로 평가된다. 둘째, 추론 최적화 기술 도입이다. 양자화(Quantization), 디스토션 내성 모델, MoE 구조 등은 추론 비용을 절반 이하로 낮출 수 있다는 최신 연구 결과가 등장하며 기업의 비용 구조 혁신 가능성을 넓히고 있다. 셋째, 기업용 업무 자동화(AI Agent) 기반의 고부가가치 모델 전환이다. 단순 챗봇이나 Q&A 기반 AI는 비용 부담만 높이고 수익성이 낮지만, 실질적 자동화–의사결정–워크플로우 통합이 이루어질 때 비로소 AI가 기업 생산성에 기여하며 재무적 성과로 연결된다.

따라서 기업이 AI 투자를 고려할 때 반드시 비용 구조를 정확히 이해해야 한다. 무엇보다 GPU 구매 또는 클라우드 임대료가 전체 프로젝트 비용의 70~90%를 차지한다는 사실을 직시해야 한다. 또한 AI 모델 구축 비용보다 더 중요한 것은 “운영 비용(OPex)” 구조이며, 이는 장기적으로 기업의 수익성에 결정적 영향을 준다. 데이터 확보와 저장소 선택 역시 중요하다. 최신 글로벌 연구들은 AI 프로젝트의 실패 요인 중 가장 많은 비중을 차지하는 것이 ‘데이터 준비 부족’과 ‘비효율적 인프라 선택’이라고 지적한다. 더불어 소버린 AI, 데이터 주권, 레이턴시 기반 산업 특성을 고려할 때 온프레미스–하이브리드–프라이빗 클라우드의 역할이 급격히 커지고 있으며, GPU 대체형 아키텍처(DPU·NPU·ASIC·TPU) 채택 여부가 장기적 비용 경쟁력을 결정하는 주요 변수가 됐다. 결국 AI 투자는 ‘기술 도입’이 아니라 ‘재무 구조 설계’에 가깝다. 기업이 지금 해야 할 질문은 “어떤 AI 모델을 쓸 것인가?”가 아니라 “어떻게 비용 구조를 통제할 것인가?”, “어떤 인프라에서 어떤 방식으로 추론을 운영할 것인가?”이다. AI 산업 초기의 과열은 분명 기회였지만, 이제는 비용을 통제한 기업만이 AI에서 진짜 수익을 창출할 수 있는 시대다. 바로 이 지점에서 C레벨 경영진의 통찰과 전략적 의사결정이 기업의 미래 경쟁력을 가른다.

#AI경제학 #GPU비용 #AI수익성 #기업AI전략 #클라우드인프라 #AIROI

이 블로그 검색

문득이 논평

AI는 왜 아직 돈을 못 버는가: GPU 독점, 추론 비용, 그리고 기업의 새로운 선택

댓글

댓글 쓰기

이 블로그의 인기 게시물

기업의 데이터를 지켜야 하는 이유

AI와 기본소득 시대, 인간은 소비자인가 창조자인가

지식의 역사, 저장과 공유의 진화 ― 클라우드와 AI가 여는 새로운 국면