blevels

Home / AI / AI 용어사전 / 클라우드 — AI 서비스가 내 PC 없이 돌아가는 원리

TERM

클라우드 — AI 서비스가 내 PC 없이 돌아가는 원리

게시일 2026-04-30수정일 2026-04-30
공식 링크
On this page

AI 서비스를 구동하는 서버는 어디에 있을까. ChatGPT에 질문을 보내면 응답이 돌아오기까지 사용자의 PC는 아무 연산도 하지 않는다. 그 연산은 전 세계에 분산된 데이터센터, 즉 클라우드(Cloud)에서 이루어진다.

정의

클라우드(Cloud Computing)란 인터넷을 통해 서버·스토리지·데이터베이스·네트워크·소프트웨어 등 컴퓨팅 자원을 원격으로 제공하는 인프라 모델이다. 사용자는 자체 하드웨어 없이 필요한 만큼 자원을 빌려 사용하고, 사용량 기반으로 비용을 지불한다.

세계 3대 클라우드 플랫폼은 AWS(Amazon Web Services), GCP(Google Cloud Platform), Azure(Microsoft Azure)다. OpenAI는 Azure, Google Gemini는 GCP, Anthropic Claude는 AWS와 GCP를 혼용한다.

클라우드가 AI 서비스에 필수인 이유

AI 모델 추론(Inference)은 대규모 행렬 연산을 실시간으로 처리해야 한다. GPT-4 수준의 모델을 단일 서버에서 돌리려면 A100 GPU 수십 장이 필요하다. 클라우드는 이 자원을 즉시 할당(Scale-out)하고, 트래픽이 줄면 반납(Scale-in)할 수 있어 AI 서비스 운영의 기본 인프라가 됐다.

클라우드의 핵심 개념 세 가지:

  • 서버리스(Serverless): 서버 관리 없이 함수 단위로 코드를 실행. AWS Lambda, Google Cloud Functions가 대표적. 사용자 요청이 있을 때만 실행되므로 비용 효율이 높다.
  • 오토스케일링(Auto Scaling): 트래픽 급증 시 자동으로 서버 인스턴스를 추가하고, 트래픽이 줄면 자동 축소. ChatGPT 출시 당시 수백만 동시 접속을 처리할 수 있었던 핵심 기술이다.
  • CDN(Content Delivery Network): 정적 파일(이미지·CSS·JS)을 전 세계 엣지 서버에 캐싱해 사용자와 가까운 서버에서 제공. 응답 속도를 수십 ms 단위로 줄인다.
AD

클라우드 서비스 3계층 (IaaS·PaaS·SaaS)

| 계층 | 정의 | 예시 | |---|---|---| | IaaS (Infrastructure as a Service) | 서버·네트워크·스토리지를 임대 | AWS EC2, GCP Compute Engine | | PaaS (Platform as a Service) | 개발 플랫폼·런타임 제공 | Vercel, Railway, Heroku | | SaaS (Software as a Service) | 완성된 소프트웨어를 구독 | Gmail, Notion, Figma |

AI 개발자가 가장 많이 접하는 계층은 PaaS다. Vercel에 Next.js 앱을 배포하거나 Railway에 Node.js 서버를 올리는 행위 모두 PaaS 사용이다. 모델 자체를 호스팅하는 수준이 되면 IaaS(GPU 인스턴스 직접 임대)로 내려간다.

AD

AI 서비스와 클라우드 비용 구조

클라우드 비용은 크게 컴퓨팅(CPU/GPU 시간), 스토리지(저장 용량), 네트워크(데이터 전송량)로 구성된다. AI API를 호출하는 서비스라면 클라우드 비용에 API 토큰 비용이 추가된다.

비용 최적화 전략:

  • 예측 가능한 워크로드 → Reserved Instance(약정 할인, 최대 70% 절감)
  • 단발성 배치 처리 → Spot Instance(경매형, 최대 90% 절감, 중단 가능)
  • 서빙 트래픽 → 서버리스 함수로 유휴 비용 제거

활용 사례

  • AI API 백엔드: Claude·GPT API를 호출하는 서버를 AWS Lambda로 배포해 요청당 과금
  • 벡터 데이터베이스 호스팅: Pinecone·Weaviate를 GCP에 올려 rag 파이프라인 구성
  • 모델 파인튜닝: AWS SageMaker·GCP Vertex AI에서 GPU 클러스터를 임시 생성해 학습 후 반납
  • 정적 사이트 배포: Next.js 블로그를 Vercel(PaaS)에 배포, CDN 자동 적용

관련 용어

  • api — 클라우드 서비스와 앱을 연결하는 인터페이스
  • serverless — 서버 관리 없이 함수 단위로 실행하는 클라우드 패턴
  • database — 클라우드에서 관리형 DB 서비스(RDS·Cloud SQL)로 주로 제공
  • cdn — 클라우드 인프라의 핵심 네트워크 계층
  • docker — 클라우드 배포 표준 컨테이너 기술
AD