LLM (Large Language Model)

게시일 2026-04-28수정일 2026-04-28

On this page

LLM은 Large Language Model의 약자로, 대규모 언어 모델을 뜻합니다. 인간 언어의 패턴을 거대한 신경망에 학습시켜, 입력된 텍스트에 대해 자연스러운 텍스트를 생성하는 AI 시스템입니다. ChatGPT, Claude, Gemini 같은 챗봇이 대표적인 LLM 응용 사례입니다.

정의와 동작 원리

LLM은 수백억~수조 개의 파라미터를 가진 신경망으로, 인터넷·책·코드 등 방대한 텍스트 데이터로 학습됐습니다. 입력 토큰 시퀀스를 받아 다음에 올 토큰의 확률 분포를 예측하는 단순한 작업을 반복하는 것이 핵심 동작 원리입니다. 단순해 보이지만 충분히 큰 모델과 데이터에서는 추론, 요약, 번역, 코드 생성 같은 복합 능력이 자연스럽게 발현됩니다.

학습된 모델은 새로운 텍스트를 받을 때 학습 시 형성된 패턴을 기반으로 답변을 생성합니다. 이는 사람이 말을 배우는 방식과 다릅니다. LLM은 의미를 이해하는 것이 아니라 통계적으로 가장 그럴듯한 다음 토큰을 예측합니다.

주요 LLM 라인업

GPT 시리즈(OpenAI), Claude 시리즈(Anthropic), Gemini 시리즈(Google), Llama(Meta), Mistral 같은 모델이 대표적입니다. GPT와 Claude는 폐쇄형 상용 모델이고, Llama와 Mistral은 가중치를 공개하는 오픈웨이트 모델입니다. 가격, 성능, 라이선스, 사용 한도가 모델마다 다르므로 작업 유형에 맞춰 선택해야 합니다.

한계와 주의

LLM은 학습 데이터 시점 이후의 정보를 알지 못합니다. 또한 사실이 아닌 내용을 자신 있게 말하는 환각(hallucination) 현상이 종종 발생합니다. 이를 줄이기 위해 RAG(검색증강생성)로 외부 문서를 참조하게 하거나, 출처를 명시하도록 프롬프트를 설계하는 패턴이 권장됩니다.

또 다른 한계는 비용입니다. 큰 모델은 호출당 비용이 누적되며, 자동화 파이프라인에서 비용이 빠르게 늘어날 수 있습니다. 대부분의 실무는 작은 모델로도 충분하며, 복잡한 추론에만 큰 모델을 사용하는 라우팅 전략이 비용 효율적입니다.

운영 시사점

LLM을 도입할 때 가장 중요한 것은 "이 작업에 LLM이 정말 필요한가"입니다. 정규식, 룰 기반 시스템, 기존 검색 엔진으로 처리할 수 있는 작업까지 LLM에 맡기면 비용과 응답 시간이 모두 늘어납니다. LLM은 유연하지만 비싸고 느리며 가끔 틀린 도구입니다. 이 트레이드오프를 이해하고 적절한 곳에만 적용하는 것이 핵심입니다.