딥러닝(Deep Learning) — 머신러닝보다 한 단계 깊은 AI 학습법

게시일 2026-04-30수정일 2026-04-30

On this page

GPT가 문장을 이해하고, 이미지 인식 AI가 고양이를 구분하고, 음성 AI가 말을 텍스트로 변환한다. 이 모든 것의 근간에는 딥러닝(Deep Learning)이 있다.

정의

딥러닝(Deep Learning, 심층학습)은 머신러닝(Machine Learning)|machine-learning의 하위 분야로, 인공 신경망(Artificial Neural Network)을 여러 층(Layer)으로 깊게 쌓아 데이터에서 스스로 특징(Feature)을 학습하는 기술이다. 인간이 직접 규칙을 정의하는 대신, 방대한 데이터를 통해 모델이 패턴을 자동으로 발견한다. "딥(Deep)"은 신경망의 층 수가 깊다는 의미다. 2012년 ImageNet 대회에서 딥러닝 기반 모델 AlexNet이 기존 방법 대비 압도적 성능을 보인 이후 AI 산업의 중심 기술이 됐다.

신경망 구조

딥러닝 모델의 기본 단위는 뉴런(Neuron)이다. 여러 뉴런이 연결된 층을 레이어(Layer)라 하며, 세 종류의 레이어로 구성된다.

입력층(Input Layer): 원시 데이터(이미지 픽셀, 텍스트 토큰, 숫자 등)가 입력되는 첫 번째 층.
은닉층(Hidden Layer): 입력층과 출력층 사이에 쌓인 여러 층. "딥(Deep)"은 이 은닉층이 많다는 의미. 각 층은 이전 층의 특징을 더 추상적인 수준으로 변환한다.
출력층(Output Layer): 최종 예측 결과를 출력하는 마지막 층.

[입력층] → [은닉층1] → [은닉층2] → [은닉층N] → [출력층]
  픽셀값    엣지 감지    형태 감지    물체 감지    고양이/개

학습 과정: 순전파와 역전파

딥러닝 모델은 순전파(Forward Propagation)와 역전파(Backpropagation) 두 단계를 반복하며 학습한다.

1. 순전파: 입력 데이터가 층을 통과하며 예측값을 생성. 2. 손실 계산: 예측값과 실제 정답의 차이(오차)를 손실 함수(Loss Function)로 수치화. 3. 역전파: 오차를 역방향으로 전파하며 각 뉴런의 가중치(Weight)를 조정. 4. 반복: 수백만~수십억 번 반복하며 오차가 최소화될 때까지 학습.

경사하강법(Gradient Descent)|gradient-descent은 가중치를 최적 방향으로 조금씩 조정하는 핵심 알고리즘이다.

주요 아키텍처

용도에 따라 특화된 신경망 구조가 발전했다.

CNN (Convolutional Neural Network, 합성곱 신경망): 이미지 처리에 최적화. 이미지 분류, 객체 탐지, 얼굴 인식에 활용.
RNN (Recurrent Neural Network, 순환 신경망): 순서가 있는 데이터(텍스트, 음성, 시계열) 처리. LSTM·GRU가 개선 버전.
Transformer: 2017년 Google 논문에서 발표. 어텐션(Attention)|attention 메커니즘 기반. GPT, BERT, Claude 등 현재 대형 언어 모델(LLM)의 핵심 아키텍처.

활용 사례

자연어 처리(NLP): GPT-4, Claude, Gemini 등 대형 언어 모델. 문장 생성, 번역, 요약, 코드 작성.
컴퓨터 비전(Computer Vision): 자율주행 차량의 객체 인식, 의료 영상 진단, 보안 카메라 이상 탐지.
음성 AI: Whisper(OpenAI) 같은 음성 인식 모델, TTS(Text-to-Speech) 합성.
추천 시스템: 넷플릭스·유튜브 콘텐츠 추천, 전자상거래 개인화 상품 제안.

정의

신경망 구조

학습 과정: 순전파와 역전파

주요 아키텍처

활용 사례

관련 용어