Home / AI / AI 도구 / DeepSeek V3 실전 가이드 — 무료 오픈소스 최강 LLM 사용법
TOOLS
DeepSeek V3 실전 가이드 — 무료 오픈소스 최강 LLM 사용법
On this page
GPT-4 수준의 성능을 무료로, 오픈소스로 제공한다. 2024년 말 등장한 DeepSeek V3는 AI 모델 비용 구조를 뒤흔든 존재다.
DeepSeek V3란
DeepSeek V3는 중국 AI 연구소 DeepSeek이 2024년 12월 공개한 오픈소스 대형 언어 모델(LLM)이다. 671B(6,710억) 파라미터 규모의 MoE(Mixture-of-Experts) 아키텍처를 채택했으며, 활성화 파라미터는 37B다. 공개 당시 Aider 코딩 벤치마크에서 Claude 3.5 Sonnet, GPT-4o를 상회하는 성능을 기록했다. Apache 2.0 라이선스로 공개돼 상업적 활용이 가능하다.
DeepSeek V3는 단순 모델 성능 외에 훈련 비용 측면에서도 주목을 받았다. xAI Grok·GPT-4 훈련에 수억 달러가 투입된 것과 달리, DeepSeek V3의 훈련 비용은 약 558만 달러(공식 발표 기준)로 알려져 AI 개발 비용의 상식을 바꿔놓았다.
주요 기능
코딩 성능: HumanEval·SWE-bench 등 코딩 벤치마크에서 일관되게 높은 순위. 코드 생성, 리팩터링, 버그 수정 태스크에서 GPT-4o와 비교 가능한 수준을 보인다.
긴 컨텍스트 처리: 128K 토큰 컨텍스트 윈도우를 지원해 대용량 코드베이스 분석, 긴 문서 요약에 활용 가능하다.
FIM(Fill-in-the-Middle) 지원: 코드 자동완성에 최적화된 FIM 기능으로 Cursor·Vim 등 IDE에서 직접 사용 가능하다.
API 및 로컬 실행: DeepSeek 공식 API(platform.deepseek.com)와 Ollama·vLLM 등을 통한 로컬 실행을 모두 지원한다.
사용법
방법 1 — DeepSeek 공식 API
# API 키 발급: platform.deepseek.com
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "deepseek-chat",
"messages": [
{"role": "user", "content": "이 Python 함수를 TypeScript로 변환해줘"}
]
}'DeepSeek API는 OpenAI API와 호환되는 인터페이스를 제공해 기존 OpenAI SDK 코드에서 base URL만 변경하면 전환 가능하다.
방법 2 — Ollama로 로컬 실행
# Ollama 설치 후
ollama pull deepseek-v3
# 실행 (GPU 없이도 가능하나 성능 저하)
ollama run deepseek-v3전체 671B 모델은 수백 GB의 VRAM/RAM이 필요하다. 일반 개인 GPU 환경에서는 Distilled 소형 버전(1.5B~7B)을 사용하거나 공식 API를 활용하는 것이 현실적이다.
방법 3 — OpenRouter를 통한 통합 접근
// OpenRouter에서 DeepSeek V3 접근
const response = await fetch('https://openrouter.ai/api/v1/chat/completions', {
method: 'POST',
headers: {
Authorization: `Bearer ${process.env.OPENROUTER_KEY}`,
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'deepseek/deepseek-chat',
messages: [{ role: 'user', content: prompt }],
}),
});가격 (2026-04 기준, 공식 페이지 기준)
| 접근 방법 | 가격 | |---|---| | 웹 채팅 (chat.deepseek.com) | 무료 | | API (Input) | $0.27/1M 토큰 (캐시 히트 시 $0.07) | | API (Output) | $1.10/1M 토큰 | | 로컬 실행 (Ollama) | 무료 (하드웨어 비용만) |
Claude 3.5 Sonnet API의 Input $3/1M, Output $15/1M 대비 약 10배 저렴한 수준이다.
*가격은 변동될 수 있으므로 platform.deepseek.com 공식 페이지에서 최신 정보 확인 필요.*
한국 사용자 평가
- 결제: 공식 API는 해외 카드 결제 필요. 국내 카드 지원 여부는 공식 페이지 확인 필요.
- 한국어 품질: 중국어·영어 대비 한국어 응답 품질이 다소 낮다는 사용자 보고 있음. 한국어 전용 작업에는 추가 검증 권장.
- 접속 안정성: 중국 서비스 특성상 국내에서 간헐적 접속 지연 사례 있음. API보다 웹 채팅에서 더 자주 발생.
- 데이터 프라이버시: 중국 법규 적용 서비스. 민감한 비즈니스 데이터는 로컬 실행을 권장.
대안 도구 비교
| 항목 | DeepSeek V3 | GPT-4o | Claude 3.5 Sonnet | |---|---|---|---| | 라이선스 | Apache 2.0 (오픈소스) | 클로즈드 | 클로즈드 | | 코딩 성능 | 상위권 | 상위권 | 상위권 | | API 가격 | 매우 저렴 | 중간 | 중간 | | 한국어 품질 | 중간 | 높음 | 높음 | | 로컬 실행 | 가능 | 불가 | 불가 | | 데이터 프라이버시 | 중국 서버 | 미국 서버 | 미국 서버 |
추천 결론
추천: 비용에 민감한 AI 애플리케이션 개발, 코딩 보조 API, 오픈소스 모델로 로컬 실행이 필요한 경우. 영어 기반 코딩·리서치 태스크에서 비용 대비 성능이 뛰어나다.
괜찮음: 영어 콘텐츠 작성·번역 등 범용 태스크에서 GPT-4o 대비 비용 절감 목적.
별로: 한국어가 주 언어인 서비스, 데이터 프라이버시가 중요한 기업 환경, 안정적인 접속이 필수인 프로덕션 환경.
관련 도구
- ollama — 로컬 LLM 실행 도구
- openrouter — 여러 AI 모델을 단일 API로 접근하는 게이트웨이
- llm — DeepSeek V3를 포함한 대형 언어 모델 개념
- anthropic-api — Claude 모델 API, DeepSeek API와 비교 대안