Home / AI / AI 용어사전 / 데이터베이스 — AI 서비스 뒤에 숨은 정보 저장소의 원리
TERM
데이터베이스 — AI 서비스 뒤에 숨은 정보 저장소의 원리
On this page
AI 앱을 만들면 반드시 만나는 질문이 있다. "사용자 데이터는 어디에 저장하지?" 채팅 기록, 사용자 정보, AI가 참조할 문서 — 이 모든 것을 담는 그릇이 데이터베이스(Database)다.
정의
데이터베이스(Database, DB)는 구조화된 방식으로 데이터를 저장하고, 효율적으로 조회·수정·삭제할 수 있도록 관리하는 시스템이다. 데이터베이스를 관리하는 소프트웨어를 DBMS(Database Management System)라 한다.
AI 앱에서 데이터베이스는 두 가지 역할을 한다. 첫째는 전통적 역할 — 사용자 정보, 대화 기록, 설정값을 저장. 둘째는 AI 전용 역할 — LLM이 참조할 문서를 embedding 벡터로 저장하고 유사도 검색을 실행하는 vector-database.
관계형 데이터베이스 — SQL의 세계
관계형 DB(RDBMS, Relational Database Management System)는 데이터를 행(row)과 열(column)로 이루어진 테이블에 저장하고, 테이블 간 관계를 외래키(Foreign Key)로 연결한다. 조회 언어로 SQL(Structured Query Language)을 사용한다.
-- 사용자 테이블에서 AI 구독자 조회
SELECT id, email, created_at
FROM users
WHERE plan = 'pro'
ORDER BY created_at DESC
LIMIT 100;대표 RDBMS: PostgreSQL(오픈소스, AI 앱 표준), MySQL(웹 앱 전통적 선택), SQLite(로컬·임베디드), Supabase(PostgreSQL 기반 BaaS).
AI 앱 스택에서 PostgreSQL은 사실상 표준이다. Supabase는 PostgreSQL을 클라우드 서비스로 제공하면서 인증, 스토리지, 실시간 구독까지 통합해 Next.js + AI API 조합의 기본 스택이 됐다.
NoSQL 데이터베이스 — 유연한 구조
NoSQL DB는 테이블·스키마 없이 다양한 형태로 데이터를 저장한다. AI 서비스에서 빠른 조회나 유연한 문서 구조가 필요할 때 사용한다.
| 유형 | 특징 | 대표 서비스 | AI 활용 | |---|---|---|---| | 문서형 | JSON 형태 저장 | MongoDB, Firestore | 채팅 기록, 설정값 | | 키-값 | 단순 key → value | Redis, Upstash | 세션, 캐시, 속도 제한 | | 그래프 | 노드·엣지 관계 | Neo4j | 지식 그래프, RAG 강화 | | 열 지향 | 분석 최적화 | BigQuery, Redshift | AI 학습 데이터 집계 |
Redis는 AI 앱에서 특히 자주 쓰인다. API 응답 캐싱, 사용자별 요청 속도 제한(Rate Limiting), LLM 스트리밍 세션 임시 저장 등에 활용된다.
벡터 데이터베이스 — RAG의 핵심 인프라
벡터 데이터베이스(Vector Database)는 AI 분야에서 새롭게 등장한 DB 유형이다. 텍스트나 이미지를 embedding 벡터로 변환해 저장하고, 의미 유사도 기반으로 검색한다. 기존 DB의 "정확한 일치(exact match)" 검색과 달리, "의미적으로 비슷한" 데이터를 찾는다.
사용 흐름:
사용자 질문 → 임베딩 변환 → 벡터 DB 유사도 검색 → 관련 문서 추출 → LLM 컨텍스트 주입 → 답변 생성이 패턴이 rag(RAG, Retrieval-Augmented Generation)의 핵심이다. 대표 서비스: Pinecone, Weaviate, Qdrant, pgvector(PostgreSQL 확장).
pgvector는 기존 PostgreSQL에 벡터 검색을 추가하는 확장이다. Supabase가 기본으로 지원해, 별도 벡터 DB 없이 하나의 DB에서 관계형 데이터와 벡터 검색을 모두 처리할 수 있다.
AI 앱 데이터베이스 선택 가이드
| 요구사항 | 추천 DB | |---|---| | 사용자·주문·콘텐츠 관리 | PostgreSQL (Supabase) | | 실시간 채팅·알림 | Supabase Realtime 또는 Firebase | | API 캐시·세션 | Redis (Upstash — 서버리스 Redis) | | 문서 검색·RAG | pgvector 또는 Pinecone | | 대규모 로그 분석 | BigQuery (GCP) |
관련 용어
- sql — 관계형 데이터베이스 표준 조회 언어
- vector-database — 임베딩 벡터 저장 + 유사도 검색 전용 DB
- api — 앱과 데이터베이스를 연결하는 인터페이스 계층
- rag — 벡터 DB를 활용해 LLM에 외부 지식을 주입하는 패턴
- embedding — 텍스트를 벡터로 변환하는 AI 기법, 벡터 DB의 전제 조건
- supabase — PostgreSQL 기반 오픈소스 BaaS, AI 앱 표준 스택