Embedding3 728x90 벡터DB 없이도 되는 보안 컴플라이언스 RAG: Gemini File Search 활용법 왜 Gemini File Search 기반 RAG가 훨씬 쉬운가1) 일반적인(수동) RAG 파이프라인일반적인 RAG는 보통 이런 구성입니다.문서 수집 · 정규화 (PDF → 텍스트 추출)청킹 로직 설계 (문단/조문 기준 분할, 길이/오버랩 튜닝)임베딩 모델 선택 및 임베딩 생성벡터 DB 설치/운영 (Postgres+pgvector, Pinecone, Weaviate, ES 등)검색 쿼리 작성 (kNN, 필터, 랭킹 등)검색 결과를 모델 프롬프트에 주입하는 래퍼 코드 작성추후 문서 추가/수정/삭제 시 인덱스 동기화, 재임베딩 등 관리특히 국가 법령·내부 규정 같이 계속 개정·갱신되는 문서는 “버전 관리 + 인덱스 재생성 + 운영 서버 안전성”까지 고민해야 해서 보안팀 입장에선 운영 리스크가 커집니다.2) .. 2025. 11. 18. AI 시대의 핵심 인프라, 벡터 DB 운영 Milvus 중심 자가 구축 실무 가이드 벡터 데이터베이스란?벡터 데이터베이스는 고차원 벡터 데이터를 저장하고 유사성 검색을 수행하는 특수한 데이터베이스입니다. AI/ML 애플리케이션에서 텍스트, 이미지, 오디오, 비디오 등의 비정형 데이터를 벡터로 변환하여 저장하고, 코사인 유사도, 유클리드 거리 등을 통해 의미적으로 유사한 데이터를 빠르게 검색할 수 있습니다.벡터 데이터베이스의 핵심 구성 요소벡터 임베딩(Vector Embedding): 비정형 데이터를 수치 벡터로 변환인덱싱 시스템: 고차원 벡터의 빠른 검색을 위한 색인 구조유사성 측정: 벡터 간의 거리/유사도 계산 알고리즘저장 엔진: 대용량 벡터 데이터의 효율적 저장쿼리 엔진: 벡터 검색 및 필터링 처리주요 벡터 데이터베이스 솔루션 비교1. 오픈소스 솔루션Milvus특징클라우드 네이티브 .. 2025. 5. 30. 벡터(Vector) DB 로컬환경 Docker 구성하고 데이터 추가 및 쿼리 벡터 DB를 로컬 환경에서 Docker를 사용하여 설정하고 데이터를 쿼리하는 과정을 단계별로 설명하겠습니다. 단계 1: Chroma DB GitHub 저장소 복제 Chroma DB를 로컬 머신으로 가져오기 위해 GitHub 저장소를 복제합니다. 이 저장소는 Chroma DB의 소스 코드를 포함하고 있습니다. 아래 명령어를 사용하여 저장소를 복제합니다. git clone https://github.com/chroma-core/chroma 이 명령어를 실행하면 현재 작업 디렉토리에 "chroma" 디렉토리가 생성되고 그 안에 Chroma DB 소스 코드가 복제됩니다. 단계 2: Docker를 사용하여 Chroma 실행 Chroma DB를 Docker 컨테이너로 실행합니다. Docker를 사용하면 Chroma.. 2023. 11. 10. 이전 1 다음 728x90 728x90