본문 바로가기

vector3

728x90
AI 시대의 핵심 인프라, 벡터 DB 운영 Milvus 중심 자가 구축 실무 가이드 벡터 데이터베이스란?벡터 데이터베이스는 고차원 벡터 데이터를 저장하고 유사성 검색을 수행하는 특수한 데이터베이스입니다. AI/ML 애플리케이션에서 텍스트, 이미지, 오디오, 비디오 등의 비정형 데이터를 벡터로 변환하여 저장하고, 코사인 유사도, 유클리드 거리 등을 통해 의미적으로 유사한 데이터를 빠르게 검색할 수 있습니다.벡터 데이터베이스의 핵심 구성 요소벡터 임베딩(Vector Embedding): 비정형 데이터를 수치 벡터로 변환인덱싱 시스템: 고차원 벡터의 빠른 검색을 위한 색인 구조유사성 측정: 벡터 간의 거리/유사도 계산 알고리즘저장 엔진: 대용량 벡터 데이터의 효율적 저장쿼리 엔진: 벡터 검색 및 필터링 처리주요 벡터 데이터베이스 솔루션 비교1. 오픈소스 솔루션Milvus특징클라우드 네이티브 .. 2025. 5. 30.
VectorDB, GraphDB, DocumentDB 개념과 인덱싱 기법 최적화 활용 VectorDB, GraphDB, DocumentDB는 각각 데이터를 저장하고 처리하는 방식에 따라 설계된 데이터베이스 유형입니다. 이들 DB는 다양한 활용 사례에서 사용되며, 각기 다른 인덱싱 기법을 사용하여 성능을 최적화합니다.VectorDB (벡터 데이터베이스)VectorDB는 벡터(다차원 수치 데이터)를 저장하고 효율적으로 검색하는 데 특화된 데이터베이스입니다. 벡터는 특히 머신러닝이나 AI 모델에서 유사도 검색을 위해 많이 사용되며, 이미지, 텍스트, 음성 등을 숫자로 변환한 임베딩 데이터를 다룹니다.주요 특징데이터가 고차원 벡터 형태로 저장됨.유사도 검색(Nearest Neighbor Search, NNS)을 위해 사용됨. 예를 들어, 이미지 검색 시스템에서 특정 이미지와 유사한 이미지를 찾는.. 2025. 1. 13.
벡터(Vector) DB 로컬환경 Docker 구성하고 데이터 추가 및 쿼리 벡터 DB를 로컬 환경에서 Docker를 사용하여 설정하고 데이터를 쿼리하는 과정을 단계별로 설명하겠습니다. 단계 1: Chroma DB GitHub 저장소 복제 Chroma DB를 로컬 머신으로 가져오기 위해 GitHub 저장소를 복제합니다. 이 저장소는 Chroma DB의 소스 코드를 포함하고 있습니다. 아래 명령어를 사용하여 저장소를 복제합니다. git clone https://github.com/chroma-core/chroma 이 명령어를 실행하면 현재 작업 디렉토리에 "chroma" 디렉토리가 생성되고 그 안에 Chroma DB 소스 코드가 복제됩니다. 단계 2: Docker를 사용하여 Chroma 실행 Chroma DB를 Docker 컨테이너로 실행합니다. Docker를 사용하면 Chroma.. 2023. 11. 10.
728x90
728x90