본문 바로가기

서버구축 (WEB,DB)426

728x90
벡터DB 없이도 되는 보안 컴플라이언스 RAG: Gemini File Search 활용법 왜 Gemini File Search 기반 RAG가 훨씬 쉬운가1) 일반적인(수동) RAG 파이프라인일반적인 RAG는 보통 이런 구성입니다.문서 수집 · 정규화 (PDF → 텍스트 추출)청킹 로직 설계 (문단/조문 기준 분할, 길이/오버랩 튜닝)임베딩 모델 선택 및 임베딩 생성벡터 DB 설치/운영 (Postgres+pgvector, Pinecone, Weaviate, ES 등)검색 쿼리 작성 (kNN, 필터, 랭킹 등)검색 결과를 모델 프롬프트에 주입하는 래퍼 코드 작성추후 문서 추가/수정/삭제 시 인덱스 동기화, 재임베딩 등 관리특히 국가 법령·내부 규정 같이 계속 개정·갱신되는 문서는 “버전 관리 + 인덱스 재생성 + 운영 서버 안전성”까지 고민해야 해서 보안팀 입장에선 운영 리스크가 커집니다.2) .. 2025. 11. 18.
외부 DB 없이 완성하는 워크플로우 자동화: n8n Data Tables 활용 가이드 n8n 신규 기능 업데이트(데이터 테이블 & Python Task Runner)1️⃣ Native Data Tables 기능 도입n8n 내에서 구조화된 데이터를 직접 저장·조회할 수 있는 새로운 기능입니다.외부 DB(MySQL, Postgres 등)를 따로 구축하지 않아도 되고, Credentials 설정도 필요 없습니다.주요 기능n8n 내부에 데이터 테이블 생성·관리 가능구조화된 데이터(JSON 기반) 저장워크플로우에서 Data Table Node를 통해 CRUD 처리 가능간단한 Lookup Table, 상태 저장(State Management)에 적합생성 방법Canvas → Create workflow 드롭다운 → Create Data tableNode Panel → Data Table Node 삽입.. 2025. 11. 16.
Wazuh Indexer(OpenSearch) 모니터링 표준 메트릭, 대시보드, 경보 관제 아래 구성은 3개 노드 Wazuh Indexer(OpenSearch) 클러스터를 대상으로,Prometheus Exporter로 노드 성능 지표 수집 → Prometheus/Grafana 시각화,ElastAlert2로 OpenSearch 쿼리 기반 탐지 → Slack 알림,오류 해결(매핑/호환모드/TLS),Dev Tools(콘솔)에서 바로 실행할 스니펫까지 한 번에 정리한 운영 표준 레시피입니다.인프라 구성 개요(아키텍처)OpenSearch(Wazuh Indexer) ×3각 노드에 opensearch-prometheus-exporter 플러그인 설치/_prometheus/metrics에서 노드 지표 노출Prometheus각 노드 /_prometheus/metrics를 스크레이프(선택) Alertmanage.. 2025. 11. 15.
MCP 도구를 코드로 토큰 98% 절감, Anthropic 방식 컨텍스트 오염 제거 배경과 문제 정의MCP(Model Context Protocol) 는 에이전트가 외부 시스템(Drive, Salesforce, Slack, GitHub, DB 등)에 연결하는 표준 프로토콜입니다. 도구가 늘수록 “도구 정의(스키마/설명)”와 “중간 결과”가 컨텍스트를 잠식해 비용·지연이 급증합니다.Anthropic은 “도구를 직접 호출하지 말고, 도구를 코드 API로 노출한 뒤 모델이 코드를 작성·실행”하도록 구조를 바꾸면, 150K → 2K 토큰(≈98.7% 절감) 이 가능하다고 설명합니다.왜 느려지고 비싸지는가?도구 정의 오염: 수백·수천 개 도구의 스키마/설명이 컨텍스트를 선점.중간 데이터 왕복: 대용량 결과(예: 5만 토큰 문서)를 모델 컨텍스트로 가져왔다가 다음 도구 호출 파라미터로 다시 밀어 .. 2025. 11. 12.
Kafka 클라우드 전환 전략: 오브젝트 스토리지 시대의 보안과 안정성 Apache Kafka의 “디스크리스(Diskless)” 또는 “직접 S3(오브젝트 스토리지) 적용” 설계 방향의 기술 배경 및 고려할 점입니다.개요 및 배경최근 Kafka 커뮤니티에서는 여러 KIP (Kafka Improvement Proposal) 가 동시다발적으로 제안되었고, 그 중심 주제는 바로 클라우드 가용영역(AZ) 간 복제 비용 및 오브젝트 스토리지 활용입니다.단순히 기술적 선택지로만 다루는 것이 아니라, Kafka가 앞으로 “어떤 시스템이 될 것인가?”라는 방향성 차원에서 접근하고 있습니다.요약하자면전통적으로 Kafka는 디스크 기반 로그 세그먼트를 이용해, 리더-팔로워 복제 모델로 데이터를 보관하고 높은 처리량/낮은 지연(latency)을 확보해 왔습니다.그러나 클라우드·멀티 AZ 환경에.. 2025. 11. 4.
728x90
728x90