Rag10 728x90 벡터DB 없이도 되는 보안 컴플라이언스 RAG: Gemini File Search 활용법 왜 Gemini File Search 기반 RAG가 훨씬 쉬운가1) 일반적인(수동) RAG 파이프라인일반적인 RAG는 보통 이런 구성입니다.문서 수집 · 정규화 (PDF → 텍스트 추출)청킹 로직 설계 (문단/조문 기준 분할, 길이/오버랩 튜닝)임베딩 모델 선택 및 임베딩 생성벡터 DB 설치/운영 (Postgres+pgvector, Pinecone, Weaviate, ES 등)검색 쿼리 작성 (kNN, 필터, 랭킹 등)검색 결과를 모델 프롬프트에 주입하는 래퍼 코드 작성추후 문서 추가/수정/삭제 시 인덱스 동기화, 재임베딩 등 관리특히 국가 법령·내부 규정 같이 계속 개정·갱신되는 문서는 “버전 관리 + 인덱스 재생성 + 운영 서버 안전성”까지 고민해야 해서 보안팀 입장에선 운영 리스크가 커집니다.2) .. 2025. 11. 18. AI 에이전트 개발 A to Z 체크리스트 및 실전 구축 아키텍처 종합 매뉴얼 0) 무엇을 만들 건가요? (용어 정리)AI 에이전트: 목표를 받고 → 계획을 세우고 → 도구/지식을 사용해 → 결과를 내며 → 스스로 개선(기억/성찰)하는 시스템필수 구성요소: LLM(추론) · 도구(툴) · 메모리(단/장기) · 지식(RAG) · 계획(Planner/State) · 안전장치(Guard) · 관측(로그/모니터링)1) 목표·요구사항 정의핵심 미션: “무엇을 자동화/대체/가속화할 것인가?”SLO/KPI: 응답시간, 정답률/사실성, 사용자 만족도(CSAT), 월간 비용(원/세션), 실패율리스크: 오조작(잘못된 실행), 데이터 유출, 비용 폭주예시(리서치 에이전트)미션: “주제 키워드 → 10개 신뢰 소스 검증 → 2p 요약 리포트 + 참고 링크”KPI: 60초 내 완료, 허위 인용 0건, 월.. 2025. 8. 28. AI 기반 선언적 로그 분석 플랫폼: 보안 인텔리전스 자동화의 새로운 접근 “정규식·파서 없이 결과 스키마만 선언하면, LLM이 보안 이벤트/이상징후를 구조화 JSON으로 변환 → SIEM 대시보드/알림/IR까지 자동화”“Declarative Log Analysis with LLM — 보안 이벤트 자동 탐지와 SIEM 통합”“LLM-Powered Log Analysis: 구조화된 보안 이벤트 추출과 운영 자동화”“로그는 말한다, AI가 해석한다 — Declarative Security Log Analyzer”“Regex 없는 로그 분석, 선언만 하면 AI가 처리한다”“Log Analysis Reinvented: Declarative Extraction + LLM”“보안 로그 분석의 패러다임 전환 — LLM 선언적 추출과 SIEM 연동”“LLM 기반 SOC 자동화: Wazuh, .. 2025. 8. 27. 대형 언어 모델(LLM) 환경 애플리케이션 권한 최소화 및 보안 아키텍처 1. 주제 정의대형 언어 모델(LLM) 기반 애플리케이션은 단순 대화형 챗봇을 넘어 내부 데이터 검색, 자동화 에이전트, 외부 API 연동 등 점차 업무 핵심 도구로 확산되고 있습니다. 그러나 LLM은 예측 불가능성, 프롬프트 조작(prompt injection), 자동화 속도로 인해 인간 사용자보다 훨씬 높은 보안 리스크를 가집니다. 따라서 LLM 권한 최소화 및 통제 관리란,LLM이 처리하는 모든 요청에서사용자 권한 ∩ LLM 권한 ∩ 태스크 권한의 교집합만 허용하는 실효 권한(effective permissions) 모델을 기반으로리소스 단위까지 권한을 제어하고,인증/인가 체계(OAuth 등)의 한계를 보완하는 보안 아키텍처를 설계하는 것을 의미합니다.2. 주요 원칙2.1 최소 권한 원칙 (Leas.. 2025. 8. 22. LlamaParser + LangChain + Vector DB로 완성하는 RAG 문서형 AI 챗봇 왜 문서 기반 챗봇인가?오늘날 대부분의 기업 정보는 아래와 같은 형태로 존재합니다.📄 PDF 제품 매뉴얼📊 Excel 실적 보고서📑 내부 정책 문서 (Word)🖼️ 이미지 포함된 PPT 발표자료이러한 비정형 문서들은 단순 텍스트가 아니기 때문에, AI가 직접 이해하기 어렵습니다.→ 그래서 문서 → 정제된 텍스트 → 벡터화 → 검색 기반 AI 응답이라는 전체 파이프라인이 필요합니다.전체 파이프라인 구성도문서 업로드 → LlamaParser 파싱 → LangChain 분할 → 임베딩 → 벡터 DB 저장 → 질문 임베딩 → 벡터 검색 → RAG 응답 생성1️⃣ 문서 업로드 └── PDF, PPT, Word, Excel 등 다양한 포맷의 비정형 문서 ↓2️⃣ 문서 파싱 (LlamaPa.. 2025. 8. 3. 이전 1 2 다음 728x90 728x90