본문 바로가기

Red Teaming2

AI 스킬 검증 실전: 개인정보·민감정보 누출을 찾고 측정하고 고치는 방법 목표는 AI 에이전트 스킬(skill)을 개인정보·민감정보·주요정보 관점에서 직접 테스트·검증 가능한 방안으로 실무에서 그대로 따라 해볼 수 있도록 절차, 예제(명령어/스크립트/프롬프트), 체크리스트, 측정 지표, 보고서 템플릿까지 포함합니다. 에이전트 스킬은 편리하지만, 스킬이 내부 데이터 접근/도구 실행/파일·API 호출을 하도록 설계되어 있다면 개인정보(PII)·민감정보·주요정보 누출 위험이 큽니다. 따라서 테스트 데이터 생성 → 유닛/통합/엔드투엔드 테스트 → 레드팀(공격 시나리오) → 측정(지표) → 개선(재검증)의 순환적 프로세스를 운영해야 합니다.배경 및 왜 중요한가스킬은 ChatGPT/Claude 같은 에이전트에게 재사용 가능한 업무 규칙, 스크립트, 자산(템플릿) 등을 제공하여 자동화 품.. 2026. 3. 15.

Woodpecker 기반 K8s·API·LLM 다계층 통합 레드팀 자동화 플랫폼 1. 목적과 범위목적: 프로덕트·플랫폼·AI 서비스 전반의 공격 시뮬레이션 자동화로, 취약점 빠른 탐지 → 우선순위화 → 시정 → 재검증(회귀) 를 CI/CD에 내재화합니다.대상K8s: 권한·격리·네트워킹·스토리지·이미지·시크릿API: 인증·인가·입력검증·데이터 노출·레이트리밋·MisconfigAI/LLM: 프롬프트 인젝션·데이터 포이즈닝·출력 유출·도구 오남용원칙: 스테이징 우선, 운영은 Change 승인 하 비파괴·저충격 범위로 제한.2. 도구 개념과 구성Experiments: 실제 공격 행동을 YAML/JSON 시나리오로 정의, 실행해 증거를 남깁니다.Verifiers: 실행 결과를 기준(상태코드/패턴/메트릭)으로 판정(성공/실패/심각도).Components: 특정 실험이 의존하는 K8s 배포물/보.. 2025. 8. 28.

이전 1 다음

728x90

티스토리툴바