본문 바로가기

LLM34

728x90
LLM 생성 코드 실행의 위협 모델과 방어 설계: 탈출·유출·DoS 통제 LLM이 만든 코드는 “우리 코드”가 아니라 외부 입력(External Input) 과 동일하게 취급해야 합니다.즉, LLM 생성 코드를 실행하는 순간부터는 서버가 ‘코드 실행 플랫폼’이 되며, 공격자 관점에서 아래가 모두 가능합니다.악성 코드 실행: 파일 삭제/변조, 데이터 유출, 채굴 등샌드박스 탈출: 커널/런타임/설정 실수로 호스트·클러스터 권한 획득리소스 고갈(DoS): 무한 루프/메모리·디스크 폭주로 노드/네임스페이스 장애네트워크 악용: 내부망 스캔, C2 통신, 데이터 외부 반출따라서 핵심은 단일 기법이 아니라 “다단계 격리 + 최소권한 + 정책 강제 + 감시/증적” 조합입니다.(A) LLM/에이전트→ 코드/입력/리소스 한도/필요 권한(capabilities)을 “선언”(B) Code Exec.. 2026. 2. 25.
AI 에이전트 샌드박스 아키텍처: just-bash 기반 실행 통제 게이트웨이 에이전트가 생성한 Bash 명령을 그대로 OS에 실행하지 않고, “게이트웨이”를 거쳐 다음을 보장합니다.안전성: 실제 디스크/네트워크/바이너리 실행 위험 최소화정책 준수: 명령 허용/차단/승인(HITL) + 접근제어 + 감사지원재현성: 동일 입력에 동일 결과(가상 FS, 실행 한도)운영성: 로깅/알림/리포트/사고조사(포렌식) 가능한 형태로 구조화just-bash를 게이트웨이 실행 엔진으로 쓰는 이유just-bash는 애초에 AI 에이전트용 “샌드박스 bash”로 설계되어,제공된 파일시스템만 접근 가능네트워크 기본 차단, 필요 시에도 URL prefix + HTTP method allowlist로 제한바이너리/WASM 실행 비지원(풀 VM 필요하면 Vercel Sandbox 권장)무한루프/재귀 방지(단, .. 2026. 2. 24.
내부망 LLM 기반 Internal AI Agent Platform (OpenClaw + MCP) 구축 목표 정의: “완전하게 활용”의 범위부터 딱 잡기내부 LLM + OpenClaw를 제대로 쓰려면, 목표를 아래 4개로 분해해 설계하는 게 안정적입니다.모델 계층: 내부망에서 LLM 추론(서빙) 제공에이전트 계층(OpenClaw): 대화/업무흐름/툴 호출/멀티에이전트 라우팅툴 계층(MCP 서버들): 사내 시스템(티켓/CMDB/로그/DB/웹자동화/파일) 기능을 표준 인터페이스로 제공운영·보안 계층: 권한/감사/네트워크/비밀정보/샌드박스/확장 코드 검증/관측성권장 아키텍처(레퍼런스)논리 구성LLM Inference(내부)선택지 A: Ollama(간편)선택지 B: vLLM/TGI(고성능/대규모)OpenClaw Gateway/Agent Workspaces워크스페이스(에이전트 단위) + 인증/라우팅/채널(메신저/웹.. 2026. 2. 14.
API·AI·Kafka 경계에서 끝내는 보안 표준화 게이트웨이 보안 통제 플랫폼 Kong 3종 게이트웨이 완전 정복 API·AI·Kafka를 한 번에 통제 Kong Gateway(HTTP API) / Kong AI Gateway(LLM·에이전트) / Kong Event Gateway(Kafka 프록시)Kong 게이트웨이 3종 세트: API부터 에이전트·이벤트까지 ‘경계 통제’ 아키텍처AI 시대의 게이트웨이 보안: Kong으로 API·프롬프트·이벤트를 통제하는 방법프롬프트 유출·토큰 폭주·Kafka 난립, Kong으로 한 번에 잡는 거버넌스왜 “게이트웨이 3종 세트”가 필요한가?요즘 서비스는 트래픽이 3종류로 갈라져요.HTTP API: 웹/앱/외부 파트너가 호출하는 일반 API 트래픽LLM·에이전트: 프롬프트/응답, 툴 호출, MCP 같은 “AI 트래픽”Kafka 이벤트: 주문·결제·.. 2026. 1. 2.
AI 에이전트 개발 A to Z 체크리스트 및 실전 구축 아키텍처 종합 매뉴얼 0) 무엇을 만들 건가요? (용어 정리)AI 에이전트: 목표를 받고 → 계획을 세우고 → 도구/지식을 사용해 → 결과를 내며 → 스스로 개선(기억/성찰)하는 시스템필수 구성요소: LLM(추론) · 도구(툴) · 메모리(단/장기) · 지식(RAG) · 계획(Planner/State) · 안전장치(Guard) · 관측(로그/모니터링)1) 목표·요구사항 정의핵심 미션: “무엇을 자동화/대체/가속화할 것인가?”SLO/KPI: 응답시간, 정답률/사실성, 사용자 만족도(CSAT), 월간 비용(원/세션), 실패율리스크: 오조작(잘못된 실행), 데이터 유출, 비용 폭주예시(리서치 에이전트)미션: “주제 키워드 → 10개 신뢰 소스 검증 → 2p 요약 리포트 + 참고 링크”KPI: 60초 내 완료, 허위 인용 0건, 월.. 2025. 8. 28.
728x90
728x90