본문 바로가기

컨텍스트 최적화2

728x90
“토큰 절약”의 정체, MCP + SQLite + FTS5로 구현하는 Context Mode 요즘 보이는 Context Mode / MCP / Claude mem / caveman 스타일 전부 하나의 흐름입니다.❌ 토큰을 줄인다✅ LLM이 불필요한 데이터를 “안 보게 만든다”왜 이게 유행인가?AI 코딩 에이전트 쓰면 바로 겪습니다.세션 길어지면 느려짐맥락 깨짐비용 증가대용량 데이터 처리 불가이유는 단순합니다.LLM = 입력된 모든 텍스트를 다 읽는다[Raw Data] → [Sandbox / DB 저장] ↓ [검색 / 코드 실행] ↓ [결과만 LLM 전달]핵심“LLM은 처리하지 말고, 결과만 받아라”토큰 절약 4대 전략① 압축 (Compaction)Before대화 전체 계속 누적AfterSession Summar.. 2026. 4. 24.
MCP 도구를 코드로 토큰 98% 절감, Anthropic 방식 컨텍스트 오염 제거 배경과 문제 정의MCP(Model Context Protocol) 는 에이전트가 외부 시스템(Drive, Salesforce, Slack, GitHub, DB 등)에 연결하는 표준 프로토콜입니다. 도구가 늘수록 “도구 정의(스키마/설명)”와 “중간 결과”가 컨텍스트를 잠식해 비용·지연이 급증합니다.Anthropic은 “도구를 직접 호출하지 말고, 도구를 코드 API로 노출한 뒤 모델이 코드를 작성·실행”하도록 구조를 바꾸면, 150K → 2K 토큰(≈98.7% 절감) 이 가능하다고 설명합니다.왜 느려지고 비싸지는가?도구 정의 오염: 수백·수천 개 도구의 스키마/설명이 컨텍스트를 선점.중간 데이터 왕복: 대용량 결과(예: 5만 토큰 문서)를 모델 컨텍스트로 가져왔다가 다음 도구 호출 파라미터로 다시 밀어 .. 2025. 11. 12.
728x90
728x90