컨텍스트 관리2 728x90 에이전트 기억은 어떻게? 로컬 Markdown 기반 하이브리드 AI 메모리 설계 일반적인 “대화형 AI”는 세션이 끝나면 기억이 날아가거나, 기억을 저장하더라도 불투명(무엇을 저장했는지 모름)하거나, 벤더 종속(특정 DB/특정 SaaS)이 되기 쉽습니다. 이 구조는 다음을 목표로 합니다.진실의 단일 소스(SoT): 기억의 원본은 로컬 Markdown 파일로 남긴다.빠른 검색: 원본 위에 인덱스(벡터 + 키워드)를 만들어 검색 성능을 확보한다.투명성/소유권: 사용자가 파일을 직접 열어보고 수정하고 Git으로 버전관리할 수 있다.컨텍스트 관리: 토큰 한계 때문에 대화 내용을 요약(컴팩션)하더라도, 중요한 사실은 먼저 파일에 반영(플러시)해 손실을 줄인다.전체 구성이 구조는 크게 3층으로 나뉩니다.저장(원본) 계층: Markdown = 단일 진실MEMORY.md: 장기 기억(지속 사실, .. 2026. 2. 5. ‘앱을 여는 시대’에서 ‘의도를 말하는 시대’ LLM이 커널인 AI OS가 시작된다 AI OS란 무엇인가: “의도(Intent) 중심 운영 계층”전통 OS(Windows/Linux)가 CPU·메모리·파일·프로세스 같은 하드웨어/커널 자원을 관리했다면, 요즘 말하는 AI OS는 중심이 바뀝니다.핵심 추상화가 “프로세스/스레드” → “의도/작업/에이전트”로 이동사용자는 “앱 실행”이 아니라 자연어로 목표(결과)를 지시하고,시스템은 LLM/에이전트가 도구(툴)·데이터·앱·API를 오케스트레이션해 일을 끝냅니다.연구 측면에선 “AIOS: LLM Agent Operating System”이 대표적으로 에이전트를 OS의 관리 대상으로 놓고, 커널이 스케줄링/컨텍스트/메모리/스토리지/접근제어를 제공하는 구조를 제안합니다. 클라우드/엔터프라이즈 관점에선 “AI 워크로드 운영(모델 배포·관측·비용·가속.. 2026. 1. 24. 이전 1 다음 728x90 728x90