monitoring30 728x90 E2E(End-to-End) 테스트와 Smoke Test의 차이점과 올바른 활용법 end-to-end smoke test는 배포 직후 또는 변경 직후, 서비스의 핵심 흐름이 최소한 깨지지 않았는지 빠르게 확인하는 통합 점검입니다. 쉽게 말하면, “이 서비스가 아주 기본적인 수준에서 살아 있는가?”를 보는 가장 얇고 빠른 전 구간 테스트입니다.먼저 용어부터 정리합니다Smoke Test원래 의미는 “연기(smoke)가 나는지 본다”는 뜻에서 왔습니다.예전 하드웨어나 시스템을 켰을 때 불이 나거나 완전히 죽었는지 먼저 확인하는 데서 유래한 표현입니다.현재 소프트웨어에서의 smoke test는 다음 의미로 쓰입니다.서비스가 기동되는지주요 엔드포인트가 응답하는지핵심 기능이 최소한 동작하는지배포 후 즉시 치명적 장애가 없는지즉, 깊이 있는 검증이 아니라 생존 여부 확인입니다.End-to-End(.. 2026. 5. 22. SSH 끊겨도 살아있는 tmux 기반 멀티 터미널 세션 유지 및 Pane 분할 tmux는 터미널 멀티플렉서(Terminal Multiplexer)입니다.하나의 SSH 세션 안에서 여러 개의 터미널 창(Window), 패널(Pane), 세션(Session)을 동시에 관리할 수 있게 해줍니다.특히 서버 운영, 보안 점검, 로그 모니터링, 장시간 배치 작업, 원격 작업 환경에서 매우 강력합니다.SSH 끊겨도 작업 유지여러 터미널을 한 화면에서 분할세션 저장 및 재접속백그라운드 작업 유지로그 모니터링 최적화협업(shared session) 가능문제tmux 해결SSH 끊김으로 작업 종료세션 유지장시간 로그 분석detach 후 유지여러 서버 동시 작업pane/window 분리장애 대응 중 터미널 혼잡구조적 분리실시간 모니터링dashboard 형태 구성원격지 작업reconnect 가능예tcpd.. 2026. 5. 10. 세션 기반 AI Agent 팀 운영 아키텍처: sessions_send · Harness · SSOT 에이전트 간 트리거는 sessions_send로 전달되고, 그 전체 흐름을 하네스가 통제하며, 그 기준 데이터를 SSOT로 운영해야 합니다. 단순히 “에이전트가 대화한다”는 수준이 아니라, 에이전트 팀을 운영하는 방식 자체를 관제 가능한 구조로 바꾸는 설계를 다뤘습니다.즉,에이전트 간 상호작용은 세션 기반에이전트 간 트리거는 sessions_send 중심여러 에이전트를 묶는 운영 레이어는 하네스(harness)그 하네스가 바라보는 단일 기준 데이터는 SSOT관제는 이 흐름을 세션, 메시지, 상태, 비용, 보안 관점에서 모니터링하는 구조로 정리할 수 있습니다.sessions_send의 의미: 에이전트 간 트리거 전달 수단대화 초반에는 “에이전트 간 대화 session send 모니터링 관제 대시보드”라는 .. 2026. 3. 29. Wazuh Indexer(OpenSearch) 모니터링 표준 메트릭, 대시보드, 경보 관제 아래 구성은 3개 노드 Wazuh Indexer(OpenSearch) 클러스터를 대상으로,Prometheus Exporter로 노드 성능 지표 수집 → Prometheus/Grafana 시각화,ElastAlert2로 OpenSearch 쿼리 기반 탐지 → Slack 알림,오류 해결(매핑/호환모드/TLS),Dev Tools(콘솔)에서 바로 실행할 스니펫까지 한 번에 정리한 운영 표준 레시피입니다.인프라 구성 개요(아키텍처)OpenSearch(Wazuh Indexer) ×3각 노드에 opensearch-prometheus-exporter 플러그인 설치/_prometheus/metrics에서 노드 지표 노출Prometheus각 노드 /_prometheus/metrics를 스크레이프(선택) Alertmanage.. 2025. 11. 15. 시스템 멈춤을 잡아내는 커널의 눈, Linux Watchdog 탐지·모니터링·대응 Watchdog가 뭔가요?커널 내장 감시자각 CPU 코어가 정기적으로 “살아있다(heartbeat)” 신호를 내야 합니다.일정 시간 동안 응답이 없으면 락업(lockup) 으로 판단하고 커널 로그에 경고를 남깁니다.종류 요약Soft lockup: 커널/프로세스가 오랫동안 스케줄러에서 빠져나오지 못함(예: 무한 루프, 긴 비마스킹 구간, 드라이버 버그, 과도한 busy-wait)Hard lockup: NMI(Non-Maskable Interrupt) 수준에서도 CPU가 완전 멈춤 (하드웨어/커널 심각 문제)Hung task: 커널이 보기에 태스크가 너무 오래 깨어있지 못함(대기/블로킹) — 별도 감지기패키지와의 차이커널 감지기(지금 로그의 주인공): 기본 내장, 로그 남김/패닉 유도watchdog 데몬(패.. 2025. 8. 17. 이전 1 2 3 4 ··· 6 다음 728x90 728x90