본문 바로가기

clickhouse2

728x90
실시간 데이터 백엔드 분석법 모듈형 플랫폼 Moose, ClickHouse, Redpanda 구축 기존 데이터 분석 백엔드 구축의 문제점복잡한 인프라: Kafka + ClickHouse + dbt + Airflow + API 서버 각각 관리스키마 불일치: 데이터베이스, API, 메시지 포맷 간 동기화 어려움개발 속도 저하: 로컬 테스트 환경 구축 복잡, 긴 피드백 사이클SQL 중심 개발: 복잡한 비즈니스 로직을 SQL로만 처리하는 한계Moose의 해결책: TypeScript/Python 코드 기반으로 전체 데이터 파이프라인을 통합 관리Moose 아키텍처┌─────────────────┐ ┌──────────────┐ ┌──────────────┐│ Data Sources │────▶│ Moose │────▶│ ClickHouse ││ (API, Kafka) │.. 2025. 7. 25.
Elasticsearch 대량 데이터 효과적 운영을 위한 핫 & 콜드 데이터 관리 Elasticsearch 방대한 양의 데이터를 효과적으로 운영하기 위한 핫 데이터와 콜드 데이터 관리 방식운영 환경에서 대량의 로그 데이터를 수집하고 관리할 때, 성능 최적화와 비용 효율성을 위해 데이터를 핫 데이터(자주 조회되는 최신 데이터)와 콜드 데이터(빈도 낮은 오래된 데이터)로 분류하여 관리하는 전략을 사용할 수 있습니다.핫 데이터와 콜드 데이터 분류 전략핫 데이터(Hot Data)정의: 최근 수집된 데이터로, 조회 빈도가 높고 빠른 검색 성능이 필요한 데이터입니다.저장 위치: Elasticsearch의 빠른 검색 인덱스에 저장합니다.관리: 주로 Elasticsearch의 기본 노드에 저장되며, 고성능 디스크를 사용합니다.콜드 데이터(Cold Data)정의: 일정 기간이 지난 후 접근 빈도가 낮.. 2024. 11. 5.
728x90
728x90