본문 바로가기

transform3

아파치 플링크(Apache Flink) 스트림 프로세싱 프레임워크 구성 Apache Flink 개요Apache Flink는 고성능, 저지연, 그리고 분산 스트리밍 데이터 처리 시스템입니다. Flink는 실시간 스트리밍 데이터와 배치 데이터를 모두 처리할 수 있는 유연한 플랫폼을 제공합니다. 주로 실시간 분석, 데이터 파이프라인, ETL(Extract, Transform, Load) 작업, 이벤트 기반 애플리케이션 등에 사용됩니다.주요 특징저지연 스트리밍 처리: Flink는 이벤트가 발생하는 즉시 데이터를 처리할 수 있습니다.높은 처리량: 분산 시스템 구조로 인해 대규모 데이터도 빠르게 처리할 수 있습니다.상태 관리: Flink는 상태 기반의 스트리밍 작업을 지원하며, 상태를 효율적으로 관리할 수 있는 기능을 제공합니다.유연한 API: DataStream API와 DataSe.. 2024. 7. 9.
Cloudflare Workers 프록시 원본 서버 전달 시 헤더값 조작 방법 Cloudflare Workers를 사용하여 요청을 프록시할 때, 대부분의 헤더 값을 수정할 수 있지만 Host 헤더는 변경할 수 없습니다. Host 헤더는 원본 서버에 대한 정보를 가지고 있으며, 보안상의 이유로 Cloudflare는 이 헤더의 수정을 허용하지 않습니다. 따라서, 사용자가 Cloudflare Workers를 통해 요청을 보낼 때, Host 헤더는 자동으로 원본 서버의 호스트 이름으로 설정되며 이를 변경하는 것은 불가능합니다. Host 헤더를 직접 변경할 수 없는 상황에서 요청 URL의 첫 번째 폴더명을 백엔드 호스트 이름으로 사용하려면 다음과 같은 방법을 고려할 수 있습니다.1. 서브도메인 사용URL의 첫 번째 폴더명을 서브도메인으로 이용하는 방식을 고려할 수 있습니다. 예를 들어, h.. 2024. 6. 29.
네트워크 패킷 실시간 수집분석 효율적인 중복제거 및 특이사항 필터링 네트워크 패킷을 syslog를 통해 수집할 때, 데이터의 양이 많아 중복 항목을 효율적으로 제거하는 방법(Network Packet Deduplication Strategies)은 여러 가지가 있습니다. 중복 데이터를 제거하는 것은 저장 공간을 절약하고, 분석을 더 빠르고 정확하게 만들어줍니다.해시 함수 사용: 각 패킷에 대한 해시 값을 계산하고, 이 값을 기반으로 중복을 확인합니다. SHA-256 또는 MD5와 같은 해시 함수를 사용하여 각 패킷의 고유한 지문을 생성할 수 있습니다. 이 방법은 데이터의 무결성 검사에도 유용합니다.데이터 정규화: 데이터를 분석하기 전에, 가능한 한 모든 패킷을 표준 형식으로 정규화합니다. 이것은 IP 주소, 타임스탬프 등의 필드에서 발생할 수 있는 미세한 차이를 제거하여.. 2024. 5. 15.