Python75 728x90 Python 기반 로그 모니터링 및 Google Sheets 수집 연동 자동화 여러 로그 파일을 지정하고, 해당 파일에 로그가 적재될 때 자동으로 수집되도록 한 예시코드입니다. 이 코드를 실행하는 데 필요한 Dockerfile도 함께 제공합니다.Python 코드 (monitor_logs.py)import osimport reimport timefrom watchdog.observers import Observerfrom watchdog.events import FileSystemEventHandlerfrom googleapiclient.discovery import buildfrom google.oauth2.service_account import Credentials# Google Sheets API 설정SCOPES = ['https://www.googleapis.com/auth.. 2024. 12. 22. 문서 및 이미지 파일에서 텍스트 추출 워크플로우 구축 가이드 n8n은 다양한 서비스와 어플리케이션을 연결하여 자동화된 워크플로우를 구축할 수 있는 강력한 툴입니다. n8n을 활용하여 문서 및 이미지 파일에서 텍스트를 추출하고, 이를 저장하거나 다른 시스템으로 전송하는 방법입니다. 특히 PDF, 이미지(JPG, PNG, TIFF 등), 문서 파일(DOC, DOCX, PPTX 등)에서 텍스트를 추출하는 방법과 한글 문서 파일인 .hwp 파일 처리 방법, 그리고 Tesseract-OCR을 활용한 이미지 텍스트 추출 방법입니다.n8n 설치 및 기본 설정워크플로우 설계2.1 입력 소스 설정2.2 파일 형식 확인2.3 텍스트 추출2.4 텍스트 처리 및 저장워크플로우 실행 및 테스트결과 확인예제 워크플로우 구성한글 문서(.hwp) 파일 처리 방법6.1 hwp 파일 변환 API.. 2024. 11. 22. 내부 Python 패키지 저장소(PPR) 구축 및 운영 가이드 Python은 광범위한 라이브러리와 패키지를 통해 개발 생산성을 높일 수 있는 언어입니다. 그러나 내부 환경에서 외부 패키지를 직접 사용하는 것은 보안 및 안정성 측면에서 위험을 초래할 수 있습니다. 이를 해결하기 위해 내부에 Python Package Repository(PPR)를 구축하여 허가된 패키지를 관리하고, 내부 사용자들이 안전하게 패키지를 설치할 수 있는 환경을 조성하는 방법입니다.1. Python Package Repository 개요Python Package Repository(PPR)는 Python 패키지를 중앙에서 저장하고 관리하는 저장소입니다. 내부에 PPR을 운영하면 다음과 같은 이점을 얻을 수 있습니다.보안 강화: 외부 인터넷 접근을 최소화하여 보안 위험을 줄입니다.패키지 통제:.. 2024. 11. 21. Python ODBC 통해 리눅스 환경에서 윈도우 SQL Server 연결하기 리눅스 환경에서 Python을 통해 윈도우 SQL Server에 접근하기 위해 필요한 단계별 가이드입니다. 여기에는 패키지 설치, ODBC 드라이버 확인 및 설치, 설정 파일 구성, 파이썬 코드 작성 및 실행이 포함됩니다.1. 패키지 설치ODBC 드라이버와 Python용 pyodbc 패키지를 설치해야 합니다.1.1 ODBC 드라이버 설치SQL Server에 접근하기 위해 Microsoft의 ODBC Driver를 설치해야 합니다.# Microsoft 패키지 키 추가curl https://packages.microsoft.com/keys/microsoft.asc | sudo apt-key add -# Microsoft 패키지 리포지토리 추가curl https://packages.microsoft.com/c.. 2024. 11. 19. Pandas 데이터 전처리 Series와 DataFrame의 이해 및 활용법 Pandas는 Python에서 데이터 분석 및 조작을 위한 강력한 라이브러리입니다. 데이터 과학자, 분석가, 엔지니어들이 데이터를 효과적으로 처리하고 분석하는 데 널리 사용됩니다. Pandas는 특히 테이블 형식의 데이터를 다루는 데 유용하며, 엑셀 스프레드시트와 유사한 방식으로 데이터를 조작할 수 있습니다.Pandas의 핵심 개념SeriesPandas의 가장 기본적인 데이터 구조입니다. Series는 일련의 데이터를 담는 1차원 배열로, 각 데이터에 인덱스(레이블)가 붙어 있습니다.예를 들어, 날짜별 주가 데이터가 Series에 저장될 수 있습니다.import pandas as pd# 간단한 Series 예제data = pd.Series([10, 20, 30, 40], index=['2024-08-01.. 2024. 11. 17. 이전 1 2 3 4 5 ··· 15 다음 728x90 728x90