본문 바로가기

Python69

문서 및 이미지 파일에서 텍스트 추출 워크플로우 구축 가이드 n8n은 다양한 서비스와 어플리케이션을 연결하여 자동화된 워크플로우를 구축할 수 있는 강력한 툴입니다. n8n을 활용하여 문서 및 이미지 파일에서 텍스트를 추출하고, 이를 저장하거나 다른 시스템으로 전송하는 방법입니다. 특히 PDF, 이미지(JPG, PNG, TIFF 등), 문서 파일(DOC, DOCX, PPTX 등)에서 텍스트를 추출하는 방법과 한글 문서 파일인 .hwp 파일 처리 방법, 그리고 Tesseract-OCR을 활용한 이미지 텍스트 추출 방법입니다.n8n 설치 및 기본 설정워크플로우 설계2.1 입력 소스 설정2.2 파일 형식 확인2.3 텍스트 추출2.4 텍스트 처리 및 저장워크플로우 실행 및 테스트결과 확인예제 워크플로우 구성한글 문서(.hwp) 파일 처리 방법6.1 hwp 파일 변환 API.. 2024. 11. 22.
내부 Python 패키지 저장소(PPR) 구축 및 운영 가이드 Python은 광범위한 라이브러리와 패키지를 통해 개발 생산성을 높일 수 있는 언어입니다. 그러나 내부 환경에서 외부 패키지를 직접 사용하는 것은 보안 및 안정성 측면에서 위험을 초래할 수 있습니다. 이를 해결하기 위해 내부에 Python Package Repository(PPR)를 구축하여 허가된 패키지를 관리하고, 내부 사용자들이 안전하게 패키지를 설치할 수 있는 환경을 조성하는 방법입니다.1. Python Package Repository 개요Python Package Repository(PPR)는 Python 패키지를 중앙에서 저장하고 관리하는 저장소입니다. 내부에 PPR을 운영하면 다음과 같은 이점을 얻을 수 있습니다.보안 강화: 외부 인터넷 접근을 최소화하여 보안 위험을 줄입니다.패키지 통제:.. 2024. 11. 21.
Python ODBC 통해 리눅스 환경에서 윈도우 SQL Server 연결하기 리눅스 환경에서 Python을 통해 윈도우 SQL Server에 접근하기 위해 필요한 단계별 가이드입니다. 여기에는 패키지 설치, ODBC 드라이버 확인 및 설치, 설정 파일 구성, 파이썬 코드 작성 및 실행이 포함됩니다.1. 패키지 설치ODBC 드라이버와 Python용 pyodbc 패키지를 설치해야 합니다.1.1 ODBC 드라이버 설치SQL Server에 접근하기 위해 Microsoft의 ODBC Driver를 설치해야 합니다.# Microsoft 패키지 키 추가curl https://packages.microsoft.com/keys/microsoft.asc | sudo apt-key add -# Microsoft 패키지 리포지토리 추가curl https://packages.microsoft.com/c.. 2024. 11. 19.
Pandas 데이터 전처리 Series와 DataFrame의 이해 및 활용법 Pandas는 Python에서 데이터 분석 및 조작을 위한 강력한 라이브러리입니다. 데이터 과학자, 분석가, 엔지니어들이 데이터를 효과적으로 처리하고 분석하는 데 널리 사용됩니다. Pandas는 특히 테이블 형식의 데이터를 다루는 데 유용하며, 엑셀 스프레드시트와 유사한 방식으로 데이터를 조작할 수 있습니다.Pandas의 핵심 개념SeriesPandas의 가장 기본적인 데이터 구조입니다. Series는 일련의 데이터를 담는 1차원 배열로, 각 데이터에 인덱스(레이블)가 붙어 있습니다.예를 들어, 날짜별 주가 데이터가 Series에 저장될 수 있습니다.import pandas as pd# 간단한 Series 예제data = pd.Series([10, 20, 30, 40], index=['2024-08-01.. 2024. 11. 17.
내부 네트워크 활동중인 IP 주소 및 운영체제(OS) 정보 수집 내부 네트워크에서 활성화된 IP 주소들의 운영체제(OS) 정보를 수집하기 위해 네트워크 스캐닝 도구를 사용할 수 있습니다. 대표적인 도구로는 Nmap이 있습니다. Nmap은 네트워크 탐색 및 보안 감사에 널리 사용되는 오픈 소스 도구로, IP 주소의 활성 상태 확인 및 OS 식별 등의 기능을 제공합니다. 다음은 Nmap을 사용하여 내부 네트워크의 IP 주소를 스캔하고 OS 정보를 수집하는 방법입니다.Nmap 설치대부분의 리눅스 배포판에서는 패키지 관리자를 통해 쉽게 설치할 수 있습니다. Ubuntu / Debiansudo apt-get updatesudo apt-get install nmapCentOS / RHELsudo yum install nmapWindowsNmap 공식 웹사이트에서 Windows .. 2024. 11. 7.
728x90