프로그램 (PHP,Python)253 728x90 슬랙 채널 데이타를 수집하고 학습하여 질의에 자동응답 슬랙 채널에서 특정 기간동안 소통한 스레드 데이터를 수집하고, 전처리하며, GPT 모델을 학습시키고, 학습된 모델을 사용하여 질의에 응답하는 것을 포함합니다.1. Slack API를 통한 데이터 수집Slack의 API를 사용하여 특정 채널의 스레드 및 댓글 데이터를 수집할 수 있습니다.Slack API 토큰 생성: Slack API에 접근하기 위해서는 OAuth 토큰이 필요합니다. Slack 앱을 생성하고 필요한 권한을 설정하여 토큰을 얻습니다.API 엔드포인트 사용conversations.history: 특정 채널의 메시지 내역을 가져옵니다.conversations.replies: 특정 메시지에 대한 스레드 및 댓글을 가져옵니다.Python 예시 코드import osfrom slack_sdk impor.. 2024. 11. 25. 문서 및 이미지 파일에서 텍스트 추출 워크플로우 구축 가이드 n8n은 다양한 서비스와 어플리케이션을 연결하여 자동화된 워크플로우를 구축할 수 있는 강력한 툴입니다. n8n을 활용하여 문서 및 이미지 파일에서 텍스트를 추출하고, 이를 저장하거나 다른 시스템으로 전송하는 방법입니다. 특히 PDF, 이미지(JPG, PNG, TIFF 등), 문서 파일(DOC, DOCX, PPTX 등)에서 텍스트를 추출하는 방법과 한글 문서 파일인 .hwp 파일 처리 방법, 그리고 Tesseract-OCR을 활용한 이미지 텍스트 추출 방법입니다.n8n 설치 및 기본 설정워크플로우 설계2.1 입력 소스 설정2.2 파일 형식 확인2.3 텍스트 추출2.4 텍스트 처리 및 저장워크플로우 실행 및 테스트결과 확인예제 워크플로우 구성한글 문서(.hwp) 파일 처리 방법6.1 hwp 파일 변환 API.. 2024. 11. 22. Python ODBC 통해 리눅스 환경에서 윈도우 SQL Server 연결하기 리눅스 환경에서 Python을 통해 윈도우 SQL Server에 접근하기 위해 필요한 단계별 가이드입니다. 여기에는 패키지 설치, ODBC 드라이버 확인 및 설치, 설정 파일 구성, 파이썬 코드 작성 및 실행이 포함됩니다.1. 패키지 설치ODBC 드라이버와 Python용 pyodbc 패키지를 설치해야 합니다.1.1 ODBC 드라이버 설치SQL Server에 접근하기 위해 Microsoft의 ODBC Driver를 설치해야 합니다.# Microsoft 패키지 키 추가curl https://packages.microsoft.com/keys/microsoft.asc | sudo apt-key add -# Microsoft 패키지 리포지토리 추가curl https://packages.microsoft.com/c.. 2024. 11. 19. Google Apps Script 활용한 메일 자동화, AI 슬랫봇 만들기 메일 자동화를 위한 수신 메일 분류 및 특정 키워드 기반 액션 워크플로우 수행을 위한 기반 환경을 구성하려면 Google Workspace의 다양한 도구를 활용해야 합니다. 이 작업은 주로 Google Apps Script와 Gmail 필터, Google Drive, Google Sheets 등을 활용하여 이루어질 수 있습니다. 다음은 이 작업을 수행하는 단계별 가이드입니다.1. Gmail 필터 설정Gmail에서 특정 키워드나 조건에 맞는 메일을 자동으로 분류하기 위해 필터를 설정해야 합니다.1.1 필터 생성Gmail 열기: Gmail을 열고, 상단 검색창 오른쪽에 있는 화살표를 클릭합니다.조건 입력: 예를 들어, 메일 제목에 "invoice"가 포함된 메일을 분류하고 싶다면, "Subject" 필드에 .. 2024. 11. 18. Pandas 데이터 전처리 Series와 DataFrame의 이해 및 활용법 Pandas는 Python에서 데이터 분석 및 조작을 위한 강력한 라이브러리입니다. 데이터 과학자, 분석가, 엔지니어들이 데이터를 효과적으로 처리하고 분석하는 데 널리 사용됩니다. Pandas는 특히 테이블 형식의 데이터를 다루는 데 유용하며, 엑셀 스프레드시트와 유사한 방식으로 데이터를 조작할 수 있습니다.Pandas의 핵심 개념SeriesPandas의 가장 기본적인 데이터 구조입니다. Series는 일련의 데이터를 담는 1차원 배열로, 각 데이터에 인덱스(레이블)가 붙어 있습니다.예를 들어, 날짜별 주가 데이터가 Series에 저장될 수 있습니다.import pandas as pd# 간단한 Series 예제data = pd.Series([10, 20, 30, 40], index=['2024-08-01.. 2024. 11. 17. 이전 1 ··· 7 8 9 10 11 12 13 ··· 51 다음 728x90 728x90