본문 바로가기

PDF20

728x90
PDF 파싱과 변환 및 편집, 프라이버시 중심의 오픈소스 툴 구축 전략 목표 & 요구사항 정의프라이버시: 서버 업로드 없음, 추적/로그 없음, 모든 처리는 로컬 브라우저/내 PC에서만.오픈소스: 재현 가능한 빌드, 라이선스 명확, 의존성 투명.기능 범위(15+개)변환: JPEG/PNG/TXT → PDF, PDF → JPEG/PNG/TXT(텍스트 추출)관리: 압축, 합치기, 분할, 페이지 추출/삭제/정렬/회전, 플랫(Flatten)보안/프라이버시: 메타데이터 삭제, 비밀번호 해제(정당한 소유/암호 보유 시)사용성: 드래그&드롭, 일괄 처리, 용량/건수 제한 없음.확장성: 흔한 PDF 변칙(잘못된 xref, junk 헤더 등)에 대한 복구 경로(salvage path) 내장.아키텍처 개요(브라우저 100% 클라이언트 사이드)코어 엔진(WASM/JS)PDF 렌더/파서: 브라우저에.. 2025. 9. 10.
Sheetgo로 구글 및 스프레드시트와 연동한 데이터 자동화 활용 방법 Sheetgo는 Google Sheets™ 및 기타 스프레드시트를 활용하여 데이터를 관리하고 작업을 자동화하는 강력한 도구입니다. 이에 대한 Sheetgo의 주요 기능과 활용법 예시입니다.1. Sheetgo 시작하기Google Sheets에서 Sheetgo 열기Google Sheets에서 상단 메뉴의 확장 프로그램(Extensions)을 클릭합니다.Sheetgo를 선택해 애드온을 열고 사용을 시작합니다.Sheetgo 계정 연결Sheetgo 계정을 생성하거나 Google 계정으로 로그인합니다.Sheetgo 애드온이 요청하는 필수 권한을 승인합니다.2. Sheetgo의 주요 기능 및 활용 예시1) 데이터 전송 (TRANSFER)Google Sheets 간 데이터 전송활용 사례: 부서별 데이터를 각 팀에서 관.. 2025. 2. 18.
Confluence Wiki 페이지와 하위 페이지 PDF 변환 및 저장 자동화 Confluence Wiki 페이지와 하위 페이지를 PDF로 저장하는 n8n 워크플로를 구성하려면 다음 단계를 따르면 됩니다. 이 과정은 Confluence API와 n8n의 HTTP Request 및 기타 노드를 사용합니다.사전 준비Confluence API 활성화: Confluence Cloud 또는 Server에서 API 호출을 허용해야 합니다.API Token 생성: Confluence Cloud의 경우, Atlassian 계정에서 API Token을 생성하세요.n8n 설정: Confluence에 접근할 수 있는 HTTP Request 노드와 파일 저장용 기능을 사용할 수 있도록 설정하세요.워크플로 구성 단계1. HTTP Request 노드: 루트 페이지 ID 가져오기목적: 지정한 Wiki 페이지.. 2025. 1. 1.
LangChain 활용하여 문서 기반 응답 챗봇(Chatbot) 만들기 LangChain을 통해 문서 검색 챗봇을 만드는 가이드를 초보자도 따라할 수 있도록 단계별로 자세히 정리하겠습니다.1. 환경 설정 및 필요한 패키지 설치먼저 필요한 패키지를 설치합니다. 다음 명령어를 실행하세요.!pip install -q grobid-client langchain openai faiss-cpu PyPDF2 tiktoken2. OpenAI API Key 설정OpenAI API 키를 생성하고 환경 변수에 설정합니다.OpenAI API Key 생성 페이지에서 키를 생성합니다.아래 코드를 사용하여 키를 설정합니다.import openaiimport osos.environ["OPENAI_API_KEY"] = "your_openai_api_key_here"3. PDF 파일 다운로드 및 전처리예제.. 2024. 8. 12.
SnortDLP - an open source DLP solution utilizing snort OverviewSnortDLP a.k.a. "Pig Pen" is an open source data loss prevention project that utilizes Snort to detect the exfiltration of sensitive data.FeaturesWeb based applicationWritten in PHP and utilizes a MySQL backend for cross operating system portabilityAdministrative login to protect unauthorized accessDetermines a unique fingerprint forfree textindividual documentseach document in a reposit.. 2014. 7. 8.
728x90
728x90