본문 바로가기

파싱3

728x90
Jinja2로 JSON 데이터 처리 및 필터링·변환·집계 다루기 고급 활용 1. 기본 개념1.1 Jinja2에서 JSON 처리의 핵심 원리Jinja2는 템플릿 엔진으로, JSON 데이터를 문자열로 변환 후 from_json 필터로 파싱직접적인 객체 조작보다는 문자열 기반 JSON 생성이 더 안정적홈어시스턴트 등 제한된 환경에서는 일부 내장 함수 사용 불가1.2 주요 필터 및 함수{{ data | tojson }} # 객체를 JSON 문자열로 변환{{ json_str | from_json }} # JSON 문자열을 객체로 파싱{{ array | selectattr() }} # 배열에서 특정 속성 기준 필터링{{ array | rejectattr() }} # 배열에서 특정 속성 기준 제외{{ array | map() }} # 배열 각 요소.. 2025. 9. 28.
PDF 파싱과 변환 및 편집, 프라이버시 중심의 오픈소스 툴 구축 전략 목표 & 요구사항 정의프라이버시: 서버 업로드 없음, 추적/로그 없음, 모든 처리는 로컬 브라우저/내 PC에서만.오픈소스: 재현 가능한 빌드, 라이선스 명확, 의존성 투명.기능 범위(15+개)변환: JPEG/PNG/TXT → PDF, PDF → JPEG/PNG/TXT(텍스트 추출)관리: 압축, 합치기, 분할, 페이지 추출/삭제/정렬/회전, 플랫(Flatten)보안/프라이버시: 메타데이터 삭제, 비밀번호 해제(정당한 소유/암호 보유 시)사용성: 드래그&드롭, 일괄 처리, 용량/건수 제한 없음.확장성: 흔한 PDF 변칙(잘못된 xref, junk 헤더 등)에 대한 복구 경로(salvage path) 내장.아키텍처 개요(브라우저 100% 클라이언트 사이드)코어 엔진(WASM/JS)PDF 렌더/파서: 브라우저에.. 2025. 9. 10.
HTML 코드에서 데이터 추출하여 JSON 형식 변환 HTML 코드에서 데이터를 추출하여 JSON 형식으로 변환하는 작업을 수행합니다. 이를 간소화하려면 정규 표현식을 사용하는 대신 더 구조화된 방법을 사용하는 것이 좋습니다. 다음은 Python을 사용하여 같은 작업을 수행하는 방법입니다. Python은 정규 표현식 대신 BeautifulSoup과 같은 라이브러리를 사용하여 HTML 파싱을 더 쉽게 할 수 있습니다. from bs4 import BeautifulSoup import re import json html = """ 여기에 HTML 코드를 입력하세요 """ soup = BeautifulSoup(html, 'html.parser') data = [] for row in soup.find_all('tr'): # 'tr' 태그를 포함하는 모든 행을 찾.. 2023. 9. 23.
728x90
728x90