Nanonets-OCR-s: 문서를 마크다운으로 바꾸는 가장 똑똑한 방법
Nanonets-OCR-s는 단순 OCR을 넘어 문서의 레이아웃, 시맨틱 구조, 시각적 요소까지 모두 인식해 구조화된 마크다운 형태로 출력하는 이미지-텍스트 변환 모델입니다.기반 모델: Qwen2.5-VL-3B-Instruct 기반 파인튜닝출력 형태: Markdown, HTML, LaTeX활용 목적계약서, 양식, 설문지 등 다양한 포맷을 LLM 친화적으로 정제정보 추출, 검색, 문서 분류 등 downstream 작업에 최적화Web UI, API, PDF 변환 파이프라인 등에 연동 가능핵심 기능 정리기능명설명📐 수식 인식수학 수식, 공식 등을 LaTeX 형식으로 변환$...$ 또는 $$...$$🖼️ 이미지 설명 생성 태그에 이미지 성격/스타일/내용 등을 자동 기술✍️ 서명 인식서명을 감지하고 태그로 ..
2025. 7. 31.