본문 바로가기

분류 전체보기3519

728x90
Nanonets-OCR-s: 문서를 마크다운으로 바꾸는 가장 똑똑한 방법 Nanonets-OCR-s는 단순 OCR을 넘어 문서의 레이아웃, 시맨틱 구조, 시각적 요소까지 모두 인식해 구조화된 마크다운 형태로 출력하는 이미지-텍스트 변환 모델입니다.기반 모델: Qwen2.5-VL-3B-Instruct 기반 파인튜닝출력 형태: Markdown, HTML, LaTeX활용 목적계약서, 양식, 설문지 등 다양한 포맷을 LLM 친화적으로 정제정보 추출, 검색, 문서 분류 등 downstream 작업에 최적화Web UI, API, PDF 변환 파이프라인 등에 연동 가능핵심 기능 정리기능명설명📐 수식 인식수학 수식, 공식 등을 LaTeX 형식으로 변환$...$ 또는 $$...$$🖼️ 이미지 설명 생성 태그에 이미지 성격/스타일/내용 등을 자동 기술✍️ 서명 인식서명을 감지하고 태그로 .. 2025. 7. 31.
인터넷 없어도 OK! 코딩 없이 LM Studio로 내 컴퓨터에 AI 비서 환경 구축 LM Studio 로컬 AI의 모든 것LM Studio는 로컬 환경에서 대규모 언어 모델(LLM)을 실행할 수 있는 올인원 데스크톱 애플리케이션입니다. 복잡한 설정 없이 누구나 자신의 컴퓨터에서 AI를 구동할 수 있도록 설계되었습니다.주요 장점🔒 완벽한 프라이버시: 모든 처리가 로컬에서 이루어짐💻 사용자 친화적 GUI: 코딩 지식 불필요🌐 오프라인 작동: 모델 다운로드 후 인터넷 없이 사용 가능💰 무료: 애플리케이션과 대부분의 모델이 무료🔧 간편한 설치: 몇 번의 클릭으로 설치 완료시스템 요구사항구분최소 사양권장 사양CPU4코어 이상8코어 이상RAM8GB16GB 이상저장공간10GB50GB 이상OSWindows 10, macOS 10.15, Ubuntu 20.04최신 버전설치 및 초기 설정1. 다.. 2025. 7. 31.
Lucene 기반 Elasticsearch Text vs Keyword 필드 타입 쿼리 최적화 Text 필드 (Analyzed Field)텍스트를 토큰으로 분리하여 저장전문 검색(Full-text search)에 최적화대소문자 변환, 형태소 분석 등 텍스트 처리 수행// 원본: "Hello World 2024"// 저장: ["hello", "world", "2024"] // 토큰화 + 소문자 변환Keyword 필드전체 문자열을 하나의 단위로 저장정확한 일치, 정렬, 집계에 최적화원본 그대로 저장 (대소문자 유지)// 원본: "Hello World 2024"// 저장: "Hello World 2024" // 그대로 저장토큰화 과정 상세 분석1. Standard Analyzer 동작 방식GET /_analyze{ "text": "web-prod-ab12-server.company.com", ".. 2025. 7. 30.
GPT-4를 위협하는 오픈소스 AI 코딩 모델, Qwen3-Coder 전격 공개 ― 초거대 오픈소스 AI 코딩 모델의 성능, 활용법, 그리고 보안 가이드개요 및 배경● 무엇이 발표되었나?2025년 7월, 알리바바 그룹 산하의 인공지능 연구소에서 오픈소스 코딩 특화 AI 모델 Qwen3‑Coder를 출시.가장 큰 특징은 GPT-4 수준의 성능을 제공하면서도 오픈소스로 상업적 이용까지 허용한다는 점.● 왜 중요한가?기존 GPT-4, Claude, Gemini 등은 대부분 상용 서비스에 종속되거나 사용 제약이 있음.Qwen3-Coder는 누구나 다운로드하고 로컬 또는 자체 인프라에 설치해 사용할 수 있음 → 기업 내부 개발 보조, 자동화, 보안 분석 등 다양한 분야로 확장 가능.● 핵심 가치 제안✅ 오픈소스: Apache 2.0 라이선스로 상업적 사용 자유✅ 고성능: GPT-4, Clau.. 2025. 7. 30.
내부망 보안 강화를 위한 리눅스 패키지 미러 자동화와 패치 모니터링 리눅스 패키지 생태계 개요대부분의 리눅스 배포판(Ubuntu, Debian, CentOS, Arch 등)은 OS 및 패키지를 다음과 같은 구조로 배포합니다.[개발자/벤더] → [공식 저장소] → [전 세계 미러 서버] → [사용자]공식 저장소 (Canonical, ArchLinux 등): 패키지를 빌드하고 검증한 후 저장미러 서버: 전 세계 ISP, 대학, 조직 등이 rsync 또는 HTTP 방식으로 주기적으로 동기화사용자(클라이언트): apt, dnf, pacman 등의 패키지 매니저를 통해 가장 가까운 미러에서 다운로드❗ 패키지 설치/업데이트 시, 리눅스 시스템은 자동으로 가장 가까운 또는 가장 빠른 미러를 선택하거나 사용자가 직접 지정 가능내부 미러의 필요성필요성설명보안 및 통제외부 인터넷을 차단한.. 2025. 7. 29.
728x90
728x90