본문 바로가기

ollama3

728x90
Ollama Codex App 충격적인 변화 로컬 AI를 넘어 에이전트 개발 플랫폼 로컬 LLM 런타임에서 “에이전트형 개발 워크스페이스”로의 진화이번 Ollama 0.24 업데이트는 단순한 기능 추가 수준이 아니라, Ollama의 방향성이 크게 바뀌고 있다는 점에서 매우 중요합니다.기존 Ollama는 주로 다음과 같은 역할이었습니다.로컬 LLM 실행모델 다운로드 및 관리OpenAI 호환 API 제공로컬 AI 실험 환경하지만 이번 업데이트 이후에는 다음 영역까지 확장되고 있습니다.AI 에이전트 기반 개발환경Git 기반 병렬 작업Worktree 기반 격리 개발UI Annotation 기반 코드 수정브라우저 내 코드 수정 루프로컬 + 클라우드 하이브리드 AI 워크플로우Agent IDE 스타일 개발 환경즉,“로컬 AI 모델 실행기” → “AI 기반 개발 작업 플랫폼”으로 진화 중이라고 볼 수.. 2026. 5. 16.
Mac Mini로 로컬 AI 완성하기: Swap, Ollama, Metal 최적화 가이드 맥미니에서 LLM이 어려운 이유LLM 리소스 특성모델필요 메모리qwen:7B약 4~8GBgemma:7B약 4~8GBqwen:14B10~16GBllama3:8B6~10GB👉 문제맥미니 8GB / 16GB → 부족macOS 메모리 흐름RAM 사용Memory CompressionSwap 사용👉 LLM은메모리 압축 효과 낮음swap 사용 시 속도 매우 느림Swap 관점 전략전략 1: swap “활용”이 아니라 “버티기 용도”👉 목표swap = fallbackRAM = 실제 실행전략 2: swap 모니터링 필수vm_stat 1sysctl vm.swapusage전략 3: swap 발생 시 판단 기준상태대응swap 정상swap 증가 지속모델 과도swap + CPU 100%다운그레이드 필요LLM 운영 구조 설계?.. 2026. 4. 12.
OpenAI 오픈소스 LLM 모델 GPT-OSS 공개로 로컬에서 자유롭게 활용 OpenAI는 두 가지 강력한 오픈 웨이트(open-weight) 언어 모델을 출시하며 오픈소스 AI 생태계에 큰 전환점을 만들었습니다. 이 두 모델은 다음과 같습니다.gpt-oss-120b: o4-mini 수준의 성능을 갖춘 대규모 모델gpt-oss-20b: o3-mini 수준의 성능을 갖춘 경량 모델GPT-OSS 모델이란?GPT-OSS는 OpenAI에서 공개한 최초의 GPT-2 이후 오픈 웨이트(가중치 공개) 언어 모델입니다. 목적은 다음과 같습니다.고성능 + 저비용 추론 제공Apache 2.0 라이선스 기반의 자유로운 커스터마이징 및 상업적 활용로컬 추론, 에이전트 워크플로우, 도구 호출, 함수 실행 등을 지원모델 신뢰성과 안전성을 확보한 철저한 보안 평가 완료모델 사양 및 아키텍처모델계층총 파라미.. 2025. 8. 7.
728x90
728x90