본문 바로가기

분류 전체보기3560

728x90
Qwen3-30B를 라즈베리 파이에서 실시간으로 돌린 방법과 의미 MoE·양자화·ShapeLearn: 라즈베리 파이에서 30B LLM이 가능한 이유메모리를 ‘예산’으로 본 LLM 최적화: Pi에서 30B 실시간 추론 사례ShapeLearn 기반 비트 최적화로 본 엣지 LLM 성능 한계 돌파라즈베리 파이에서 30B가 “실시간”이라니보통 30B급 LLM은 메모리(가중치 적재) + 연산(토큰 생성) 때문에 데스크톱 GPU/서버 쪽 영역으로 여겨졌습니다.그런데 ByteShape는 Qwen3-30B-A3B-Instruct-2507를 Raspberry Pi 5 16GB에서,8.03 TPS(tokens/sec)BF16 대비 품질 94.18% 유지로 “실시간 대화처럼 느껴지는” 구간을 넘겼다고 밝힙니다.ByteShape가 강조하는 핵심 메시지는 이거예요.메모리는 목표가 아니라 ‘예산.. 2026. 1. 10.
Gemini CLI Skills 도입 및 사용법: SKILL.md 템플릿과 베스트 프랙티스 Gemini CLI의 “Skills(Agent Skills)”는 무엇인가요?Gemini CLI의 Skills는 “자주 반복되는 작업/전문 도메인 지식/운영 절차”를 재사용 가능한 지침(Instruction) 패키지로 만들어, CLI 에이전트가 상황에 맞게 호출·적용하도록 하는 실험적(Experimental) 기능입니다. Skills는 구조화된 마크다운 파일로 정의되며, YAML 프론트매터에 name, description 같은 메타데이터를 두고 본문에 실제 수행 지침을 작성하는 형태입니다. 실험 기능 활성화아래처럼 .gemini/settings.json에 실험 기능 플래그를 켜서 사용할 수 있습니다.{ "experimental": { "skills": true }}참고로 Gemini CLI 설정.. 2026. 1. 9.
농장 현장을 버티는 확장 가능한 농업 IoT 네트워크 플랫폼 아키텍처 설계 농업용 IoT 네트워크 플랫폼이 해결해야 하는 핵심현장 환경: 전원 불안정, 습기/먼지, 통신 음영, 장비 재부팅/단선이 흔함통신 다양성: Wi-Fi / Ethernet / LTE-M(NB-IoT) / LoRa / 위성 등 혼재데이터 성격: 센서(주기), 이벤트(알람), 제어(명령), 대용량(이미지/펌웨어) 혼합운영 요구: 원격 장애 대응, OTA, 장비 수천~수만대 확장, 비용(통신/클라우드) 최적화보안 요구: 장비 단위 신원, 키/인증서 관리, 위변조 방지, 공급망(펌웨어) 안전레이어별 플랫폼 구성(권장 표준 아키텍처)A. 디바이스 레이어(센서/액추에이터/컨트롤러)센서: 온도/습도/토양수분/EC/pH/CO₂/조도 등액추에이터: 펌프/밸브/환풍기/히터/차광막 등로컬 로직(필수)네트워크 끊겨도 안전 상태.. 2026. 1. 8.
AI 코드리뷰의 함정과 해법: GitHub Actions에서 시크릿·러너·권한 통제 AI Algorithm Mentor(알고리즘 풀이 자동 리뷰 GitHub Action)은, 알고리즘 풀이 코드를 GitHub에 푸시하면 문제 내용 + 내 코드를 함께 분석해서 “왜 맞는지/어디가 느린지/개선점은 뭔지”를 코치처럼 커밋 코멘트로 남겨주는 자동 리뷰 도구입니다. 알고리즘/코테 공부에서 가장 큰 병목은 보통 이 3가지입니다.정답은 맞는데 더 좋은 풀이가 있는지 모름시간/공간 복잡도(빅오)·엣지 케이스가 불안함혼자 공부하면 “리뷰/피드백”이 쌓이지 않음AI Algorithm Mentor는 이런 상황에서 “매 커밋마다 자동 회고/피드백 로그를 남기기”에 초점이 있습니다.동작 방식(핵심 아이디어를 흐름으로 이해하기)전체 파이프라인은 아래 4단계로 보면 가장 이해가 빠릅니다.풀이 파일 ‘첫 줄 주석’.. 2026. 1. 7.
빠른 개발의 대가: 바이브 코딩 AI 코드, “돌아간다”는 “안전하다”가 아니다 AI 코딩 시대, 보안은 자동으로 따라오지 않는다“바이브 코딩”이 뭔데, 왜 보안이 이슈가 되나?바이브 코딩(Vibe Coding)은 개발자가 자연어로 “이 기능 만들어줘”라고 말하면 LLM 기반 생성형 AI가 즉시 실행 가능한 코드를 만들어주는 방식으로, 회원가입/로그인/인증 같은 기능부터 웹앱 개발까지 빠르게 만들어 생산성이 커졌습니다.핵심 문제는 “동작하는 코드 = 안전한 코드”가 아니라는 점입니다.보안업계는 AI가 만든 코드가 문법/기능은 그럴듯해도 입력값 검증 누락, 과도한 권한 부여, 인증 우회 가능성, 예외 처리 중 내부정보 노출 같은 전통적 취약점을 포함하는 사례가 많다고 지적합니다.핵심 요약AI 생성 코드의 45%가 보안 테스트 실패LLM이 생성한 코드 샘플 분석결과 전체 45%가 보안 .. 2026. 1. 6.
728x90
728x90