본문 바로가기
인공지능 (AI,GPT)

Generative AI 시스템 보호를 위한 도구 PyRIT 툴킷 MS 출시

by 날으는물고기 2024. 3. 30.

Generative AI 시스템 보호를 위한 도구 PyRIT 툴킷 MS 출시

Microsoft가 PyRIT(Python Risk Identification Tool)라는 새로운 오픈 소스 자동화 프레임워크를 출시했습니다. 이 도구는 생성 인공지능(AI) 시스템 내의 위험을 사전에 식별하기 위해 설계되었으며, 모든 조직이 최신 인공지능 발전을 책임 있게 활용할 수 있도록 지원하는 것을 목표로 합니다. PyRIT는 특히 큰 언어 모델(LLM) 엔드포인트의 강건성을 다양한 해로운 카테고리, 예를 들어 조작(예: 환각), 오용(예: 편견), 금지된 내용(예: 괴롭힘)에 대해 평가하는 데 사용될 수 있습니다. 또한, 맬웨어 생성에서 탈옥에 이르기까지 보안 해로움, 그리고 신원 도용과 같은 개인정보 해로움을 식별하는 데에도 사용할 수 있습니다.

 

PyRIT는 다섯 가지 인터페이스를 제공합니다: 대상, 데이터셋, 점수 산정 엔진, 다양한 공격 전략을 지원하는 기능, 그리고 중간 입력 및 출력 상호작용을 저장할 수 있는 JSON이나 데이터베이스 형태의 메모리 구성요소입니다. 점수 산정 엔진은 타깃 AI 시스템에서 나온 출력을 점수 매기기 위해 전통적인 기계 학습 분류기를 사용하거나, 자체 평가를 위해 LLM 엔드포인트를 활용할 수 있는 두 가지 옵션을 제공합니다.

 

Microsoft는 이 도구가 생성적 AI 시스템의 수동 레드 팀 작업을 대체하는 것이 아니라, 기존 레드 팀의 전문 지식을 보완하고 AI 시스템을 평가하기 위해 사용될 수 있는 프롬프트를 생성하여 더 깊은 조사가 필요한 위험 "핫 스폿"을 강조한다고 강조합니다. 생성 AI 시스템에 대한 레드 팀 작업은 보안과 책임 있는 AI 위험을 동시에 탐색해야 하며, 이 작업은 확률적이며 생성 AI 시스템 아키텍처 간의 큰 차이를 지적합니다. 자동화는 규모를 확장하는 데 필요하지만, 잠재적인 약점을 식별하기 위한 수동 조사를 대체할 수는 없습니다.

 

이러한 배경에서 PyRIT의 출시는 생성 AI 보안 분야에 큰 영향을 미칠 것으로 예상됩니다. Microsoft는 다양한 부문의 조직이 이 도구를 활용하여 생성 AI 보안 노력을 강화하도록 권장하고 있으며, 새로운 AI 위험에 대한 강력한 방어 체계를 구축하기 위해 협력의 중요성을 강조하고 있습니다. PyRIT는 생성 AI 시스템의 수동 레드팀 작업을 대체하는 것이 아니라, AI 레드팀 구성원의 기존 도메인 전문 지식을 보강하고 지루한 작업을 자동화하여 보다 효율적인 위험 평가와 관리를 가능하게 합니다.

목적과 중요성

PyRIT의 주된 목적은 전 세계 조직이 최신 AI 기술을 책임감 있게 활용하도록 지원하는 것입니다. 이 도구는 생성 AI 시스템의 취약점을 식별하고, 보안 위협을 평가하여, 조직이 이를 기반으로 보안 조치를 취할 수 있도록 합니다. PyRIT는 AI 시스템의 보안을 강화하고, 사이버 위협으로부터 보호하는 데 중요한 역할을 합니다.

주요 기능 및 이점

  • 다양한 위험 평가: PyRIT는 조작, 오용, 금지된 내용 등 다양한 위험 범주에 대한 평가를 지원합니다.
  • 적응성: 다양한 생성 AI 모델과 함께 작동하며, 새로운 입력 유형을 지원하도록 확장될 수 있습니다.
  • 위험 중심 데이터 세트: 보안 문제와 잠재적인 편견 또는 부정확성을 모두 테스트할 수 있는 데이터 세트를 제공합니다.
  • 유연한 채점 엔진: 기계 학습 또는 직접 LLM을 사용하여 AI 출력의 점수를 매길 수 있습니다.
  • 다중 턴 공격 전략: 보다 현실적이고 지속적인 공격을 시뮬레이션하여 심층 테스트를 가능하게 합니다.
  • 메모리 용량: 분석을 촉진하고 더 길고 복잡한 상호 작용을 허용합니다.

생성 AI 시스템에 대한 PyRIT의 적용

PyRIT를 사용하여 생성 AI 시스템의 정기적인 취약점 평가와 침투 테스트를 수행할 수 있습니다. 이를 통해 시스템의 약점을 파악하고, 최신 보안 패치와 업데이트를 적용하여 알려진 취약점을 해결할 수 있습니다.

보안 강화 조치

PyRIT의 활용은 다음과 같은 보안 강화 조치를 구체화하는 데 도움을 줍니다:

  1. 정기적인 취약점 평가 및 침투 테스트: PyRIT를 활용하여 시스템의 약점을 지속적으로 모니터링하고 평가합니다.
  2. 최신 보안 패치와 업데이트 적용: PyRIT의 평가 결과를 바탕으로, 시스템을 최신 상태로 유지합니다.
  3. 직원 교육 및 보안 의식 강화: PyRIT를 통해 식별된 위협을 교육 자료로 활용하여 직원들의 보안 의식을 높입니다.
  4. 다층적 보안 접근 방식 적용: PyRIT의 평가를 통해 식별된 위협을 기반으로 다층적 보안 전략을 구현합니다.
  5. 데이터 백업과 재해 복구 계획 마련: PyRIT를 활용하여 사이버 공격으로 인한 피해를 최소화하는 계획을 수립합니다.

PyRIT는 조직이 생성 AI 시스템의 보안 위협을 효과적으로 관리하고, 책임감 있는 AI 사용을 촉진하는 데 필수적인 도구입니다. 이를 통해 조직은 사이버 보안 환경에서의 리스크를 최소화하고, AI 기술의 잠재력을 최대한 활용할 수 있습니다.

728x90

댓글