7. AI 컴플라이언스

AI 시스템을 개발·운영하는 기업이 오픈소스 관점에서 고려해야 할 AI 컴플라이언스 요소를 설명합니다. ISO/IEC 42001 AI 관리 시스템 표준의 오픈소스 교차 요구사항을 중심으로 안내합니다.

AI 시스템은 오픈소스 프레임워크, 사전 훈련된 모델, 오픈 데이터셋을 광범위하게 활용합니다. 오픈소스 관리 체계(ISO/IEC 5230 · 18974)를 운영하는 기업은 AI 시스템 개발 단계에서도 오픈소스 컴플라이언스 원칙을 적용해야 합니다. 또한 AI 코딩 도구(GitHub Copilot, Claude Code, Cursor 등)를 활용하는 개발 환경에서도 라이선스 혼입과 취약 패키지 도입에 대한 새로운 관리 체계가 필요합니다.

ISO/IEC 42001(AI 관리 시스템)은 AI 거버넌스 전반을 다루며, 그 중 일부 조항이 오픈소스 관리와 직접 교차합니다. 이 섹션은 그 교차점을 실무 관점에서 정리합니다.

1. AI 시스템에서 오픈소스가 사용되는 세 가지 영역

AI 시스템
  ├── 1. AI 프레임워크 · 라이브러리
  │       (PyTorch, TensorFlow, Hugging Face Transformers, LangChain 등)
  │       → 일반 오픈소스 라이선스 컴플라이언스 적용
  │
  ├── 2. 사전 훈련 모델 (Pre-trained Model)
  │       (Llama, Mistral, Falcon, BERT 등)
  │       → 모델별 커스텀 라이선스 확인 필요
  │
  └── 3. 학습 데이터셋
          (Common Crawl, Wikipedia, CC-BY 데이터셋 등)
          → 오픈 데이터 라이선스 의무 이행

각 영역별로 기존 오픈소스 컴플라이언스 프로세스와 다른 지점이 있으므로 아래를 참고합니다.

2. AI 시스템 영역별 오픈소스 관리

(1) AI 프레임워크 · 라이브러리 관리

AI 개발에 사용하는 오픈소스 프레임워크와 라이브러리는 일반 소프트웨어와 동일하게 ISO/IEC 5230의 오픈소스 관리 프로세스를 적용합니다.

주요 AI 프레임워크 라이선스

프레임워크라이선스상업적 사용주요 의무
PyTorchBSD 3-Clause✅ 가능저작권 표시
TensorFlowApache 2.0✅ 가능저작권 표시, 변경 고지
Hugging Face TransformersApache 2.0✅ 가능저작권 표시
LangChainMIT✅ 가능저작권 표시
scikit-learnBSD 3-Clause✅ 가능저작권 표시

체크포인트

(2) 사전 훈련 모델 (Pre-trained Model) 관리

사전 훈련 모델은 일반 오픈소스 라이브러리와 다른 커스텀 라이선스를 사용하는 경우가 많습니다. 특히 상업적 사용 제한이나 파생 모델 공개 의무를 포함하는 경우가 있어 주의가 필요합니다.

주요 오픈소스 AI 모델 라이선스 유형 (2026-05 기준)

다음 표는 2026-05 시점 산업 주력 모델의 라이선스를 정리한 것입니다. OSAID 1.0 (OSI, 2024-10) 기준으로 “오픈소스 AI 모델”(데이터·코드·가중치 3요소 공개)과 “Open Weight 모델”(가중치만 공개)을 구분합니다.

라이선스 유형대표 모델 (2026 기준)OSAID 1.0상업적 사용파생 모델 공개
Apache 2.0Mistral 7B, Qwen 2.5 / Qwen 3, Falcon 7B/40B✅ 적합✅ 가능❌ 불필요
MITDeepSeek-V3 / DeepSeek-R1, Phi-4, GPT-J✅ 적합✅ 가능❌ 불필요
Meta Llama Community LicenseLlama 3.1 / 3.3 / 4⚠️ Open Weight조건부 (MAU 7억 이하 무료)❌ 불필요
Gemma Terms of Use v3Gemma 3⚠️ Open Weight조건부 (AUP 동의)❌ 불필요
TII Falcon 180B LicenseFalcon 180B⚠️ Open Weight상업 사용 별도 조건사용 약관 확인
CC-BY 4.0일부 학술 모델⚠️ 데이터 한정✅ 가능저작자 표시 필요
CC-BY-NC 4.0일부 연구 모델❌ 비상업 한정❌ 비상업적 한정

AI SBOM에 모델 정보 포함

SBOM(소프트웨어 구성 목록)에 사전 훈련 모델을 포함하는 AI SBOM을 구성합니다. 표준 형식은 SPDX 3.0 AI Profile(라이선스·저작권 표현 강함)과 CycloneDX 1.6 ML-BOM(보안·윤리·성능 메타데이터 풍부) 두 가지가 사실상 산업 표준이며, 조직은 한쪽 또는 양쪽 모두를 채택할 수 있습니다.

# AI SBOM 모델 항목 예시 (SPDX 3.0 AI Profile 기반)
- name: "meta-llama/Llama-3.1-8B"
  version: "3.1"
  license: "Llama Community License Agreement"
  primaryPurpose: "inference"
  hyperparameter:
    contextWindow: 131072
  modelCard: "https://huggingface.co/meta-llama/Llama-3.1-8B"

표준별 핵심 필드 명세(SPDX 3.0 AI Profile 12종 / CycloneDX 1.6 ML-BOM modelCard 4영역)와 작성 예시·도구 사용법은 AI SBOM 가이드를 참고합니다.

(3) 학습 데이터셋 관리

AI 모델 학습에 사용한 데이터셋에 오픈 데이터 또는 크리에이티브 커먼즈 라이선스가 적용된 경우 해당 라이선스 조건을 이행해야 합니다.

오픈 데이터 라이선스 주요 유형

라이선스저작자 표시상업적 사용동일 조건 변경 허락
CC0❌ 불필요✅ 가능❌ 불필요
CC-BY 4.0✅ 필요✅ 가능❌ 불필요
CC-BY-SA 4.0✅ 필요✅ 가능✅ 필요
CC-BY-NC 4.0✅ 필요❌ 비상업적 한정❌ 불필요

체크포인트

  • AI SBOM에 학습 데이터셋과 라이선스를 기록합니다
  • CC-BY 계열 데이터 사용 시 모델 카드(Model Card) 또는 시스템 문서에 출처를 명시합니다
  • CC-BY-SA 조건의 데이터를 학습에 사용한 경우, 파생 모델의 라이선스 처리를 법무팀과 협의합니다

3. ISO/IEC 42001과의 연계

기업이 ISO/IEC 42001 AI 관리 시스템을 운영하거나 준비 중인 경우, 다음 조항이 오픈소스 관리와 직접 연결됩니다.

ISO 42001 조항오픈소스 담당자 역할
§5.2 AI 정책AI 정책에 오픈소스 사용 원칙 포함
§6.1.2 AI 리스크 평가OSS 라이선스·취약점 리스크 식별·평가
§7.5 문서화AI SBOM 수립·유지
§8.5 AI 생애주기개발 단계별 OSS 컴플라이언스 검토
§8.6 AI 데이터데이터셋 라이선스 관리
§8.8 외부 AI 조달외부 오픈소스 모델 공급망 검증

ISO/IEC 42001의 오픈소스 교차 요구사항 전체 가이드: ISO/IEC 42001 가이드

4. AI Work Group 산출물 활용

OpenChain Korea Work Group의 AI Work Group은 AI SBOM 컴플라이언스 가이드를 개발했습니다. 이 가이드는 AI 시스템의 구성 요소(모델, 데이터셋, 프레임워크)를 SPDX 3.0 AI Profile 또는 CycloneDX 1.6 ML-BOM 형식으로 문서화하는 방법을 상세히 안내합니다.

5. AI 코딩 도구 사용 시 컴플라이언스

GitHub Copilot, Claude Code, Cursor, Windsurf 등 AI 코딩 도구는 개발 생산성을 높이지만, 오픈소스 컴플라이언스 관점의 새로운 위험을 함께 가져옵니다.

(1) AI 코딩 도구의 주요 위험

  • 라이선스 혼입 위험: AI는 오픈소스 코드를 학습하여 유사한 코드를 생성합니다. GPL 등 Copyleft 코드가 무심코 혼입될 수 있습니다.
  • 취약 패키지 추천: AI는 학습 데이터 기준의 오래된 버전을 추천하는 경우가 있어 알려진 CVE가 포함된 패키지가 도입될 수 있습니다.
  • 의존성 SBOM 누락: AI가 제안하는 의존성 패키지도 SBOM 및 취약점 관리 대상입니다.

(2) 보장 수준별 4단계 전략

단계핵심 수단보장 수준권장 대상
1단계: 프롬프트 의존없음 (개인 기억)낮음개인 실험
2단계: AI 규칙 내재화CLAUDE.md · .cursorrules 등중간팀 공동작업
3단계: CI/CD 자동 차단syft · grype · ORT높음팀·조직
4단계: 지속적 모니터링Dependabot · Renovate + AI매우 높음조직·전사

1단계는 즉시 시작할 수 있지만, 3단계부터 진정한 자동 차단(Hard Block)이 작동합니다.

(3) AI 규칙 파일에 오픈소스 정책 내재화

CLAUDE.md · .cursorrules · .clinerules 등 AI 도구의 설정 파일에 오픈소스 정책을 미리 명시하면 AI가 코드를 생성할 때 자동으로 정책을 인지합니다.

## 오픈소스 정책

### 라이선스 관리
새로운 외부 패키지 추가 시 반드시 라이선스를 확인하고 명시할 것.

**허용 라이선스**: MIT, Apache-2.0, BSD-2-Clause, BSD-3-Clause, ISC
**주의 라이선스** (법무 검토 필요): LGPL, MPL
**금지 라이선스** (사전 승인 없이 사용 불가): GPL, AGPL, SSPL

### 보안 관리
- 알려진 CVE 취약점이 있는 패키지 버전 사용 금지
- 의존성 추가 후 취약점 감사 실행: `npm audit` / `pip-audit` / `trivy fs .`

### SBOM 관리
- 의존성 변경 시 SBOM 업데이트 필요
- 생성 도구: syft, cdxgen, trivy

(4) CI/CD 파이프라인 자동 차단

PR 병합 전 SCA(소프트웨어 구성 분석) 도구로 자동 검증합니다.

역할도구동작
SBOM 생성syft의존성 전체를 CycloneDX/SPDX 형식으로 추출
취약점 차단grypeHigh/Critical CVE 발견 시 빌드 실패
라이선스 차단ORT / 스크립트금지 라이선스 발견 시 빌드 실패

CI/CD 구성 방법은 이 가이드 4. 도구를 참고합니다.

(5) AI 생성 코드의 저작권 귀속 처리

AI 코딩 도구로 생성된 코드는 인간 저작자성 인정 여부에 따라 저작권 귀속이 달라집니다. 법무·컴플라이언스 관점에서 다음 5개 항목을 결정·문서화합니다.

5-1. AI 생성 코드의 저작권 귀속 기준

시나리오인간 저작자성저작권 등록 가능 여부
완전 AI 생성 (프롬프트만 입력, 출력 그대로 사용)❌ 없음❌ 회사 저작물로 등록 불가 (US Copyright Office 2024 가이드)
AI 초안 + 실질적 인간 수정 (50%+ 변경)✅ 있음✅ 인간 수정 부분에 한해 등록 가능
AI 보조 + 인간이 설계·통합 결정✅ 있음✅ 회사 저작물로 등록 가능

US Copyright Office 2024 AI Guidance (공식 페이지): 완전 AI 생성물에는 저작권이 부여되지 않으며, AI 보조 시 “인간의 창작적 기여"가 인정되어야 저작권 인정.

5-2. 공급자 IP 보증(Indemnification) 활용

다음 AI 코딩 도구 공급자는 사용 약관에 IP indemnification(지식재산 보증)을 제공합니다. 도입 전 약관 조건을 확인하고 사내 정책에 반영합니다.

  • Microsoft Copilot Copyright Commitment — Microsoft 365 Copilot·GitHub Copilot Business/Enterprise 사용자에게 저작권 침해 청구 시 방어·합의 비용 보장
  • OpenAI Copyright Shield — ChatGPT Enterprise/Team 사용자에게 동일 보장
  • Anthropic Customer Protection — Claude 상용 고객에게 IP 보장
  • Google Cloud Generative AI Indemnification — Vertex AI 등 GCP 생성형 AI 서비스 사용자 보장

각 보장의 조건(예: 콘텐츠 필터링 활성화, 약관 준수 등)을 충족해야 적용됩니다.

5-3. AI 사용 고지·표기 의무

EU AI Act §50과 한국 AI 기본법은 AI 생성 콘텐츠 표시 의무를 부과합니다. 사내·외부 공개 시 다음을 표시합니다.

  • 사내 코드 commit 메시지: AI 도구 사용 명시 (예: feat: API 핸들러 구현 (Claude Code 보조))
  • 외부 공개 코드: AI 사용 고지를 README 또는 CONTRIBUTING에 명시
  • AI 시스템 출력물: EU AI Act §50에 따른 라벨링 (예: “AI 생성”, “AI 보조”)

5-4. AI 코딩 도구 사용 정책 문서화

다음 항목을 사내 정책 또는 AI 코딩 도구 가이드라인에 명시합니다.

## AI 코딩 도구 사용 정책

### 사용 허용 도구
- 공급자 IP indemnification 보장이 있는 상용 도구만 사용
  (예: GitHub Copilot Business, ChatGPT Enterprise, Claude for Business)
- 개인 무료 계정(Copilot Individual 등)은 사내 코드에 사용 금지

### 저작권 귀속 결정
- AI 출력을 그대로 사용한 경우 commit 메시지에 명시
- AI 초안 + 인간 수정 시 수정 비율 및 결정 근거 PR 본문에 기록
- 완전 AI 생성 코드는 외부 공개 시 별도 라이선스 표기 검토

### 라이선스 위험 차단
- AI가 추천한 코드가 GPL/AGPL 등 카피레프트 라이선스 코드와 유사한지 검증
- Copilot duplicate detection 같은 매칭 검출 도구 활용
- 의심 시 법무팀 에스컬레이션

5-5. 외부 사실 참조

본 절은 §1 글로벌 AI 규제 매트릭스의 US Copyright Office AI 가이드·EU AI Act §50·한국 AI 기본법 의무에 대응합니다. 규제 변경 시 위 매트릭스를 우선 확인합니다.

체크포인트

  • AI 코딩 도구 사용 정책이 문서화되어 있는가?
  • AI 생성 코드의 저작권 귀속 판단 기준이 명시되어 있는가?
  • 공급자 IP indemnification 조건을 검토하고 충족하고 있는가?
  • 사내 commit·외부 공개 시 AI 사용 표시 의무가 이행되는가?

6. Summary

AI 컴플라이언스는 기존 ISO/IEC 5230 · 18974 오픈소스 관리 체계의 자연스러운 확장입니다. AI 시스템의 세 가지 영역(프레임워크·모델·데이터셋)에 대해 라이선스 의무를 식별·이행하고, ISO/IEC 42001 AI 관리 시스템의 오픈소스 교차 조항을 적용함으로써 종합적인 컴플라이언스 체계를 구축할 수 있습니다.

이 섹션을 통해 기업은 다음과 같은 이점을 얻을 수 있습니다:

  1. AI 시스템 구성 요소별 라이선스 의무 명확화
  2. AI SBOM 운영으로 외부 공급망 투명성 확보
  3. AI 코딩 도구 사용 시 라이선스 혼입·취약점 도입 위험 차단
  4. ISO/IEC 42001 인증 준비 시 오픈소스 영역 사전 정비
  5. CI/CD 파이프라인 자동화로 정책 위반 기계적 방지

ISO/IEC 5230 / 18974 / 42001 준수 가이드 — 이 섹션과 관련된 조항: