7. AI 컴플라이언스

AI 시스템을 개발·운영하는 기업이 오픈소스 관점에서 고려해야 할 AI 컴플라이언스 요소를 설명합니다. ISO/IEC 42001 AI 관리 시스템 표준의 오픈소스 교차 요구사항을 중심으로 안내합니다.

Categories:

Guide

이 섹션이 다루는 요구사항

ISO/IEC 42001: §5.2 (AI 정책), §6.1.2 (AI 리스크 평가), §7.5 (문서화), §8.5 (AI 생애주기), §8.6 (AI 데이터), §8.8 (외부 AI 조달)

AI 시스템은 오픈소스 프레임워크, 사전 훈련된 모델, 오픈 데이터셋을 광범위하게 활용합니다. 오픈소스 관리 체계(ISO/IEC 5230 · 18974)를 운영하는 기업은 AI 시스템 개발 단계에서도 오픈소스 컴플라이언스 원칙을 적용해야 합니다. 또한 AI 코딩 도구(GitHub Copilot, Claude Code, Cursor 등)를 활용하는 개발 환경에서도 라이선스 혼입과 취약 패키지 도입에 대한 새로운 관리 체계가 필요합니다.

ISO/IEC 42001(AI 관리 시스템)은 AI 거버넌스 전반을 다루며, 그 중 일부 조항이 오픈소스 관리와 직접 교차합니다. 이 섹션은 그 교차점을 실무 관점에서 정리합니다.

1. AI 시스템에서 오픈소스가 사용되는 세 가지 영역

AI 시스템
  ├── 1. AI 프레임워크 · 라이브러리
  │       (PyTorch, TensorFlow, Hugging Face Transformers, LangChain 등)
  │       → 일반 오픈소스 라이선스 컴플라이언스 적용
  │
  ├── 2. 사전 훈련 모델 (Pre-trained Model)
  │       (Llama, Mistral, Falcon, BERT 등)
  │       → 모델별 커스텀 라이선스 확인 필요
  │
  └── 3. 학습 데이터셋
          (Common Crawl, Wikipedia, CC-BY 데이터셋 등)
          → 오픈 데이터 라이선스 의무 이행

각 영역별로 기존 오픈소스 컴플라이언스 프로세스와 다른 지점이 있으므로 아래를 참고합니다.

2. AI 시스템 영역별 오픈소스 관리

(1) AI 프레임워크 · 라이브러리 관리

AI 개발에 사용하는 오픈소스 프레임워크와 라이브러리는 일반 소프트웨어와 동일하게 ISO/IEC 5230의 오픈소스 관리 프로세스를 적용합니다.

주요 AI 프레임워크 라이선스

프레임워크	라이선스	상업적 사용	주요 의무
PyTorch	BSD 3-Clause	✅ 가능	저작권 표시
TensorFlow	Apache 2.0	✅ 가능	저작권 표시, 변경 고지
Hugging Face Transformers	Apache 2.0	✅ 가능	저작권 표시
LangChain	MIT	✅ 가능	저작권 표시
scikit-learn	BSD 3-Clause	✅ 가능	저작권 표시

체크포인트

ISO/IEC 5230 · 18974 적용

SBOM에 모든 AI 프레임워크·라이브러리와 버전을 포함합니다
각 프레임워크의 라이선스 의무(저작권 고지, 변경 고지 등)를 이행합니다
FOSSology, FOSSLight 등 기존 스캔 도구로 AI 코드 저장소도 분석합니다

(2) 사전 훈련 모델 (Pre-trained Model) 관리

사전 훈련 모델은 일반 오픈소스 라이브러리와 다른 커스텀 라이선스를 사용하는 경우가 많습니다. 특히 상업적 사용 제한이나 파생 모델 공개 의무를 포함하는 경우가 있어 주의가 필요합니다.

주요 오픈소스 AI 모델 라이선스 유형 (2026-05 기준)

다음 표는 2026-05 시점 산업 주력 모델의 라이선스를 정리한 것입니다. OSAID 1.0 (OSI, 2024-10) 기준으로 “오픈소스 AI 모델”(데이터·코드·가중치 3요소 공개)과 “Open Weight 모델”(가중치만 공개)을 구분합니다.

라이선스 유형	대표 모델 (2026 기준)	OSAID 1.0	상업적 사용	파생 모델 공개
Apache 2.0	Mistral 7B, Qwen 2.5 / Qwen 3, Falcon 7B/40B	✅ 적합	✅ 가능	❌ 불필요
MIT	DeepSeek-V3 / DeepSeek-R1, Phi-4, GPT-J	✅ 적합	✅ 가능	❌ 불필요
Meta Llama Community License	Llama 3.1 / 3.3 / 4	⚠️ Open Weight	조건부 (MAU 7억 이하 무료)	❌ 불필요
Gemma Terms of Use v3	Gemma 3	⚠️ Open Weight	조건부 (AUP 동의)	❌ 불필요
TII Falcon 180B License	Falcon 180B	⚠️ Open Weight	상업 사용 별도 조건	사용 약관 확인
CC-BY 4.0	일부 학술 모델	⚠️ 데이터 한정	✅ 가능	저작자 표시 필요
CC-BY-NC 4.0	일부 연구 모델	❌ 비상업 한정	❌ 비상업적 한정	—

OSAID 1.0 vs Open Weight 구분

OSAID 1.0: 학습 데이터·학습 코드·모델 가중치 3요소가 모두 OSI 승인 오픈소스 라이선스로 공개된 모델만 “오픈소스 AI 모델"로 인정. Open Weight: 가중치만 공개되고 학습 데이터와 코드는 비공개, 또는 사용 제한 조건이 있는 모델. Llama, Gemma, Falcon 180B 등이 해당합니다.

심사관 또는 컴플라이언스 검토 시 “이 모델은 OSAID 기준 오픈소스인가, Open Weight인가?“를 명확히 답변할 수 있어야 합니다.

Llama 라이선스 의무 체크리스트

Meta Llama Community License 적용 모델(Llama 3.1·3.3·4 등) 사용 시 다음 의무를 모두 이행합니다.

MAU 7억 명 임계 확인 — 자사 또는 계열사 월간 활성 사용자(MAU) 7억 명 초과 시 별도 Meta 라이선스 협상 필요
“Built with Llama” 표기 — 파생 모델 또는 Llama 활용 서비스에 표기 의무
파생 모델명 “Llama” 접두어 — 파생 모델 배포 시 모델명에 “Llama” 포함 (예: “Llama-3-Custom-Finetuned”)
Acceptable Use Policy(AUP) 동의 — 사용 약관 동의 및 조직 내 전파
금지 사용 영역 차단 — 군사, 핵, 생물학, 화학 무기 개발, 사이버 공격, 차별 등 금지 (AUP 명시)
405B 등 대규모 모델 재배포 제한 확인 — Llama 3 405B 등 일부 모델은 가중치 재배포 시 추가 조건
버전별 라이선스 차이 확인 — Llama 2 / 3 / 3.1 / 3.3 / 4 각 버전마다 라이선스 본문이 다름

상세 의무는 Meta Llama 라이선스 공식 페이지에서 확인합니다.

주의: 모델 라이선스는 개별 확인 필수

AI 모델 라이선스는 표준화되지 않아 모델마다 조건이 다릅니다. Hugging Face 모델 허브 등에서 모델 카드(Model Card)와 라이선스를 반드시 직접 확인해야 합니다. 특히 다음 사항을 검토합니다:

상업적 사용 허용 여부
사용자 수(MAU) 또는 매출 기반 제한 조건
파생 모델(Fine-tuning) 공개 의무
AI 시스템에 사용한 모델 명시 의무
모델 버전별 라이선스 본문 차이 (예: Llama 2/3/3.1/3.3/4)

AI SBOM에 모델 정보 포함

SBOM(소프트웨어 구성 목록)에 사전 훈련 모델을 포함하는 AI SBOM을 구성합니다. 표준 형식은 SPDX 3.0 AI Profile(라이선스·저작권 표현 강함)과 CycloneDX 1.6 ML-BOM(보안·윤리·성능 메타데이터 풍부) 두 가지가 사실상 산업 표준이며, 조직은 한쪽 또는 양쪽 모두를 채택할 수 있습니다.

# AI SBOM 모델 항목 예시 (SPDX 3.0 AI Profile 기반)
- name: "meta-llama/Llama-3.1-8B"
  version: "3.1"
  license: "Llama Community License Agreement"
  primaryPurpose: "inference"
  hyperparameter:
    contextWindow: 131072
  modelCard: "https://huggingface.co/meta-llama/Llama-3.1-8B"

표준별 핵심 필드 명세(SPDX 3.0 AI Profile 12종 / CycloneDX 1.6 ML-BOM modelCard 4영역)와 작성 예시·도구 사용법은 AI SBOM 가이드를 참고합니다.

(3) 학습 데이터셋 관리

AI 모델 학습에 사용한 데이터셋에 오픈 데이터 또는 크리에이티브 커먼즈 라이선스가 적용된 경우 해당 라이선스 조건을 이행해야 합니다.

오픈 데이터 라이선스 주요 유형

라이선스	저작자 표시	상업적 사용	동일 조건 변경 허락
CC0	❌ 불필요	✅ 가능	❌ 불필요
CC-BY 4.0	✅ 필요	✅ 가능	❌ 불필요
CC-BY-SA 4.0	✅ 필요	✅ 가능	✅ 필요
CC-BY-NC 4.0	✅ 필요	❌ 비상업적 한정	❌ 불필요

체크포인트

AI SBOM에 학습 데이터셋과 라이선스를 기록합니다
CC-BY 계열 데이터 사용 시 모델 카드(Model Card) 또는 시스템 문서에 출처를 명시합니다
CC-BY-SA 조건의 데이터를 학습에 사용한 경우, 파생 모델의 라이선스 처리를 법무팀과 협의합니다

3. ISO/IEC 42001과의 연계

기업이 ISO/IEC 42001 AI 관리 시스템을 운영하거나 준비 중인 경우, 다음 조항이 오픈소스 관리와 직접 연결됩니다.

ISO 42001 조항	오픈소스 담당자 역할
§5.2 AI 정책	AI 정책에 오픈소스 사용 원칙 포함
§6.1.2 AI 리스크 평가	OSS 라이선스·취약점 리스크 식별·평가
§7.5 문서화	AI SBOM 수립·유지
§8.5 AI 생애주기	개발 단계별 OSS 컴플라이언스 검토
§8.6 AI 데이터	데이터셋 라이선스 관리
§8.8 외부 AI 조달	외부 오픈소스 모델 공급망 검증

ISO/IEC 42001의 오픈소스 교차 요구사항 전체 가이드: ISO/IEC 42001 가이드

4. AI Work Group 산출물 활용

OpenChain Korea Work Group의 AI Work Group은 AI SBOM 컴플라이언스 가이드를 개발했습니다. 이 가이드는 AI 시스템의 구성 요소(모델, 데이터셋, 프레임워크)를 SPDX 3.0 AI Profile 또는 CycloneDX 1.6 ML-BOM 형식으로 문서화하는 방법을 상세히 안내합니다.

AI Work Group 활동 및 가이드: 리소스 — AI Work Group

5. AI 코딩 도구 사용 시 컴플라이언스

GitHub Copilot, Claude Code, Cursor, Windsurf 등 AI 코딩 도구는 개발 생산성을 높이지만, 오픈소스 컴플라이언스 관점의 새로운 위험을 함께 가져옵니다.

(1) AI 코딩 도구의 주요 위험

라이선스 혼입 위험: AI는 오픈소스 코드를 학습하여 유사한 코드를 생성합니다. GPL 등 Copyleft 코드가 무심코 혼입될 수 있습니다.
취약 패키지 추천: AI는 학습 데이터 기준의 오래된 버전을 추천하는 경우가 있어 알려진 CVE가 포함된 패키지가 도입될 수 있습니다.
의존성 SBOM 누락: AI가 제안하는 의존성 패키지도 SBOM 및 취약점 관리 대상입니다.

(2) 보장 수준별 4단계 전략

단계	핵심 수단	보장 수준	권장 대상
1단계: 프롬프트 의존	없음 (개인 기억)	낮음	개인 실험
2단계: AI 규칙 내재화	CLAUDE.md · .cursorrules 등	중간	팀 공동작업
3단계: CI/CD 자동 차단	syft · grype · ORT	높음	팀·조직
4단계: 지속적 모니터링	Dependabot · Renovate + AI	매우 높음	조직·전사

1단계는 즉시 시작할 수 있지만, 3단계부터 진정한 자동 차단(Hard Block)이 작동합니다.

(3) AI 규칙 파일에 오픈소스 정책 내재화

CLAUDE.md · .cursorrules · .clinerules 등 AI 도구의 설정 파일에 오픈소스 정책을 미리 명시하면 AI가 코드를 생성할 때 자동으로 정책을 인지합니다.

## 오픈소스 정책

### 라이선스 관리
새로운 외부 패키지 추가 시 반드시 라이선스를 확인하고 명시할 것.

**허용 라이선스**: MIT, Apache-2.0, BSD-2-Clause, BSD-3-Clause, ISC
**주의 라이선스** (법무 검토 필요): LGPL, MPL
**금지 라이선스** (사전 승인 없이 사용 불가): GPL, AGPL, SSPL

### 보안 관리
- 알려진 CVE 취약점이 있는 패키지 버전 사용 금지
- 의존성 추가 후 취약점 감사 실행: `npm audit` / `pip-audit` / `trivy fs .`

### SBOM 관리
- 의존성 변경 시 SBOM 업데이트 필요
- 생성 도구: syft, cdxgen, trivy

주의: AI 규칙만으로는 Hard Block 불가

AI 규칙 파일은 “권장사항"으로 작동합니다. AI가 실수하거나 개발자가 무시해도 막아주지 않습니다. 정책 위반을 기계적으로 차단하려면 CI/CD 파이프라인 게이팅이 필요합니다.

(4) CI/CD 파이프라인 자동 차단

PR 병합 전 SCA(소프트웨어 구성 분석) 도구로 자동 검증합니다.

역할	도구	동작
SBOM 생성	syft	의존성 전체를 CycloneDX/SPDX 형식으로 추출
취약점 차단	grype	High/Critical CVE 발견 시 빌드 실패
라이선스 차단	ORT / 스크립트	금지 라이선스 발견 시 빌드 실패

CI/CD 구성 방법은 이 가이드 4. 도구를 참고합니다.

시나리오	인간 저작자성	저작권 등록 가능 여부
완전 AI 생성 (프롬프트만 입력, 출력 그대로 사용)	❌ 없음	❌ 회사 저작물로 등록 불가 (US Copyright Office 2024 가이드)
AI 초안 + 실질적 인간 수정 (50%+ 변경)	✅ 있음	✅ 인간 수정 부분에 한해 등록 가능
AI 보조 + 인간이 설계·통합 결정	✅ 있음	✅ 회사 저작물로 등록 가능

5-2. 공급자 IP 보증(Indemnification) 활용

다음 AI 코딩 도구 공급자는 사용 약관에 IP indemnification(지식재산 보증)을 제공합니다. 도입 전 약관 조건을 확인하고 사내 정책에 반영합니다.

OpenAI Copyright Shield — ChatGPT Enterprise/Team 사용자에게 동일 보장
Anthropic Customer Protection — Claude 상용 고객에게 IP 보장
Google Cloud Generative AI Indemnification — Vertex AI 등 GCP 생성형 AI 서비스 사용자 보장

각 보장의 조건(예: 콘텐츠 필터링 활성화, 약관 준수 등)을 충족해야 적용됩니다.

5-3. AI 사용 고지·표기 의무

EU AI Act §50과 한국 AI 기본법은 AI 생성 콘텐츠 표시 의무를 부과합니다. 사내·외부 공개 시 다음을 표시합니다.

사내 코드 commit 메시지: AI 도구 사용 명시 (예: feat: API 핸들러 구현 (Claude Code 보조))
외부 공개 코드: AI 사용 고지를 README 또는 CONTRIBUTING에 명시
AI 시스템 출력물: EU AI Act §50에 따른 라벨링 (예: “AI 생성”, “AI 보조”)

5-4. AI 코딩 도구 사용 정책 문서화

다음 항목을 사내 정책 또는 AI 코딩 도구 가이드라인에 명시합니다.

## AI 코딩 도구 사용 정책

### 사용 허용 도구
- 공급자 IP indemnification 보장이 있는 상용 도구만 사용
  (예: GitHub Copilot Business, ChatGPT Enterprise, Claude for Business)
- 개인 무료 계정(Copilot Individual 등)은 사내 코드에 사용 금지

### 저작권 귀속 결정
- AI 출력을 그대로 사용한 경우 commit 메시지에 명시
- AI 초안 + 인간 수정 시 수정 비율 및 결정 근거 PR 본문에 기록
- 완전 AI 생성 코드는 외부 공개 시 별도 라이선스 표기 검토

### 라이선스 위험 차단
- AI가 추천한 코드가 GPL/AGPL 등 카피레프트 라이선스 코드와 유사한지 검증
- Copilot duplicate detection 같은 매칭 검출 도구 활용
- 의심 시 법무팀 에스컬레이션

5-5. 외부 사실 참조

본 절은 §1 글로벌 AI 규제 매트릭스의 US Copyright Office AI 가이드·EU AI Act §50·한국 AI 기본법 의무에 대응합니다. 규제 변경 시 위 매트릭스를 우선 확인합니다.

체크포인트

AI 코딩 도구 사용 정책이 문서화되어 있는가?
공급자 IP indemnification 조건을 검토하고 충족하고 있는가?
사내 commit·외부 공개 시 AI 사용 표시 의무가 이행되는가?

6. Summary

AI 컴플라이언스는 기존 ISO/IEC 5230 · 18974 오픈소스 관리 체계의 자연스러운 확장입니다. AI 시스템의 세 가지 영역(프레임워크, 모델, 데이터셋)에 대해 라이선스 의무를 식별·이행하고, ISO/IEC 42001 AI 관리 시스템의 오픈소스 교차 조항을 적용함으로써 종합적인 컴플라이언스 체계를 구축할 수 있습니다.

이 섹션을 통해 기업은 다음과 같은 이점을 얻을 수 있습니다:

AI 시스템 구성 요소별 라이선스 의무 명확화
AI SBOM 운영으로 외부 공급망 투명성 확보
AI 코딩 도구 사용 시 라이선스 혼입·취약점 도입 위험 차단
ISO/IEC 42001 인증 준비 시 오픈소스 영역 사전 정비
CI/CD 파이프라인 자동화로 정책 위반 기계적 방지

ISO/IEC 5230 / 18974 / 42001 준수 가이드 — 이 섹션과 관련된 조항:
ISO/IEC 42001 가이드 홈 — AI 관리 시스템 전체 안내
§5.2 정책 — AI 정책에 OSS 원칙 포함
§6.1.2 AI 리스크 평가 — OSS 리스크 평가
§7.5 문서화 — AI SBOM
§8.5 · §8.6 AI 시스템·데이터 — 운영 시 OSS 관리
§8.8 외부 AI 조달 — AI 공급망 검증
AI SBOM 가이드 — SPDX 3.0 AI Profile
ISO/IEC 5230 가이드 — §3.3.1 SBOM — 일반 SBOM 기준

최종 수정 2026년 6월 2일: docs(ko): ko-style-lint로 번역투·시각장식 정리 (80파일) (cff481f07)

7. AI 컴플라이언스

Tags:

Categories:

1. AI 시스템에서 오픈소스가 사용되는 세 가지 영역

2. AI 시스템 영역별 오픈소스 관리

(1) AI 프레임워크 · 라이브러리 관리

주요 AI 프레임워크 라이선스

체크포인트

(2) 사전 훈련 모델 (Pre-trained Model) 관리

주요 오픈소스 AI 모델 라이선스 유형 (2026-05 기준)

AI SBOM에 모델 정보 포함

(3) 학습 데이터셋 관리

오픈 데이터 라이선스 주요 유형

체크포인트

3. ISO/IEC 42001과의 연계

4. AI Work Group 산출물 활용

5. AI 코딩 도구 사용 시 컴플라이언스

(1) AI 코딩 도구의 주요 위험

(2) 보장 수준별 4단계 전략

(3) AI 규칙 파일에 오픈소스 정책 내재화

(4) CI/CD 파이프라인 자동 차단

(5) AI 생성 코드의 저작권 귀속 처리

5-1. AI 생성 코드의 저작권 귀속 기준

5-2. 공급자 IP 보증(Indemnification) 활용

5-3. AI 사용 고지·표기 의무

5-4. AI 코딩 도구 사용 정책 문서화

5-5. 외부 사실 참조

체크포인트

6. Summary