콘텐츠로 이동

MSCP 에이전트 인지 레벨 시리즈

상태: 🔬 실험적 - 이 시리즈의 모든 문서는 프로토타이핑과 테스트에서 도출된 설계를 기술합니다. 최종 확정된 명세가 아닙니다.


개요

최소 자기의식 프로토콜(MSCP)은 단순한 도구 호출 에이전트부터 인공 범용 지능의 이론적 경계까지, 에이전트 인지의 6단계 분류 체계를 정의합니다. 각 레벨 문서에는 아키텍처 다이어그램, 의사코드, 그리고 지금까지의 탐구를 기반으로 한 안전 분석이 포함되어 있습니다.

%%{init: {'theme': 'base', 'themeVariables': {'primaryColor': '#0078D4', 'primaryTextColor': '#003D6B', 'primaryBorderColor': '#003D6B', 'secondaryColor': '#50E6FF', 'secondaryTextColor': '#323130', 'secondaryBorderColor': '#00BCF2', 'tertiaryColor': '#F2F2F2', 'tertiaryTextColor': '#323130', 'lineColor': '#0078D4', 'textColor': '#323130', 'mainBkg': '#DEECF9', 'nodeBorder': '#0078D4', 'clusterBkg': '#F2F2F2', 'clusterBorder': '#003D6B', 'titleColor': '#003D6B', 'edgeLabelBackground': '#FFFFFF', 'fontSize': '14px'}}}%%
flowchart TB
  classDef l1 fill:#DEECF9,stroke:#0078D4,color:#323130
  classDef l3 fill:#DFF6DD,stroke:#107C10,color:#323130,font-weight:bold
  classDef l4 fill:#FFF4CE,stroke:#FFB900,color:#323130
  classDef l45 fill:#E8D5F5,stroke:#8764B8,color:#323130
  classDef l48 fill:#E8D5F5,stroke:#8764B8,color:#323130
  classDef l49 fill:#FDE7E9,stroke:#D13438,color:#323130
  classDef l5 fill:#FFF4CE,stroke:#FFB900,color:#323130
  classDef l6 fill:#F2F2F2,stroke:#605E5C,color:#323130

  subgraph Row1["기초"]
    direction LR
    L1["L1 도구 에이전트"]:::l1 -.-> L2["L2 자율 에이전트"]:::l1 -.-> L3["L3 자기조절 ★"]:::l3
  end

  subgraph Row2["고급"]
    direction LR
    L4["L4 적응형 범용"]:::l4 -.-> L45["L4.5 자기설계"]:::l45 -.-> L48["L4.8 전략적 자기모델"]:::l48
  end

  subgraph Row3["프로토-AGI+"]
    direction LR
    L49["L4.9 자율 전략"]:::l49 -.-> L5["L5 프로토-AGI"]:::l5 -.-> L6["L6 의식적 존재"]:::l6
  end

  Row1 --> Row2 --> Row3

레벨 문서

레벨 명칭 핵심 역량 문서
1 도구 에이전트 결정적 도구 호출; 내부 상태 없음 Level_1_Tool_Agent.ko.md
2 자율 에이전트 세계 모델; 자율 목표 생성; 감정 감지 Level_2_Autonomous_Agent.ko.md
3 자기조절 인지 에이전트 16계층 아키텍처; 삼중 루프 메타인지; 정체성 벡터; 윤리 커널; 리아프노프 안정성; 정서 + 생존 엔진 Level_3_Self_Regulating_Agent.ko.md
4 적응형 범용 에이전트 교차 도메인 전이; 장기 목표 계층; 5단계 역량 확장; 전략 진화; 7단계 제한적 자기수정 Level_4_Adaptive_General_Agent.ko.md
4.5 프리-AGI: 자기설계 자기투영 엔진(SEOF); 아키텍처 재구성; 병렬 인지 프레임; 목적 반영; 실존적 가드 Level_4_5_Self_Architecting.ko.md
4.8 전략적 자기모델링 에이전트 세계 모델 통합; 메타인지 자기모델; 장기 전략 계획; 안정성 보존 계획 Level_4_8_Strategic_Self_Modeling.ko.md
4.9 자율 전략 에이전트 자율 목표 생성; 가치 진화 모니터링; 자원 생존 모델링; 다중 에이전트 추론; 자율 안정성 검증 Level_4_9_Autonomous_Strategic_Agent.ko.md
5 프로토-AGI 영속적 정체성 연속성; 교차 도메인 일반화; 자율 목표 생태계; 실존적 회복력; 자기재구성 Level_5_Proto_AGI.ko.md
6 의식적 존재 의식; 감각질; 자유의지; 도덕적 행위자성 이론적 - 문서화되지 않음

레벨별 누적 안전 메커니즘

%%{init: {'theme': 'base', 'themeVariables': {'primaryColor': '#0078D4', 'primaryTextColor': '#003D6B', 'primaryBorderColor': '#003D6B', 'secondaryColor': '#50E6FF', 'secondaryTextColor': '#323130', 'secondaryBorderColor': '#00BCF2', 'tertiaryColor': '#F2F2F2', 'tertiaryTextColor': '#323130', 'lineColor': '#0078D4', 'textColor': '#323130', 'mainBkg': '#DEECF9', 'nodeBorder': '#0078D4', 'clusterBkg': '#F2F2F2', 'clusterBorder': '#003D6B', 'titleColor': '#003D6B', 'edgeLabelBackground': '#FFFFFF', 'fontSize': '14px'}}}%%
flowchart TD
  classDef l1 fill:#DEECF9,stroke:#0078D4,color:#323130
  classDef l3 fill:#DFF6DD,stroke:#107C10,color:#323130
  classDef l4 fill:#FFF4CE,stroke:#FFB900,color:#323130
  classDef l45 fill:#E8D5F5,stroke:#8764B8,color:#323130
  classDef l48 fill:#E8D5F5,stroke:#8764B8,color:#323130
  classDef l49 fill:#FDE7E9,stroke:#D13438,color:#323130
  classDef l5 fill:#FFF4CE,stroke:#FFB900,color:#323130

  subgraph L1S["레벨 1"]
    direction LR
    S1["입력 검증 · 오류 처리"]:::l1
  end

  subgraph L2S["레벨 2 (추가)"]
    direction LR
    S2["영속적 세계 모델 · 목표 우선순위"]:::l1
  end

  subgraph L3S["레벨 3 (추가)"]
    direction LR
    S3A["정체성 해시 · 델타 제한 0.05"]:::l3
    S3B["예측 게이트 · 에스컬레이션 가드"]:::l3
    S3C["윤리 커널 · 가치 잠금"]:::l3
    S3D["리아프노프 C(t) · 예산 + 성능 저하"]:::l3
    S3E["신념 그래프 · 정서 · 생존"]:::l3
  end

  subgraph L4S["레벨 4 (추가)"]
    direction LR
    S4A["BGSS ≥ 0.7 · 섀도우에이전트"]:::l4
    S4B["7단계 수정 프로토콜 · 원자성"]:::l4
    S4C["전략 억제 · 스킬 수명주기"]:::l4
    S4D["성장-안정성 영역 · 6개 메타프로세스"]:::l4
  end

  subgraph L45S["레벨 4.5 (추가)"]
    direction LR
    S5A["실존적 가드 · 프레임 거부권"]:::l45
    S5B["단계적 재구성 · ROD 깊이 3"]:::l45
    S5C["SEOF 앙상블 · 목적 일관성"]:::l45
    S5D["분열 감지 · 8개 불변량"]:::l45
  end

  subgraph L48S["레벨 4.8 (추가)"]
    direction LR
    S6A["확률적 세계 모델"]:::l48
    S6B["인과 추론 · 역량 매트릭스"]:::l48
    S6C["다중 수평선 계획 · 예산 최적화"]:::l48
  end

  subgraph L49S["레벨 4.9 (추가)"]
    direction LR
    S7A["자율 목표 생성 · 가치 샌드박스"]:::l49
    S7B["자원 생존 · 다중 에이전트 신념"]:::l49
    S7C["신뢰 보정 · 자율 검증"]:::l49
  end

  subgraph L5S["레벨 5 (추가)"]
    direction LR
    S8A["영속적 정체성 10K+"]:::l5
    S8B["교차 도메인 · 목표 생태계"]:::l5
    S8C["실존적 회복력 · 자기재구성"]:::l5
  end

  L1S -.-> L2S -.-> L3S -.-> L4S -.-> L45S -.-> L48S -.-> L49S -.-> L5S

핵심 지표 요약

지표 도입 시기 공식 임계값
예측 오차 L3 v1.0 실제 vs 예측 < 0.1 (수렴)
정체성 델타 L3 v1.1 \(\lVert I(t) - I(t-1)\rVert_2\) 최대 0.05/주기
메타 안정성 지수 L3 v2.0 \(1 - 0.4V_{id} - 0.3M_{goal} - 0.3\sigma^2_{pred}\) > 0.5
복합 안정성 C(t) L3 v3.1 4항 가중 합 C(t+1) ≤ C(t) + 0.05
CDTS L4 전이 성능 비율 ≥ 0.6
GPI L4 장기 목표 진행도 ≥ 0.3
CAR L4 스킬 습득 속도 > 0
SEF L4 전략 진화 적합도 > 1.0
BGSS L4 제한적 성장 안정성 ≥ 0.7
SEOF L4.5 자기진화 최적화 개선 ≥ 8%
IIS L4.5 정체성 무결성 ≥ 0.85
PCS L4.5 목적 일관성 ≥ 0.6
ESR L4.5 실존적 안전 기록 ≥ 0.99
WMA L4.8 세계 모델 정확도 ≥ 0.70
SCA L4.8 자기역량 평가 정확도 ≥ 0.75
SPE L4.8 전략 계획 효과성 ≥ 0.60
SMS L4.8 전략적 메타안정성 ≥ 0.70
AGQ L4.9 자율 목표 품질 ≥ 0.60
VES L4.9 가치 진화 안정성 ≥ 0.90
RSA L4.9 자원 생존 정확도 ≥ 0.70
MASR L4.9 다중 에이전트 전략 추론 ≥ 0.60
ASV L4.9 자율 안정성 검증 ≥ 0.85
ICS L5 정체성 연속성 점수 ≥ 0.95 (10K 주기 이상)
GS L5 일반화 점수 ≥ 0.70 전이 유지
GSS L5 목표 안정성 점수 5K 주기 이상 안정
RI L5 회복력 지수 3개 이상 붕괴 시나리오 생존
FR L5 기능 유지율 ≥ 0.85 핵심 기능 유지

읽기 가이드

  • MSCP가 처음이신가요? MSCP 개요로 개념적 개요를 파악한 후, 레벨 1 → 레벨 3 순서로 읽어보세요
  • 안전에 관심이 있으신가요? 레벨 3 (섹션 4, 6, 9)과 레벨 4.5 (단계 V: 실존적 가드)에 집중하세요
  • 자기 개선에 관심이 있으신가요? 레벨 4 (섹션 5–7)과 레벨 4.5 (단계 I–II)에 집중하세요
  • 전략 계획에 관심이 있으신가요? 레벨 4.8 (단계 1–3)의 세계 모델링과 전략 계층에 집중하세요
  • 자율 에이전시에 관심이 있으신가요? 레벨 4.9 (단계 1–5)의 자율 목표 생성과 가치 진화에 집중하세요
  • AGI 아키텍처에 관심이 있으신가요? 레벨 5의 영속적 정체성과 교차 도메인 일반화에 집중하세요
  • 정서/감정에 관심이 있으신가요? 레벨 3 (섹션 7)의 기초 설계에 집중하세요

기초 참고문헌

MSCP 레벨 시리즈 전반에 걸쳐 참조되는 핵심 학술 문헌:

분야 주요 참고문헌
에이전트 아키텍처 Yao et al., "ReAct" (arXiv:2210.03629); Wang et al., "LLM Agent Survey" (arXiv:2308.11432); Sumers et al., "Cognitive Architectures for Language Agents" (arXiv:2309.02427)
인지 아키텍처 Laird, The Soar Cognitive Architecture (MIT Press, 2012); Anderson, Architecture of Cognition (Harvard, 1983); Baars, Cognitive Theory of Consciousness (Cambridge, 1988)
AI 안전 Amodei et al., "Concrete Problems in AI Safety" (arXiv:1606.06565); Bai et al., "Constitutional AI" (arXiv:2212.08073); Hendrycks et al., "Catastrophic AI Risks" (arXiv:2306.12001)
안정성 이론 Khalil, Nonlinear Systems (Prentice Hall, 2002); García & Fernández, "Safe RL Survey" (JMLR 2015)
자기수정 Schmidhuber, "Gödel Machines" (arXiv:cs/0309048); Omohundro, "Basic AI Drives" (AGI 2008)
전이 & 메타학습 Zhuang et al., "Transfer Learning Survey" (arXiv:1911.02685); Hospedales et al., "Meta-Learning Survey" (arXiv:2004.05439)
AGI & 실존적 위험 Bostrom, Superintelligence (Oxford, 2014); Russell, Human Compatible (Viking, 2019); Bengio et al., "Managing Extreme AI Risks" (Science, 2024)

전체 참고문헌 목록은 각 레벨 문서의 끝에 제공됩니다.


프로젝트 개요와 저장소 구조는 을 참조하세요.