AI Lab2026-04-23·1분 읽기
AI 자기진화 — 파인튜닝 없이 가능한가?
Claude / GPT / Gemini 같은 클라우드 LLM 도 외부 루프 self-evolution 가능. Voyager 가 GPT-4 weights 안 바꾸고 SOTA 달성한 사례.
두 가지 자기진화
AI 가 스스로 진화한다 — 두 가지 다른 의미다.
A. 진짜 파인튜닝 (Weights 수정)
- SFT, RLHF, DPO, LoRA
- 모델 가중치 영구 변경
- 로컬 모델만 가능: Llama 3, Qwen, Mistral, DeepSeek
- Claude, GPT, Gemini = 가중치 비공개 = 불가능
B. 외부 루프 의사진화 (Memory + Reflection)
- 매 사이클 결과 → 외부 메모리 저장
- 다음 사이클 컨텍스트로 입력
- "마치 학습한 것처럼" 행동
- Claude, GPT, Gemini 다 가능
결정적 사례 — Voyager
NVIDIA 의 Voyager (Wang et al. 2023) 는 GPT-4 의 weights 를 전혀 수정하지 않고 Minecraft 에서 자율적으로 스킬 라이브러리를 구축했다. 외부 루프만으로 SOTA 갱신.
→ 클라우드 LLM 의사진화 = 도메인에 따라 충분.
8개 도메인 모두 실증됨
- 코딩: Devin SWE-bench 50%
- 과학: Sakana AI Scientist v2 ICLR 동료심사 통과
- 수학: AlphaProof IMO 은메달
- 게임: Voyager 3.1배
- 로봇: Eureka 인간 83% 초과
- 메모리: Letta 74%
- 트레이딩: FinMem
- 컨텐츠: 일부
한국 시장 빈칸
업스테이지·올거나이즈·GAEBAL AI 모두 "기업 파인튜닝 외주" 또는 "RAG 빌더" 에 머물러 있다. 비개발자용 한국어 자기진화 셋업 키트는 거의 비어있다. 6~12개월 window 추정.
— Jack