← 빌드 일지

AI Lab2026-04-23·1분 읽기

AI 자기진화 — 파인튜닝 없이 가능한가?

Claude / GPT / Gemini 같은 클라우드 LLM 도 외부 루프 self-evolution 가능. Voyager 가 GPT-4 weights 안 바꾸고 SOTA 달성한 사례.

두 가지 자기진화

AI 가 스스로 진화한다 — 두 가지 다른 의미다.

A. 진짜 파인튜닝 (Weights 수정)

SFT, RLHF, DPO, LoRA
모델 가중치 영구 변경
로컬 모델만 가능: Llama 3, Qwen, Mistral, DeepSeek
Claude, GPT, Gemini = 가중치 비공개 = 불가능

B. 외부 루프 의사진화 (Memory + Reflection)

매 사이클 결과 → 외부 메모리 저장
다음 사이클 컨텍스트로 입력
"마치 학습한 것처럼" 행동
Claude, GPT, Gemini 다 가능

결정적 사례 — Voyager

NVIDIA 의 Voyager (Wang et al. 2023) 는 GPT-4 의 weights 를 전혀 수정하지 않고 Minecraft 에서 자율적으로 스킬 라이브러리를 구축했다. 외부 루프만으로 SOTA 갱신.

→ 클라우드 LLM 의사진화 = 도메인에 따라 충분.

8개 도메인 모두 실증됨

코딩: Devin SWE-bench 50%
과학: Sakana AI Scientist v2 ICLR 동료심사 통과
수학: AlphaProof IMO 은메달
게임: Voyager 3.1배
로봇: Eureka 인간 83% 초과
메모리: Letta 74%
트레이딩: FinMem
컨텐츠: 일부

한국 시장 빈칸

업스테이지·올거나이즈·GAEBAL AI 모두 "기업 파인튜닝 외주" 또는 "RAG 빌더" 에 머물러 있다. 비개발자용 한국어 자기진화 셋업 키트는 거의 비어있다. 6~12개월 window 추정.

— Jack