Retrieval on ICE-ICE-BEAR-BLOG

에이전트 메모리 아키텍처 두 갈래 — MemPalace의 구조화 인덱스 vs Hermes Agent의 스크래치패드 자기학습

Sun, 10 May 2026 00:00:00 +0900

개요

2026-05-10 같은 시기에 회자된 두 리포 — MemPalace/mempalace와 NousResearch/hermes-agent — 가 에이전트 메모리의 서로 다른 두 프리미티브를 정면 충돌시킨다. 한쪽은 구조화된 인덱스(wings/rooms/drawers + 시간 윈도가 있는 지식 그래프), 반대쪽은 emergent 스크래치패드 + 자기학습 스킬 + FTS5 회상. 이전 글의 OS 레이어 논의에서 메모리/워크플로 슬롯이 어떻게 자리 잡는지 봤다면, 이번 글은 그 메모리 슬롯 내부에서 갈라지는 두 디자인 철학을 본다.

graph TD
 Task["에이전트 태스크"] --> Decision{"메모리 디자인 선택"}
 Decision --> Structured["구조화 — MemPalace"]
 Decision --> Emergent["Emergent — Hermes Agent"]

 Structured --> Wings["wings / rooms / drawers <br/> verbatim 저장"]
 Structured --> KG["temporal knowledge graph <br/> SQLite + validity window"]
 Structured --> MCP29["29개 MCP 툴 <br/> 명시적 인덱스 호출"]

 Emergent --> Scratch["대화 + 노트 스크래치패드"]
 Emergent --> Skills["자기 생성 스킬 <br/> 사용 중 self-improve"]
 Emergent --> FTS["FTS5 세션 검색 <br/> + LLM 요약"]

 Wings --> Retrieve["검색 시 wing 스코프 한정"]
 Scratch --> Recall["LLM이 도구로 회상 트리거"]

1. MemPalace — 구조화된 인덱스의 끝을 본다

MemPalace/mempalace는 “The best-benchmarked open-source AI memory system” 을 표방하는 2026-04-05 생성 MIT 프로젝트로, 2026-05-11 푸시 시점 51,879 stars. 핵심 베팅은 한 줄로 — 원문을 압축·요약 없이 그대로 저장하고, 의미 검색은 사전 구조로 좁혀라.

자리 구조

wings — 사람·프로젝트 단위. 검색 시 스코프를 한정한다.
rooms — 토픽 단위. wing 안에서 다시 좁힌다.
drawers — 원문 본문이 들어가는 가장 작은 단위. 요약/추출/패러프레이즈 없음.
knowledge graph — 로컬 SQLite에 entity·relationship + validity window. 시간이 흐르며 fact가 더 이상 유효하지 않게 되는 걸 명시적으로 마크 가능.
agent diaries — 스페셜리스트 에이전트마다 자기 wing 안의 일기. 런타임에 mempalace_list_agents로 발견 가능 → 시스템 프롬프트가 부풀지 않는다.

벤치마크

LongMemEval 500 questions 기준:

모드	R@5	LLM 필요
Raw 의미 검색 (휴리스틱·LLM 없음)	96.6%	없음
Hybrid v4, 450q held-out	98.4%	없음
Hybrid v4 + LLM rerank, 500q	≥99%	임의의 capable 모델

추가로 LoCoMo R@10 88.9% (hybrid v5, 1,986 questions), ConvoMem 250 items 평균 회상 92.9%, MemBench (ACL 2025) 8,500 items R@5 80.3%. 같은 시기에 회자된 agentmemory가 보인 LongMemEval R@5 95.2%와 비교하면 raw 모드만으로 +1.4%p — 임베딩 위 사전 구조화의 효과가 가장 크게 드러나는 영역이 retrieval recall이라는 신호다.

셋업

uv tool install mempalace
mempalace init ~/projects/myapp

# 마이닝
mempalace mine ~/projects/myapp # 프로젝트 파일
mempalace mine ~/.claude/projects/ --mode convos # Claude Code 세션

# 검색·로드
mempalace search "왜 GraphQL로 바꿨더라"
mempalace wake-up

API 키 없음, 클라우드 호출 없음, ChromaDB 디폴트, mempalace/backends/base.py 인터페이스를 따르는 다른 백엔드로 교체 가능. 29개 MCP 툴이 palace 읽기·쓰기, 그래프 연산, cross-wing 네비게이션, drawer 관리, 에이전트 다이어리를 커버.

의미

MemPalace의 베팅은 “메모리 품질 = 인덱스 품질” 이다. 압축·요약은 손실을 만든다 → verbatim 보존 + retrieval 시 wing/room으로 스코프를 좁히면 LLM이 길어진 쓰레기 컨텍스트를 헤집을 필요가 없다. knowledge graph의 validity window는 시간 흐름에 따른 사실 변동을 LLM의 추론에 떠넘기지 않고 인덱스 레이어에서 명시한다는 점에서 특히 큰 차이다.

2. Hermes Agent — emergent 스크래치패드의 끝을 본다

NousResearch/hermes-agent는 “The agent that grows with you” 를 표방하는 Nous Research의 MIT 프로젝트로, 2025-07-22 생성, 2026-05-11 시점 142,575 stars — 같은 메모리 비교군에서 가장 큰 모집단이다. 베팅은 정반대 — 메모리는 별도 인덱스가 아니라 에이전트가 자기 운영 중에 만들어내는 emergent 산출물이다.

메모리를 구성하는 네 가지 흐름

agent-curated memory + periodic nudges — 에이전트가 스스로 “이건 기억할 가치가 있다"고 판단해 메모리에 적는다. 주기적 nudge가 persistence를 강제.
자기 생성 스킬 — 복잡한 태스크 이후 Skills Hub에 등록 가능한 스킬을 자율적으로 만든다. 사용 중 self-improve. agentskills.io 오픈 표준 호환.
FTS5 세션 검색 + LLM 요약 — 과거 대화를 SQLite FTS5로 full-text 검색 후 LLM 요약으로 cross-session 회상.
사용자 모델링 — plastic-labs/honcho dialectic user modeling으로 “당신이 누구인지"의 모델을 세션을 가로질러 깊게 쌓는다.

어디서 실행되는가

Telegram · Discord · Slack · WhatsApp · Signal · Email · CLI — 게이트웨이 한 프로세스로 다 받는다. 일곱 개 터미널 백엔드 — 로컬, Docker, SSH, Singularity, Modal, Daytona, Vercel Sandbox — 중 Daytona·Modal은 idle 시 hibernate, 깨어날 때만 비용. 노트북에 묶이지 않은 에이전트.

모델 자유

hermes model 한 줄로 Nous Portal, OpenRouter, NVIDIA NIM, Xiaomi MiMo, z.ai/GLM, Kimi/Moonshot, MiniMax, Hugging Face, OpenAI, 자체 엔드포인트 사이 전환. 메모리는 모델과 분리된 emergent 산출물이므로 모델을 갈아치워도 그대로 따라간다.

의미

Hermes의 베팅은 “메모리는 호출되어야 한다 — LLM이 직접” 이다. 사전 인덱스가 retrieval 정확도를 책임지는 게 아니라, LLM이 자기 turn 중에 “지금 과거의 무엇이 필요한가"를 결정해 FTS5 검색 도구를 호출하고, 요약을 만들어 자기 컨텍스트에 끼워 넣는다. 스킬은 작성 시점 한 번이 아니라 사용하면서 스스로 고쳐 쓰는 살아 있는 절차 메모리.

3. 정면 비교

항목	MemPalace	Hermes Agent
만든 곳	MemPalace	Nous Research
라이선스	MIT	MIT
생성	2026-04-05	2025-07-22
5/11 stars	51,879	142,575
메모리 모델	구조화 인덱스 + 지식 그래프	스크래치패드 + emergent 스킬 + FTS
저장 방식	verbatim drawer	대화·노트·스킬, 필요 시 요약
시간 처리	그래프 validity window	LLM이 요약하며 재구성
Retrieval 책임	인덱스 (R@5 96.6% raw)	LLM이 도구로 호출
모델 종속	모델 무관 (raw는 LLM 0회)	모델 무관 (10+ 프로바이더)
인터페이스	29개 MCP 툴 + CLI	TUI + 6개 메시징 게이트웨이
단일 실행 단위	`mempalace search`	`hermes` 세션

4. 어떤 태스크에 어느 쪽이 스케일하는가

flowchart LR
 A["태스크 특성"] --> B{"retrieval recall이 최우선?"}
 B -->|Yes| C["구조화 인덱스 <br/> MemPalace"]
 B -->|No| D{"세션이 길고 다중 채널?"}
 D -->|Yes| E["스크래치패드 + 자기학습 <br/> Hermes Agent"]
 D -->|No| F["둘 다 과잉 — <br/> long context로 충분"]
 C --> G["사실 정확도, 시간 변동, <br/> 다중 에이전트 공유"]
 E --> H["페르소나 학습, 절차 메모리, <br/> 메시징 채널 연속성"]

사실 회상이 KPI인 곳 — 고객 히스토리, 코드베이스 결정 기록, “X를 언제 왜 바꿨더라” 같은 질문이 중요하면 MemPalace가 더 맞는다. R@5 96.6%는 다른 누구도 raw 모드로 내지 못한 숫자다.
운영이 길어지고 모달리티가 다양한 곳 — Telegram에서 시작해 Slack에서 이어지고 cron으로 매일 새벽 보고서를 받는 워크플로라면 Hermes의 메시징·스케줄·스킬 쪽이 더 맞는다. 메모리 정확도는 적당히 양보하고 운영 연속성을 사는 트레이드.
단일 세션 단발성 태스크 — 둘 다 과잉이다. Claude나 GPT의 현재 컨텍스트 윈도(수십만~100만 토큰)면 충분히 처리된다. 이게 핵심 — 현재 컨텍스트 윈도가 1인 1세션 수준에서는 둘 다 필요 없다. 매기는 가격은 에이전트 팀 규모에서 나온다.

에이전트 팀 스케일에서 갈리는 지점

N명의 스페셜리스트가 같은 사실 풀을 공유해야 한다 → MemPalace의 wings + cross-wing 네비게이션이 직접 답이다.
N개 채널을 가로질러 같은 페르소나가 유지돼야 한다 → Hermes의 Honcho dialectic 모델링이 직접 답이다.
N일 동안 자기 절차를 진화시켜야 한다 → Hermes의 self-improving 스킬이 직접 답이다.
N년 동안 사실의 유효 기간이 바뀐다 → MemPalace의 temporal knowledge graph가 직접 답이다.

현장 한 줄 평으로 정리하면, MemPalace는 “정확도 인프라"이고 Hermes는 “운영 인프라” 다. 같은 메모리라는 단어를 쓰지만 책임 영역이 거의 겹치지 않는다.

인사이트

같은 시기 51K와 142K stars를 동시에 모은 두 프로젝트가 메모리라는 단어를 정반대 방향으로 정의했다는 점이 이 디지스트의 핵심이다. MemPalace는 메모리를 검색 가능한 사실 인덱스로 보고, retrieval 정확도(96.6% raw R@5)와 시간 그래프(validity window)에 디자인 예산을 다 썼다. Hermes는 메모리를 LLM이 호출하는 운영 흐름으로 보고, 스크래치패드·자기 진화 스킬·다중 채널 연속성에 같은 예산을 썼다. 둘 다 모델 종속을 의도적으로 끊은 것까지는 동일한 방향이지만, 메모리의 “어디까지가 인덱스이고 어디부터가 에이전트인가” 라는 경계선이 정반대다. 이전 글이 메모리/워크플로 두 슬롯이 OS 레이어로 모이는 풍경이었다면, 이번 흐름은 메모리 슬롯 안에서 다시 인덱스파와 스크래치패드파로 갈라지는 두 번째 분기다. 현재 컨텍스트 윈도가 단일 세션을 거의 다 흡수해버리는 시점에서 보면 둘 중 누구도 시급해 보이지 않지만, 에이전트가 팀 단위로 운영되기 시작하면 두 디자인 차이는 곧장 비용·정확도·운영 안정성으로 환산된다. 다음 분기 흥미로운 질문은 둘 — 인덱스 진영이 emergent 스크래치패드를 인덱스에 흡수할지, 스크래치패드 진영이 명시적 그래프를 자기 도구로 끌어들일지 다. 한쪽이 다른 쪽을 흡수하는 방향으로 수렴할 가능성이 더 높아 보인다.

참고

핵심 리포지토리

MemPalace/mempalace · 공식 사이트 mempalaceofficial.com · palace concepts · knowledge graph · MCP 툴 레퍼런스
NousResearch/hermes-agent · 문서 hermes-agent.nousresearch.com/docs · 메모리 가이드 · 스킬 시스템

관련 메모리 도구 / 비교군

rohitg00/agentmemory — 같은 LongMemEval 평가군의 직전 디자인
plastic-labs/honcho — Hermes가 쓰는 dialectic 사용자 모델링
agentskills.io — Hermes·OpenClaw가 공통으로 따르는 오픈 스킬 표준

프로토콜·런타임

Model Context Protocol (MCP)
SQLite FTS5 — Hermes의 세션 검색 백엔드
ChromaDB — MemPalace 디폴트 벡터 백엔드
런타임: Modal · Daytona · Vercel Sandbox

벤치마크·논문

이번 주 arxiv 논문 5편 디지스트 — 인터페이스와 prior를 다시 보는 한 주

Sat, 09 May 2026 00:00:00 +0900

개요

지난 며칠 사이 arxiv에서 눈에 들어온 논문 5편. 분야는 정보 검색, 수학 보조 에이전트, attention 구조, SFT로 인한 할루시네이션, 표현 학습 이론으로 다 다른데, 묶어 읽으면 한 가지 의문이 반복된다 — “우리가 당연하게 받아들이던 인터페이스와 prior가, 사실 모델의 진짜 능력을 가로막고 있는 건 아닌가?” 지난 디지스트가 협력·영속성·구조라는 세 축으로 추론 향상의 출처를 봤다면, 이번 주는 그 한 단계 아래 — 이미 깔린 추상화 계층을 다시 의심하는 흐름이다.

graph TD
 Theme["이번 주의 한 줄: <br/> 깔린 인터페이스/prior를 다시 의심한다"]
 Theme --> Retrieval["검색 인터페이스 <br/> (top-k similarity)"]
 Theme --> Workflow["수학 워크플로우 <br/> (단발 응답)"]
 Theme --> Arch["Attention prior <br/> (uniform 가정)"]
 Theme --> Training["SFT 목적함수 <br/> (사실성과 충돌)"]
 Theme --> Repr["표현 유사도 metric <br/> (스케일에 오염)"]

 Retrieval --> P1["DCI (2605.05242)"]
 Workflow --> P2["AI Co-Mathematician (2605.06651)"]
 Arch --> P3["GOAT (2601.15380)"]
 Training --> P4["Self-distillation SFT (2604.15574)"]
 Repr --> P5["Aristotelian Repr. (2602.14486)"]

#	논문	분야	한 줄 요약
1	Direct Corpus Interaction (2605.05242)	cs.IR	임베딩 없이 `grep`·셸 도구로 corpus를 직접 뒤지는 에이전트가 강한 retriever를 이긴다
2	AI Co-Mathematician (2605.06651)	cs.AI	수학자용 비동기·상태 보존 워크벤치, FrontierMath Tier 4 48%
3	GOAT — You Need Better Attention Priors (2601.15380)	cs.LG	Entropic Optimal Transport 관점에서 attention prior를 학습 가능하게
4	Why Fine-Tuning Encourages Hallucinations (2604.15574)	cs.CL	SFT가 만드는 할루시네이션을 self-distillation으로 줄인다
5	Aristotelian Representation Hypothesis (2602.14486)	cs.LG	Platonic Representation 수렴은 metric 결함; 진짜 수렴은 local neighborhood

1. Direct Corpus Interaction — 2605.05242

Zhuofeng Li, Haoxiang Zhang, Pan Lu, Shangbin Feng, Ming Zhong, Yejin Choi, James Zou, Jiawei Han, Wenhu Chen, Jimmy Lin 외 (2026-05-03, cs.IR).

핵심

현대 retrieval 시스템은 lexical이든 semantic이든 corpus를 고정된 similarity 인터페이스로 압축한다. top-k라는 단발 step 이후에야 추론이 시작되는 구조. 에이전트가 강해질수록 이 압축이 병목이 된다. 정확한 lexical 제약, 희박한 단서들의 결합, local context 체크, 다단계 가설 수정 — 모두 기존 retriever 호출로는 표현하기 어렵다. 한 번 걸러 나간 증거는 더 강한 downstream 추론으로도 되돌릴 수 없다.

저자들의 제안은 Direct Corpus Interaction (DCI) — 임베딩 모델도, vector index도, retrieval API도 없이, 에이전트가 grep·파일 읽기·셸 명령·경량 스크립트 같은 범용 터미널 도구로 raw corpus를 직접 뒤지게 한다.

Contribution

오프라인 인덱싱 불필요, 진화하는 local corpus에 자연스럽게 적응
BRIGHT·BEIR 여러 데이터셋에서 sparse·dense·reranking 강 baseline 모두 능가
BrowseComp-Plus·multi-hop QA에서 기존 semantic retriever 없이도 강한 정확도
결론: 에이전트가 강해질수록 retrieval 품질은 추론력만이 아니라 모델이 corpus와 상호작용하는 인터페이스의 해상도에 의존한다

왜 지금 의미가 큰가

이건 그냥 “RAG보다 더 잘하는 방법"이 아니다. 검색 = top-k similarity 라는 지난 10년의 디폴트를 의심하는 논문이다. Claude Code가 grep·find로 코드베이스를 뒤지는 방식이 사실은 일반화 가능한 인터페이스라는 얘기이기도 하다. 검색 인덱스 산업이 가정해 온 추상화 계층 자체가 다음 라운드에선 옵션 중 하나로 격하될 수 있다.

2. AI Co-Mathematician — 2605.06651

Daniel Zheng, Ingrid von Glehn, Yori Zwols, Lars Buesing, Daniel M. Roy, Martin Wattenberg, Fernanda Viégas, Alex Davies, Pushmeet Kohli 외 (Google DeepMind, 2026-05-07, cs.AI).

핵심

수학자가 AI 에이전트와 상호작용적으로 열린 연구를 수행하는 워크벤치. 핵심 디자인 결정은 단발 응답이 아니라 **비동기·상태 보존 워크스페이스(asynchronous, stateful workspace)**라는 점.

flowchart LR
 User["수학자"] -->|"의도 (자주 흐림)"| WS["Stateful Workspace"]
 WS --> Idea["ideation"]
 WS --> Lit["literature search"]
 WS --> Comp["computational exploration"]
 WS --> Proof["theorem proving"]
 WS --> Theory["theory building"]
 WS -.->|"실패 가설 추적"| WS
 WS -->|"native math artifact"| User

Contribution

불확실성 관리, 사용자 의도 정제, 실패한 가설 추적, native 수학 산출물 출력 — 이 네 가지를 한 시스템에 묶음
초기 테스트에서 연구자들이 미해결 문제 해결, 새로운 연구 방향 식별, 간과된 literature 참조 발견
FrontierMath Tier 4에서 48% — 평가된 모든 AI 시스템 중 최고점

왜 지금 의미가 큰가

이건 AlphaProof 류의 자동 정리 증명과 결이 다르다. 수학자를 대체하는 시스템이 아니라, 수학자의 사고 흐름 — 흐릿한 의도 → 탐색 → 막다른 길 → 재시도 — 을 그대로 인터페이스화한 시스템이다. Claude Skills 같은 비동기 워크플로우 인프라가 일반 도메인에서 시도하는 것을, 수학이라는 verifiable 영역에서 먼저 검증한 셈. 다음 라운드 “에이전트 워크벤치"의 reference design이 될 수 있다.

3. GOAT — You Need Better Attention Priors — 2601.15380

Elon Litman, Gabe Guo (2026-01-21, cs.LG).

핵심

Attention을 Entropic Optimal Transport 렌즈로 보면, 표준 softmax attention은 암묵적 uniform prior로 정규화된 transport 문제다. 저자들은 이 “naive assumption"을 학습 가능한 연속 prior로 대체하는 **GOAT (Generalized Optimal transport Attention with Trainable priors)**를 제안한다.

Contribution

FlashAttention 같은 최적화 커널과 완전 호환
attention sink 현상의 EOT 기반 설명 및 해소 — 표준 attention의 representational trade-off 회피
공간 정보를 core attention 계산에 흡수, extrapolatable prior 학습 — 학습된 positional embedding의 유연성 + 고정 encoding의 length generalization

왜 지금 의미가 큰가

2017년 Transformer 이후 attention의 prior가 uniform이라는 사실은 거의 한 번도 의심받지 않았다. GOAT는 attention sink 같은 현장 엔지니어들이 patch로 메우던 현상이 사실 prior 설계 문제였음을 보여준다. Mamba·RWKV 같은 non-attention 아키텍처가 등장한 시점에 attention을 더 일반화하는 방향이 어디까지 가능한가에 대한 흥미로운 답.

4. Why Fine-Tuning Encourages Hallucinations — 2604.15574

Guy Kaplan, Zorik Gekhman, Zhen Zhu, Lotem Rozner, Yuval Reif, Swabha Swayamdipta, Derek Hoiem, Roy Schwartz (2026-04-16, cs.CL).

핵심

LLM이 할루시네이션을 일으키는 주요 원인 중 하나는 supervised fine-tuning(SFT) 동안 새로운 사실 정보에 노출되는 것. 사전학습으로 획득한 지식 대비 할루시네이션이 늘어난다. 저자들은 이걸 continual learning 문헌의 지식 열화(knowledge degradation) 문제로 재정의하고, 그 도구로 해결한다.

Contribution

self-distillation 기반 SFT 방법 제안 — 출력 분포 drift를 정규화하여 효과적 사실 학습과 할루시네이션 최소화 동시 달성
새 지식 습득이 불필요한 상황: parameter group을 freeze하여 사실적 plasticity를 억제, task 성능 유지하면서 할루시네이션 감소
SFT 유발 할루시네이션의 메커니즘을 3가지 가설로 조사: capacity 한계, behavior cloning, localized interference
주된 원인: 겹치는 의미적 표현 간 간섭 (interference among overlapping semantic representations). self-distillation이 이 간섭을 완화함으로써 성공

왜 지금 의미가 큰가

“SFT가 할루시네이션을 만든다"는 관찰은 Gekhman 외 2024에서도 나왔다. 이번 논문은 그 메커니즘을 표현 간섭으로 특정하고 self-distillation으로 푼다는 점에서 한 단계 나간다. RLHF 이전 단계인 SFT 그 자체가 안전·사실성의 결함 지점이라는 통찰은 alignment 파이프라인 전체 재설계를 시사한다. instruction tuning을 무지성으로 돌리던 시기는 끝.

5. Aristotelian Representation Hypothesis — 2602.14486

Fabian Gröger, Shuo Wen, Maria Brbić (EPFL, 2026-02-16, cs.LG).

핵심

Platonic Representation Hypothesis (Huh, Cheung, Wang, Isola, 2024)는 신경망 표현이 현실의 공통 통계 모델로 수렴 중이라는 주장. 이 논문은 그 주장의 측정 도구 자체를 의심한다.

Contribution

기존 representational similarity metric이 network scale에 confound — 모델 depth/width 증가만으로 유사도 점수가 체계적으로 부풀려짐
permutation 기반 null-calibration 프레임워크 — 어떤 representational similarity metric이든 통계적 보장이 있는 calibrated score로 변환
보정 후 결과: 전역 spectral measure가 보고한 수렴은 대부분 사라진다. 하지만 local neighborhood similarity (단, local distance가 아님)는 modality를 가로질러 유의미한 일치 유지
Aristotelian Representation Hypothesis 제안: 신경망 표현은 공유된 local neighborhood 관계로 수렴한다 — 거리(Platonic 절대 형상)가 아니라 이웃 구조(Aristotelian 관계 카테고리)

왜 지금 의미가 큰가

이건 메타 논문이다. 결과가 아니라 측정의 결함을 지적한다. Platonic Representation 가설은 2024년 이후 멀티모달 정렬의 이론적 근거로 자주 인용됐다. 이 calibration framework가 표준으로 자리잡으면, 지난 2년간의 “표현 수렴” 주장들은 다시 검사받아야 한다. 그리고 새로 남는 결론 — local neighborhood만 수렴한다 — 은 contrastive learning 류 embedding 학습이 왜 잘 작동하는지에 대한 더 깔끔한 설명이기도 하다.

묶어서 본 흐름

다섯 논문이 향하는 곳: 이미 깔린 추상화 계층을 다시 의심한다.

의심받는 계층	무엇을 가정했나	무엇이 더 나은가	논문
검색 인터페이스	top-k similarity가 충분	에이전트가 raw corpus 직접 탐색	DCI
수학 워크플로우	단발 질의응답	비동기·상태 보존 워크벤치	AI Co-Mathematician
Attention prior	uniform 분포	학습 가능한 prior + EOT	GOAT
SFT 목적함수	새 지식 = 좋은 것	self-distillation으로 간섭 완화	Why FT Hallucinates
표현 유사도 metric	spectral이 충분	scale에 robust한 calibration	Aristotelian

quadrantChart
 title 이번 주 5편 — 추상화 계층 × 영향 범위
 x-axis "낮은 계층 (구조/이론)" --> "높은 계층 (워크플로우)"
 y-axis "좁은 영향" --> "넓은 영향"
 quadrant-1 "재설계 후보 (높은 계층 + 넓은 영향)"
 quadrant-2 "기반 재교정 (낮은 계층 + 넓은 영향)"
 quadrant-3 "특수 케이스"
 quadrant-4 "도구 단계"
 "DCI (retrieval)": [0.55, 0.85]
 "AI Co-Math": [0.85, 0.6]
 "GOAT (attention)": [0.15, 0.75]
 "SFT halluc.": [0.5, 0.7]
 "Aristotelian": [0.25, 0.55]

지난 디지스트는 “추론 향상은 어디서 오는가"를 협력·영속성·구조로 풀었다. 이번 주는 한 층 더 들어간다 — 그 추론을 받쳐주는 인터페이스/prior가 옳게 깔려 있는가라는 질문이다. 둘은 충돌하지 않는다. 오히려 같은 흐름의 다음 단계로 보인다: 모델 크기를 키우는 라운드는 끝났고, 다음 라운드의 차별화는 에이전트 협력 토폴로지(지난 주) + 추상화 계층 재교정(이번 주) 에서 나온다.

인사이트

이번 주 다섯 편을 묶으면 한 가지 공통 자세가 드러난다 — “당연하다고 받아들이던 디폴트를 한 번만 더 의심해 보자.” DCI는 검색 = top-k라는 디폴트를, AI Co-Mathematician은 응답 = 단발 텍스트라는 디폴트를, GOAT는 attention prior = uniform이라는 디폴트를, SFT 할루시네이션 논문은 SFT가 knowledge injection을 무료로 해 준다는 디폴트를, Aristotelian 논문은 표현 유사도 metric이 신뢰할 만하다는 디폴트를 의심한다. 이 다섯 디폴트는 각각 산업 전체가 한 번도 진지하게 의심하지 않은 채 그 위에 stack을 쌓아 올린 가정들이다.

스케일이 새로운 능력을 만들어내는 라운드 — 2020-2024년 — 가 일단락된 후, 차세대 차별화는 모델 파라미터 수가 아니라 모델이 세계와 만나는 인터페이스 해상도에서 나온다. DCI의 raw corpus 인터페이스, AI Co-Mathematician의 stateful workspace, GOAT의 학습된 prior, self-distillation SFT, neighborhood 기반 표현 calibration — 다섯 다 같은 메타-원칙의 다른 응용이다: abstraction layer는 비용 없는 단순화가 아니라 정보 손실이 일어나는 지점이다. 손실을 줄이려면 layer를 다시 설계하라.

지난 주 픽이 에이전트 협력의 위쪽 — 어떻게 협력하고 누적하고 구조화하는가 — 을 봤다면, 이번 주는 아래쪽 — 그 아래 깔린 검색·표현·prior가 옳게 깔려 있는가 — 를 본다. 두 흐름이 같은 시점에 모이고 있다는 것 자체가, 다음 라운드의 키워드가 모델 크기가 아니라 stack 전체 재교정임을 보여준다.

참고

Papers (이번 주 5편)

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction (2605.05242) — Li, Zhang, Lu, Feng, Choi, Zou, Han, Chen, Lin 외 (2026-05-03, cs.IR)
AI Co-Mathematician: Accelerating Mathematicians with Agentic AI (2605.06651) — Zheng, von Glehn, Buesing, Roy, Wattenberg, Viégas, Davies, Kohli 외 (Google DeepMind, 2026-05-07, cs.AI)
You Need Better Attention Priors — GOAT (2601.15380) — Litman, Guo (2026-01-21, cs.LG)
Why Fine-Tuning Encourages Hallucinations and How to Fix It (2604.15574) — Kaplan, Gekhman, Zhu, Rozner, Reif, Swayamdipta, Hoiem, Schwartz (2026-04-16, cs.CL)
Revisiting the Platonic Representation Hypothesis: An Aristotelian View (2602.14486) — Gröger, Wen, Brbić (EPFL, 2026-02-16, cs.LG)

Background

The Platonic Representation Hypothesis — Huh, Cheung, Wang, Isola (2024) — 이번 주 5번 논문이 도전하는 원전
Attention Is All You Need — Vaswani 외 (2017) — GOAT가 일반화 대상으로 삼는 baseline
FlashAttention — Tri Dao — GOAT가 호환을 강조하는 커널
Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations? (2405.05904) — Gekhman 외 (2024) — 이번 주 4번 논문의 선행 연구
Entropic Optimal Transport — GOAT의 수학적 프레임워크
BRIGHT benchmark · BEIR · BrowseComp · FrontierMath
Continual Learning (survey) — SFT 할루시네이션 논문의 도구 기원
Attention Sink (Streaming LLM) — Xiao 외 (2023)
Society of Mind · Active Inference — 지난 주 디지스트에서 다룬 인지 프레임워크

Related blog posts

이번 주 arxiv 논문 3편 디지스트 — 멀티에이전트 토론, MIA, 후설 현상학 — 이 시리즈의 직전 회차 (협력·영속성·구조)
arxiv.org — 프리프린트 서버