<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Retrieval on ICE-ICE-BEAR-BLOG</title><link>https://ice-ice-bear.github.io/ko/tags/retrieval/</link><description>Recent content in Retrieval on ICE-ICE-BEAR-BLOG</description><generator>Hugo -- gohugo.io</generator><language>ko</language><lastBuildDate>Sun, 10 May 2026 00:00:00 +0900</lastBuildDate><atom:link href="https://ice-ice-bear.github.io/ko/tags/retrieval/index.xml" rel="self" type="application/rss+xml"/><item><title>에이전트 메모리 아키텍처 두 갈래 — MemPalace의 구조화 인덱스 vs Hermes Agent의 스크래치패드 자기학습</title><link>https://ice-ice-bear.github.io/ko/posts/2026-05-10-agent-memory-architectures/</link><pubDate>Sun, 10 May 2026 00:00:00 +0900</pubDate><guid>https://ice-ice-bear.github.io/ko/posts/2026-05-10-agent-memory-architectures/</guid><description>&lt;img src="https://ice-ice-bear.github.io/" alt="Featured image of post 에이전트 메모리 아키텍처 두 갈래 — MemPalace의 구조화 인덱스 vs Hermes Agent의 스크래치패드 자기학습" /&gt;&lt;h2 id="개요"&gt;개요
&lt;/h2&gt;&lt;p&gt;2026-05-10 같은 시기에 회자된 두 리포 — &lt;a class="link" href="https://github.com/MemPalace/mempalace" target="_blank" rel="noopener"
 &gt;MemPalace/mempalace&lt;/a&gt;와 &lt;a class="link" href="https://github.com/NousResearch/hermes-agent" target="_blank" rel="noopener"
 &gt;NousResearch/hermes-agent&lt;/a&gt; — 가 에이전트 메모리의 서로 다른 두 프리미티브를 정면 충돌시킨다. 한쪽은 &lt;strong&gt;구조화된 인덱스&lt;/strong&gt;(wings/rooms/drawers + 시간 윈도가 있는 지식 그래프), 반대쪽은 &lt;strong&gt;emergent 스크래치패드 + 자기학습 스킬 + FTS5 회상&lt;/strong&gt;. &lt;a class="link" href="https://ice-ice-bear.github.io/ko/posts/2026-05-08-agent-os-layer-memory-skills/" target="_blank" rel="noopener"
 &gt;이전 글의 OS 레이어 논의&lt;/a&gt;에서 메모리/워크플로 슬롯이 어떻게 자리 잡는지 봤다면, 이번 글은 &lt;strong&gt;그 메모리 슬롯 내부에서 갈라지는 두 디자인 철학&lt;/strong&gt;을 본다.&lt;/p&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;graph TD
 Task["에이전트 태스크"] --&gt; Decision{"메모리 디자인 선택"}
 Decision --&gt; Structured["구조화 — MemPalace"]
 Decision --&gt; Emergent["Emergent — Hermes Agent"]

 Structured --&gt; Wings["wings / rooms / drawers &amp;lt;br/&amp;gt; verbatim 저장"]
 Structured --&gt; KG["temporal knowledge graph &amp;lt;br/&amp;gt; SQLite + validity window"]
 Structured --&gt; MCP29["29개 MCP 툴 &amp;lt;br/&amp;gt; 명시적 인덱스 호출"]

 Emergent --&gt; Scratch["대화 + 노트 스크래치패드"]
 Emergent --&gt; Skills["자기 생성 스킬 &amp;lt;br/&amp;gt; 사용 중 self-improve"]
 Emergent --&gt; FTS["FTS5 세션 검색 &amp;lt;br/&amp;gt; + LLM 요약"]

 Wings --&gt; Retrieve["검색 시 wing 스코프 한정"]
 Scratch --&gt; Recall["LLM이 도구로 회상 트리거"]&lt;/pre&gt;&lt;h2 id="1-mempalace--구조화된-인덱스의-끝을-본다"&gt;1. MemPalace — 구조화된 인덱스의 끝을 본다
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://github.com/MemPalace/mempalace" target="_blank" rel="noopener"
 &gt;MemPalace/mempalace&lt;/a&gt;는 &lt;em&gt;&amp;ldquo;The best-benchmarked open-source AI memory system&amp;rdquo;&lt;/em&gt; 을 표방하는 2026-04-05 생성 MIT 프로젝트로, &lt;a class="link" href="https://github.com/MemPalace/mempalace/commits/main" target="_blank" rel="noopener"
 &gt;2026-05-11 푸시 시점&lt;/a&gt; 51,879 stars. 핵심 베팅은 한 줄로 — &lt;strong&gt;원문을 압축·요약 없이 그대로 저장하고, 의미 검색은 사전 구조로 좁혀라.&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="자리-구조"&gt;자리 구조
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;wings&lt;/strong&gt; — 사람·프로젝트 단위. 검색 시 스코프를 한정한다.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;rooms&lt;/strong&gt; — 토픽 단위. wing 안에서 다시 좁힌다.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;drawers&lt;/strong&gt; — 원문 본문이 들어가는 가장 작은 단위. &lt;strong&gt;요약/추출/패러프레이즈 없음.&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;knowledge graph&lt;/strong&gt; — 로컬 &lt;a class="link" href="https://www.sqlite.org/" target="_blank" rel="noopener"
 &gt;SQLite&lt;/a&gt;에 entity·relationship + validity window. 시간이 흐르며 fact가 더 이상 유효하지 않게 되는 걸 명시적으로 마크 가능.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;agent diaries&lt;/strong&gt; — 스페셜리스트 에이전트마다 자기 wing 안의 일기. 런타임에 &lt;a class="link" href="https://mempalaceofficial.com/concepts/agents.html" target="_blank" rel="noopener"
 &gt;&lt;code&gt;mempalace_list_agents&lt;/code&gt;&lt;/a&gt;로 발견 가능 → 시스템 프롬프트가 부풀지 않는다.&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="벤치마크"&gt;벤치마크
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/abs/2410.10813" target="_blank" rel="noopener"
 &gt;LongMemEval&lt;/a&gt; 500 questions 기준:&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;모드&lt;/th&gt;
 &lt;th&gt;R@5&lt;/th&gt;
 &lt;th&gt;LLM 필요&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Raw 의미 검색 (휴리스틱·LLM 없음)&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;96.6%&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;없음&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Hybrid v4, 450q held-out&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;98.4%&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;없음&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Hybrid v4 + LLM rerank, 500q&lt;/td&gt;
 &lt;td&gt;≥99%&lt;/td&gt;
 &lt;td&gt;임의의 capable 모델&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;추가로 &lt;a class="link" href="https://arxiv.org/abs/2402.17753" target="_blank" rel="noopener"
 &gt;LoCoMo&lt;/a&gt; R@10 88.9% (hybrid v5, 1,986 questions), ConvoMem 250 items 평균 회상 92.9%, &lt;a class="link" href="https://aclanthology.org/2025.acl-long.0/" target="_blank" rel="noopener"
 &gt;MemBench&lt;/a&gt; (ACL 2025) 8,500 items R@5 80.3%. 같은 시기에 회자된 &lt;a class="link" href="https://github.com/rohitg00/agentmemory" target="_blank" rel="noopener"
 &gt;agentmemory&lt;/a&gt;가 보인 LongMemEval R@5 95.2%와 비교하면 raw 모드만으로 +1.4%p — &lt;strong&gt;임베딩 위 사전 구조화의 효과가 가장 크게 드러나는 영역이 retrieval recall&lt;/strong&gt;이라는 신호다.&lt;/p&gt;
&lt;h3 id="셋업"&gt;셋업
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;uv tool install mempalace
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;mempalace init ~/projects/myapp
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 마이닝&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;mempalace mine ~/projects/myapp &lt;span class="c1"&gt;# 프로젝트 파일&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;mempalace mine ~/.claude/projects/ --mode convos &lt;span class="c1"&gt;# Claude Code 세션&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 검색·로드&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;mempalace search &lt;span class="s2"&gt;&amp;#34;왜 GraphQL로 바꿨더라&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;mempalace wake-up
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;API 키 없음, 클라우드 호출 없음, ChromaDB 디폴트, &lt;a class="link" href="https://github.com/MemPalace/mempalace/blob/main/mempalace/backends/base.py" target="_blank" rel="noopener"
 &gt;&lt;code&gt;mempalace/backends/base.py&lt;/code&gt;&lt;/a&gt; 인터페이스를 따르는 다른 백엔드로 교체 가능. 29개 &lt;a class="link" href="https://modelcontextprotocol.io/" target="_blank" rel="noopener"
 &gt;MCP&lt;/a&gt; 툴이 palace 읽기·쓰기, 그래프 연산, cross-wing 네비게이션, drawer 관리, 에이전트 다이어리를 커버.&lt;/p&gt;
&lt;h3 id="의미"&gt;의미
&lt;/h3&gt;&lt;p&gt;MemPalace의 베팅은 &lt;strong&gt;&amp;ldquo;메모리 품질 = 인덱스 품질&amp;rdquo;&lt;/strong&gt; 이다. 압축·요약은 손실을 만든다 → verbatim 보존 + retrieval 시 wing/room으로 스코프를 좁히면 LLM이 길어진 쓰레기 컨텍스트를 헤집을 필요가 없다. &lt;a class="link" href="https://mempalaceofficial.com/concepts/knowledge-graph.html" target="_blank" rel="noopener"
 &gt;knowledge graph&lt;/a&gt;의 validity window는 &lt;strong&gt;시간 흐름에 따른 사실 변동&lt;/strong&gt;을 LLM의 추론에 떠넘기지 않고 인덱스 레이어에서 명시한다는 점에서 특히 큰 차이다.&lt;/p&gt;
&lt;h2 id="2-hermes-agent--emergent-스크래치패드의-끝을-본다"&gt;2. Hermes Agent — emergent 스크래치패드의 끝을 본다
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://github.com/NousResearch/hermes-agent" target="_blank" rel="noopener"
 &gt;NousResearch/hermes-agent&lt;/a&gt;는 &lt;em&gt;&amp;ldquo;The agent that grows with you&amp;rdquo;&lt;/em&gt; 를 표방하는 &lt;a class="link" href="https://nousresearch.com" target="_blank" rel="noopener"
 &gt;Nous Research&lt;/a&gt;의 MIT 프로젝트로, &lt;a class="link" href="https://github.com/NousResearch/hermes-agent" target="_blank" rel="noopener"
 &gt;2025-07-22 생성&lt;/a&gt;, 2026-05-11 시점 142,575 stars — 같은 메모리 비교군에서 가장 큰 모집단이다. 베팅은 정반대 — &lt;strong&gt;메모리는 별도 인덱스가 아니라 에이전트가 자기 운영 중에 만들어내는 emergent 산출물&lt;/strong&gt;이다.&lt;/p&gt;
&lt;h3 id="메모리를-구성하는-네-가지-흐름"&gt;메모리를 구성하는 네 가지 흐름
&lt;/h3&gt;&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;agent-curated memory + periodic nudges&lt;/strong&gt; — 에이전트가 스스로 &amp;ldquo;이건 기억할 가치가 있다&amp;quot;고 판단해 메모리에 적는다. 주기적 nudge가 persistence를 강제.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;자기 생성 스킬&lt;/strong&gt; — 복잡한 태스크 이후 &lt;a class="link" href="https://agentskills.io" target="_blank" rel="noopener"
 &gt;Skills Hub&lt;/a&gt;에 등록 가능한 스킬을 자율적으로 만든다. 사용 중 self-improve. &lt;a class="link" href="https://agentskills.io" target="_blank" rel="noopener"
 &gt;agentskills.io&lt;/a&gt; 오픈 표준 호환.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;FTS5 세션 검색 + LLM 요약&lt;/strong&gt; — 과거 대화를 &lt;a class="link" href="https://www.sqlite.org/fts5.html" target="_blank" rel="noopener"
 &gt;SQLite FTS5&lt;/a&gt;로 full-text 검색 후 LLM 요약으로 cross-session 회상.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;사용자 모델링&lt;/strong&gt; — &lt;a class="link" href="https://github.com/plastic-labs/honcho" target="_blank" rel="noopener"
 &gt;plastic-labs/honcho&lt;/a&gt; dialectic user modeling으로 &amp;ldquo;당신이 누구인지&amp;quot;의 모델을 세션을 가로질러 깊게 쌓는다.&lt;/li&gt;
&lt;/ol&gt;
&lt;h3 id="어디서-실행되는가"&gt;어디서 실행되는가
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://telegram.org/" target="_blank" rel="noopener"
 &gt;Telegram&lt;/a&gt; · &lt;a class="link" href="https://discord.com/" target="_blank" rel="noopener"
 &gt;Discord&lt;/a&gt; · &lt;a class="link" href="https://slack.com/" target="_blank" rel="noopener"
 &gt;Slack&lt;/a&gt; · &lt;a class="link" href="https://www.whatsapp.com/" target="_blank" rel="noopener"
 &gt;WhatsApp&lt;/a&gt; · &lt;a class="link" href="https://signal.org/" target="_blank" rel="noopener"
 &gt;Signal&lt;/a&gt; · Email · CLI — 게이트웨이 한 프로세스로 다 받는다. 일곱 개 터미널 백엔드 — 로컬, &lt;a class="link" href="https://www.docker.com/" target="_blank" rel="noopener"
 &gt;Docker&lt;/a&gt;, SSH, &lt;a class="link" href="https://sylabs.io/singularity/" target="_blank" rel="noopener"
 &gt;Singularity&lt;/a&gt;, &lt;a class="link" href="https://modal.com/" target="_blank" rel="noopener"
 &gt;Modal&lt;/a&gt;, &lt;a class="link" href="https://www.daytona.io/" target="_blank" rel="noopener"
 &gt;Daytona&lt;/a&gt;, &lt;a class="link" href="https://vercel.com/docs/vercel-sandbox" target="_blank" rel="noopener"
 &gt;Vercel Sandbox&lt;/a&gt; — 중 Daytona·Modal은 idle 시 hibernate, 깨어날 때만 비용. 노트북에 묶이지 않은 에이전트.&lt;/p&gt;
&lt;h3 id="모델-자유"&gt;모델 자유
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;hermes model&lt;/code&gt; 한 줄로 &lt;a class="link" href="https://portal.nousresearch.com" target="_blank" rel="noopener"
 &gt;Nous Portal&lt;/a&gt;, &lt;a class="link" href="https://openrouter.ai" target="_blank" rel="noopener"
 &gt;OpenRouter&lt;/a&gt;, &lt;a class="link" href="https://build.nvidia.com" target="_blank" rel="noopener"
 &gt;NVIDIA NIM&lt;/a&gt;, &lt;a class="link" href="https://platform.xiaomimimo.com" target="_blank" rel="noopener"
 &gt;Xiaomi MiMo&lt;/a&gt;, &lt;a class="link" href="https://z.ai" target="_blank" rel="noopener"
 &gt;z.ai/GLM&lt;/a&gt;, &lt;a class="link" href="https://platform.moonshot.ai" target="_blank" rel="noopener"
 &gt;Kimi/Moonshot&lt;/a&gt;, &lt;a class="link" href="https://www.minimax.io" target="_blank" rel="noopener"
 &gt;MiniMax&lt;/a&gt;, &lt;a class="link" href="https://huggingface.co" target="_blank" rel="noopener"
 &gt;Hugging Face&lt;/a&gt;, OpenAI, 자체 엔드포인트 사이 전환. 메모리는 모델과 분리된 emergent 산출물이므로 모델을 갈아치워도 그대로 따라간다.&lt;/p&gt;
&lt;h3 id="의미-1"&gt;의미
&lt;/h3&gt;&lt;p&gt;Hermes의 베팅은 &lt;strong&gt;&amp;ldquo;메모리는 호출되어야 한다 — LLM이 직접&amp;rdquo;&lt;/strong&gt; 이다. 사전 인덱스가 retrieval 정확도를 책임지는 게 아니라, LLM이 자기 turn 중에 &amp;ldquo;지금 과거의 무엇이 필요한가&amp;quot;를 결정해 &lt;a class="link" href="https://www.sqlite.org/fts5.html" target="_blank" rel="noopener"
 &gt;FTS5 검색&lt;/a&gt; 도구를 호출하고, 요약을 만들어 자기 컨텍스트에 끼워 넣는다. 스킬은 작성 시점 한 번이 아니라 &lt;strong&gt;사용하면서 스스로 고쳐 쓰는&lt;/strong&gt; 살아 있는 절차 메모리.&lt;/p&gt;
&lt;h2 id="3-정면-비교"&gt;3. 정면 비교
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;항목&lt;/th&gt;
 &lt;th&gt;MemPalace&lt;/th&gt;
 &lt;th&gt;Hermes Agent&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;만든 곳&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://github.com/MemPalace" target="_blank" rel="noopener"
 &gt;MemPalace&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://nousresearch.com" target="_blank" rel="noopener"
 &gt;Nous Research&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;라이선스&lt;/td&gt;
 &lt;td&gt;MIT&lt;/td&gt;
 &lt;td&gt;MIT&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;생성&lt;/td&gt;
 &lt;td&gt;2026-04-05&lt;/td&gt;
 &lt;td&gt;2025-07-22&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;5/11 stars&lt;/td&gt;
 &lt;td&gt;51,879&lt;/td&gt;
 &lt;td&gt;142,575&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;메모리 모델&lt;/td&gt;
 &lt;td&gt;구조화 인덱스 + 지식 그래프&lt;/td&gt;
 &lt;td&gt;스크래치패드 + emergent 스킬 + FTS&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;저장 방식&lt;/td&gt;
 &lt;td&gt;verbatim drawer&lt;/td&gt;
 &lt;td&gt;대화·노트·스킬, 필요 시 요약&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;시간 처리&lt;/td&gt;
 &lt;td&gt;그래프 validity window&lt;/td&gt;
 &lt;td&gt;LLM이 요약하며 재구성&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Retrieval 책임&lt;/td&gt;
 &lt;td&gt;인덱스 (R@5 96.6% raw)&lt;/td&gt;
 &lt;td&gt;LLM이 도구로 호출&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;모델 종속&lt;/td&gt;
 &lt;td&gt;모델 무관 (raw는 LLM 0회)&lt;/td&gt;
 &lt;td&gt;모델 무관 (10+ 프로바이더)&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;인터페이스&lt;/td&gt;
 &lt;td&gt;29개 MCP 툴 + CLI&lt;/td&gt;
 &lt;td&gt;TUI + 6개 메시징 게이트웨이&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;단일 실행 단위&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;mempalace search&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;hermes&lt;/code&gt; 세션&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="4-어떤-태스크에-어느-쪽이-스케일하는가"&gt;4. 어떤 태스크에 어느 쪽이 스케일하는가
&lt;/h2&gt;&lt;pre class="mermaid" style="visibility:hidden"&gt;flowchart LR
 A["태스크 특성"] --&gt; B{"retrieval recall이 최우선?"}
 B --&gt;|Yes| C["구조화 인덱스 &amp;lt;br/&amp;gt; MemPalace"]
 B --&gt;|No| D{"세션이 길고 다중 채널?"}
 D --&gt;|Yes| E["스크래치패드 + 자기학습 &amp;lt;br/&amp;gt; Hermes Agent"]
 D --&gt;|No| F["둘 다 과잉 — &amp;lt;br/&amp;gt; long context로 충분"]
 C --&gt; G["사실 정확도, 시간 변동, &amp;lt;br/&amp;gt; 다중 에이전트 공유"]
 E --&gt; H["페르소나 학습, 절차 메모리, &amp;lt;br/&amp;gt; 메시징 채널 연속성"]&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;사실 회상이 KPI인 곳&lt;/strong&gt; — 고객 히스토리, 코드베이스 결정 기록, &amp;ldquo;X를 언제 왜 바꿨더라&amp;rdquo; 같은 질문이 중요하면 &lt;strong&gt;MemPalace가 더 맞는다.&lt;/strong&gt; R@5 96.6%는 다른 누구도 raw 모드로 내지 못한 숫자다.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;운영이 길어지고 모달리티가 다양한 곳&lt;/strong&gt; — Telegram에서 시작해 Slack에서 이어지고 cron으로 매일 새벽 보고서를 받는 워크플로라면 &lt;strong&gt;Hermes의 메시징·스케줄·스킬 쪽이 더 맞는다.&lt;/strong&gt; 메모리 정확도는 적당히 양보하고 운영 연속성을 사는 트레이드.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;단일 세션 단발성 태스크&lt;/strong&gt; — 둘 다 과잉이다. Claude나 GPT의 현재 컨텍스트 윈도(수십만~100만 토큰)면 충분히 처리된다. 이게 핵심 — &lt;strong&gt;현재 컨텍스트 윈도가 1인 1세션 수준에서는 둘 다 필요 없다.&lt;/strong&gt; 매기는 가격은 &lt;em&gt;에이전트 팀 규모&lt;/em&gt;에서 나온다.&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="에이전트-팀-스케일에서-갈리는-지점"&gt;에이전트 팀 스케일에서 갈리는 지점
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;N명의 스페셜리스트가 같은 사실 풀을 공유해야 한다 → MemPalace의 wings + cross-wing 네비게이션이 직접 답이다.&lt;/li&gt;
&lt;li&gt;N개 채널을 가로질러 같은 페르소나가 유지돼야 한다 → Hermes의 &lt;a class="link" href="https://github.com/plastic-labs/honcho" target="_blank" rel="noopener"
 &gt;Honcho&lt;/a&gt; dialectic 모델링이 직접 답이다.&lt;/li&gt;
&lt;li&gt;N일 동안 자기 절차를 진화시켜야 한다 → Hermes의 self-improving 스킬이 직접 답이다.&lt;/li&gt;
&lt;li&gt;N년 동안 사실의 유효 기간이 바뀐다 → MemPalace의 temporal knowledge graph가 직접 답이다.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;현장 한 줄 평으로 정리하면, &lt;strong&gt;MemPalace는 &amp;ldquo;정확도 인프라&amp;quot;이고 Hermes는 &amp;ldquo;운영 인프라&amp;rdquo;&lt;/strong&gt; 다. 같은 메모리라는 단어를 쓰지만 책임 영역이 거의 겹치지 않는다.&lt;/p&gt;
&lt;h2 id="인사이트"&gt;인사이트
&lt;/h2&gt;&lt;p&gt;같은 시기 51K와 142K stars를 동시에 모은 두 프로젝트가 메모리라는 단어를 정반대 방향으로 정의했다는 점이 이 디지스트의 핵심이다. MemPalace는 &lt;strong&gt;메모리를 검색 가능한 사실 인덱스&lt;/strong&gt;로 보고, retrieval 정확도(96.6% raw R@5)와 시간 그래프(validity window)에 디자인 예산을 다 썼다. Hermes는 &lt;strong&gt;메모리를 LLM이 호출하는 운영 흐름&lt;/strong&gt;으로 보고, 스크래치패드·자기 진화 스킬·다중 채널 연속성에 같은 예산을 썼다. 둘 다 모델 종속을 의도적으로 끊은 것까지는 동일한 방향이지만, 메모리의 &amp;ldquo;어디까지가 인덱스이고 어디부터가 에이전트인가&amp;rdquo; 라는 경계선이 정반대다. &lt;a class="link" href="https://ice-ice-bear.github.io/ko/posts/2026-05-08-agent-os-layer-memory-skills/" target="_blank" rel="noopener"
 &gt;이전 글&lt;/a&gt;이 메모리/워크플로 두 슬롯이 OS 레이어로 모이는 풍경이었다면, 이번 흐름은 &lt;strong&gt;메모리 슬롯 안에서 다시 인덱스파와 스크래치패드파로 갈라지는 두 번째 분기&lt;/strong&gt;다. 현재 컨텍스트 윈도가 단일 세션을 거의 다 흡수해버리는 시점에서 보면 둘 중 누구도 시급해 보이지 않지만, 에이전트가 &lt;em&gt;팀&lt;/em&gt; 단위로 운영되기 시작하면 두 디자인 차이는 곧장 비용·정확도·운영 안정성으로 환산된다. 다음 분기 흥미로운 질문은 둘 — &lt;strong&gt;인덱스 진영이 emergent 스크래치패드를 인덱스에 흡수할지, 스크래치패드 진영이 명시적 그래프를 자기 도구로 끌어들일지&lt;/strong&gt; 다. 한쪽이 다른 쪽을 흡수하는 방향으로 수렴할 가능성이 더 높아 보인다.&lt;/p&gt;
&lt;h2 id="참고"&gt;참고
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;핵심 리포지토리&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/MemPalace/mempalace" target="_blank" rel="noopener"
 &gt;MemPalace/mempalace&lt;/a&gt; · 공식 사이트 &lt;a class="link" href="https://mempalaceofficial.com" target="_blank" rel="noopener"
 &gt;mempalaceofficial.com&lt;/a&gt; · &lt;a class="link" href="https://mempalaceofficial.com/concepts/the-palace.html" target="_blank" rel="noopener"
 &gt;palace concepts&lt;/a&gt; · &lt;a class="link" href="https://mempalaceofficial.com/concepts/knowledge-graph.html" target="_blank" rel="noopener"
 &gt;knowledge graph&lt;/a&gt; · &lt;a class="link" href="https://mempalaceofficial.com/reference/mcp-tools.html" target="_blank" rel="noopener"
 &gt;MCP 툴 레퍼런스&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/NousResearch/hermes-agent" target="_blank" rel="noopener"
 &gt;NousResearch/hermes-agent&lt;/a&gt; · 문서 &lt;a class="link" href="https://hermes-agent.nousresearch.com/docs/" target="_blank" rel="noopener"
 &gt;hermes-agent.nousresearch.com/docs&lt;/a&gt; · &lt;a class="link" href="https://hermes-agent.nousresearch.com/docs/user-guide/features/memory" target="_blank" rel="noopener"
 &gt;메모리 가이드&lt;/a&gt; · &lt;a class="link" href="https://hermes-agent.nousresearch.com/docs/user-guide/features/skills" target="_blank" rel="noopener"
 &gt;스킬 시스템&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;관련 메모리 도구 / 비교군&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/rohitg00/agentmemory" target="_blank" rel="noopener"
 &gt;rohitg00/agentmemory&lt;/a&gt; — 같은 LongMemEval 평가군의 직전 디자인&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/plastic-labs/honcho" target="_blank" rel="noopener"
 &gt;plastic-labs/honcho&lt;/a&gt; — Hermes가 쓰는 dialectic 사용자 모델링&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://agentskills.io" target="_blank" rel="noopener"
 &gt;agentskills.io&lt;/a&gt; — Hermes·OpenClaw가 공통으로 따르는 오픈 스킬 표준&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;프로토콜·런타임&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://modelcontextprotocol.io/" target="_blank" rel="noopener"
 &gt;Model Context Protocol (MCP)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://www.sqlite.org/fts5.html" target="_blank" rel="noopener"
 &gt;SQLite FTS5&lt;/a&gt; — Hermes의 세션 검색 백엔드&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://www.trychroma.com/" target="_blank" rel="noopener"
 &gt;ChromaDB&lt;/a&gt; — MemPalace 디폴트 벡터 백엔드&lt;/li&gt;
&lt;li&gt;런타임: &lt;a class="link" href="https://modal.com/" target="_blank" rel="noopener"
 &gt;Modal&lt;/a&gt; · &lt;a class="link" href="https://www.daytona.io/" target="_blank" rel="noopener"
 &gt;Daytona&lt;/a&gt; · &lt;a class="link" href="https://vercel.com/docs/vercel-sandbox" target="_blank" rel="noopener"
 &gt;Vercel Sandbox&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;벤치마크·논문&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2410.10813" target="_blank" rel="noopener"
 &gt;LongMemEval (arXiv:2410.10813, ICLR 2025)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2402.17753" target="_blank" rel="noopener"
 &gt;LoCoMo (arXiv:2402.17753)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://aclanthology.org/2025.acl-long.0/" target="_blank" rel="noopener"
 &gt;MemBench (ACL 2025)&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>이번 주 arxiv 논문 5편 디지스트 — 인터페이스와 prior를 다시 보는 한 주</title><link>https://ice-ice-bear.github.io/ko/posts/2026-05-09-arxiv-papers-week-digest/</link><pubDate>Sat, 09 May 2026 00:00:00 +0900</pubDate><guid>https://ice-ice-bear.github.io/ko/posts/2026-05-09-arxiv-papers-week-digest/</guid><description>&lt;img src="https://ice-ice-bear.github.io/" alt="Featured image of post 이번 주 arxiv 논문 5편 디지스트 — 인터페이스와 prior를 다시 보는 한 주" /&gt;&lt;h2 id="개요"&gt;개요
&lt;/h2&gt;&lt;p&gt;지난 며칠 사이 &lt;a class="link" href="https://arxiv.org/" target="_blank" rel="noopener"
 &gt;arxiv&lt;/a&gt;에서 눈에 들어온 논문 5편. 분야는 &lt;a class="link" href="https://en.wikipedia.org/wiki/Information_retrieval" target="_blank" rel="noopener"
 &gt;정보 검색&lt;/a&gt;, 수학 보조 에이전트, &lt;a class="link" href="https://en.wikipedia.org/wiki/Attention_%28machine_learning%29" target="_blank" rel="noopener"
 &gt;attention&lt;/a&gt; 구조, &lt;a class="link" href="https://en.wikipedia.org/wiki/Fine-tuning_%28deep_learning%29" target="_blank" rel="noopener"
 &gt;SFT&lt;/a&gt;로 인한 &lt;a class="link" href="https://en.wikipedia.org/wiki/Hallucination_%28artificial_intelligence%29" target="_blank" rel="noopener"
 &gt;할루시네이션&lt;/a&gt;, &lt;a class="link" href="https://en.wikipedia.org/wiki/Feature_learning" target="_blank" rel="noopener"
 &gt;표현 학습&lt;/a&gt; 이론으로 다 다른데, 묶어 읽으면 한 가지 의문이 반복된다 — &lt;strong&gt;&amp;ldquo;우리가 당연하게 받아들이던 인터페이스와 prior가, 사실 모델의 진짜 능력을 가로막고 있는 건 아닌가?&amp;rdquo;&lt;/strong&gt; &lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;지난 디지스트&lt;/a&gt;가 협력·영속성·구조라는 세 축으로 추론 향상의 출처를 봤다면, 이번 주는 그 한 단계 아래 — &lt;strong&gt;이미 깔린 추상화 계층을 다시 의심하는 흐름&lt;/strong&gt;이다.&lt;/p&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;graph TD
 Theme["이번 주의 한 줄: &amp;lt;br/&amp;gt; 깔린 인터페이스/prior를 다시 의심한다"]
 Theme --&gt; Retrieval["검색 인터페이스 &amp;lt;br/&amp;gt; (top-k similarity)"]
 Theme --&gt; Workflow["수학 워크플로우 &amp;lt;br/&amp;gt; (단발 응답)"]
 Theme --&gt; Arch["Attention prior &amp;lt;br/&amp;gt; (uniform 가정)"]
 Theme --&gt; Training["SFT 목적함수 &amp;lt;br/&amp;gt; (사실성과 충돌)"]
 Theme --&gt; Repr["표현 유사도 metric &amp;lt;br/&amp;gt; (스케일에 오염)"]

 Retrieval --&gt; P1["DCI (2605.05242)"]
 Workflow --&gt; P2["AI Co-Mathematician (2605.06651)"]
 Arch --&gt; P3["GOAT (2601.15380)"]
 Training --&gt; P4["Self-distillation SFT (2604.15574)"]
 Repr --&gt; P5["Aristotelian Repr. (2602.14486)"]&lt;/pre&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;#&lt;/th&gt;
 &lt;th&gt;논문&lt;/th&gt;
 &lt;th&gt;분야&lt;/th&gt;
 &lt;th&gt;한 줄 요약&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.05242" target="_blank" rel="noopener"
 &gt;Direct Corpus Interaction (2605.05242)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.IR&lt;/td&gt;
 &lt;td&gt;임베딩 없이 &lt;code&gt;grep&lt;/code&gt;·셸 도구로 corpus를 직접 뒤지는 에이전트가 강한 retriever를 이긴다&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;2&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.06651" target="_blank" rel="noopener"
 &gt;AI Co-Mathematician (2605.06651)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.AI&lt;/td&gt;
 &lt;td&gt;수학자용 비동기·상태 보존 워크벤치, &lt;a class="link" href="https://epoch.ai/frontiermath" target="_blank" rel="noopener"
 &gt;FrontierMath Tier 4&lt;/a&gt; 48%&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;3&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2601.15380" target="_blank" rel="noopener"
 &gt;GOAT — You Need Better Attention Priors (2601.15380)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.LG&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://optimaltransport.github.io/" target="_blank" rel="noopener"
 &gt;Entropic Optimal Transport&lt;/a&gt; 관점에서 attention prior를 학습 가능하게&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;4&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2604.15574" target="_blank" rel="noopener"
 &gt;Why Fine-Tuning Encourages Hallucinations (2604.15574)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.CL&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Fine-tuning_%28deep_learning%29" target="_blank" rel="noopener"
 &gt;SFT&lt;/a&gt;가 만드는 할루시네이션을 &lt;a class="link" href="https://en.wikipedia.org/wiki/Knowledge_distillation" target="_blank" rel="noopener"
 &gt;self-distillation&lt;/a&gt;으로 줄인다&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;5&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2602.14486" target="_blank" rel="noopener"
 &gt;Aristotelian Representation Hypothesis (2602.14486)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.LG&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;Platonic Representation&lt;/a&gt; 수렴은 metric 결함; 진짜 수렴은 local neighborhood&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="1-direct-corpus-interaction--260505242"&gt;1. Direct Corpus Interaction — 2605.05242
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/li_z_1" target="_blank" rel="noopener"
 &gt;Zhuofeng Li&lt;/a&gt;, Haoxiang Zhang, &lt;a class="link" href="https://lupantech.github.io/" target="_blank" rel="noopener"
 &gt;Pan Lu&lt;/a&gt;, &lt;a class="link" href="https://bunsenfeng.github.io/" target="_blank" rel="noopener"
 &gt;Shangbin Feng&lt;/a&gt;, &lt;a class="link" href="https://maszhongming.github.io/" target="_blank" rel="noopener"
 &gt;Ming Zhong&lt;/a&gt;, &lt;a class="link" href="https://homes.cs.washington.edu/~yejin/" target="_blank" rel="noopener"
 &gt;Yejin Choi&lt;/a&gt;, &lt;a class="link" href="https://www.james-zou.com/" target="_blank" rel="noopener"
 &gt;James Zou&lt;/a&gt;, &lt;a class="link" href="https://hanj.cs.illinois.edu/" target="_blank" rel="noopener"
 &gt;Jiawei Han&lt;/a&gt;, &lt;a class="link" href="https://wenhuchen.github.io/" target="_blank" rel="noopener"
 &gt;Wenhu Chen&lt;/a&gt;, &lt;a class="link" href="https://cs.uwaterloo.ca/~jimmylin/" target="_blank" rel="noopener"
 &gt;Jimmy Lin&lt;/a&gt; 외 (2026-05-03, &lt;a class="link" href="https://arxiv.org/list/cs.IR/new" target="_blank" rel="noopener"
 &gt;cs.IR&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심"&gt;핵심
&lt;/h3&gt;&lt;p&gt;현대 &lt;a class="link" href="https://en.wikipedia.org/wiki/Information_retrieval" target="_blank" rel="noopener"
 &gt;retrieval&lt;/a&gt; 시스템은 lexical이든 semantic이든 corpus를 &lt;strong&gt;고정된 similarity 인터페이스로 압축한다&lt;/strong&gt;. top-k라는 단발 step 이후에야 추론이 시작되는 구조. 에이전트가 강해질수록 이 압축이 병목이 된다. 정확한 lexical 제약, 희박한 단서들의 결합, local context 체크, 다단계 가설 수정 — 모두 기존 retriever 호출로는 표현하기 어렵다. 한 번 걸러 나간 증거는 더 강한 downstream 추론으로도 되돌릴 수 없다.&lt;/p&gt;
&lt;p&gt;저자들의 제안은 &lt;strong&gt;Direct Corpus Interaction (DCI)&lt;/strong&gt; — 임베딩 모델도, &lt;a class="link" href="https://en.wikipedia.org/wiki/Vector_database" target="_blank" rel="noopener"
 &gt;vector index&lt;/a&gt;도, retrieval API도 없이, 에이전트가 &lt;a class="link" href="https://en.wikipedia.org/wiki/Grep" target="_blank" rel="noopener"
 &gt;grep&lt;/a&gt;·파일 읽기·셸 명령·경량 스크립트 같은 범용 터미널 도구로 raw corpus를 직접 뒤지게 한다.&lt;/p&gt;
&lt;h3 id="contribution"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;오프라인 인덱싱 불필요, 진화하는 local corpus에 자연스럽게 적응&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://brightbenchmark.github.io/" target="_blank" rel="noopener"
 &gt;BRIGHT&lt;/a&gt;·&lt;a class="link" href="https://github.com/beir-cellar/beir" target="_blank" rel="noopener"
 &gt;BEIR&lt;/a&gt; 여러 데이터셋에서 sparse·dense·reranking 강 baseline 모두 능가&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://browsecomp.github.io/" target="_blank" rel="noopener"
 &gt;BrowseComp-Plus&lt;/a&gt;·multi-hop QA에서 기존 semantic retriever 없이도 강한 정확도&lt;/li&gt;
&lt;li&gt;결론: 에이전트가 강해질수록 retrieval 품질은 추론력만이 아니라 &lt;strong&gt;모델이 corpus와 상호작용하는 인터페이스의 해상도&lt;/strong&gt;에 의존한다&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;이건 그냥 &amp;ldquo;RAG보다 더 잘하는 방법&amp;quot;이 아니다. &lt;strong&gt;검색 = top-k similarity&lt;/strong&gt; 라는 &lt;a class="link" href="https://en.wikipedia.org/wiki/Dense_passage_retrieval" target="_blank" rel="noopener"
 &gt;지난 10년의 디폴트&lt;/a&gt;를 의심하는 논문이다. &lt;a class="link" href="https://www.anthropic.com/claude-code" target="_blank" rel="noopener"
 &gt;Claude Code&lt;/a&gt;가 &lt;code&gt;grep&lt;/code&gt;·&lt;code&gt;find&lt;/code&gt;로 코드베이스를 뒤지는 방식이 사실은 일반화 가능한 인터페이스라는 얘기이기도 하다. 검색 인덱스 산업이 가정해 온 추상화 계층 자체가 다음 라운드에선 옵션 중 하나로 격하될 수 있다.&lt;/p&gt;
&lt;h2 id="2-ai-co-mathematician--260506651"&gt;2. AI Co-Mathematician — 2605.06651
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/zheng_d_3" target="_blank" rel="noopener"
 &gt;Daniel Zheng&lt;/a&gt;, &lt;a class="link" href="https://research.google/people/ingrid-von-glehn/" target="_blank" rel="noopener"
 &gt;Ingrid von Glehn&lt;/a&gt;, Yori Zwols, Lars Buesing, &lt;a class="link" href="http://danroy.org/" target="_blank" rel="noopener"
 &gt;Daniel M. Roy&lt;/a&gt;, &lt;a class="link" href="https://www.bewitched.com/" target="_blank" rel="noopener"
 &gt;Martin Wattenberg&lt;/a&gt;, &lt;a class="link" href="https://www.fernandaviegas.com/" target="_blank" rel="noopener"
 &gt;Fernanda Viégas&lt;/a&gt;, &lt;a class="link" href="https://research.google/people/alex-davies/" target="_blank" rel="noopener"
 &gt;Alex Davies&lt;/a&gt;, &lt;a class="link" href="https://research.google/people/PushmeetKohli/" target="_blank" rel="noopener"
 &gt;Pushmeet Kohli&lt;/a&gt; 외 (&lt;a class="link" href="https://deepmind.google/" target="_blank" rel="noopener"
 &gt;Google DeepMind&lt;/a&gt;, 2026-05-07, &lt;a class="link" href="https://arxiv.org/list/cs.AI/new" target="_blank" rel="noopener"
 &gt;cs.AI&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-1"&gt;핵심
&lt;/h3&gt;&lt;p&gt;수학자가 &lt;a class="link" href="https://en.wikipedia.org/wiki/Intelligent_agent" target="_blank" rel="noopener"
 &gt;AI 에이전트&lt;/a&gt;와 &lt;strong&gt;상호작용적으로 열린 연구를 수행&lt;/strong&gt;하는 워크벤치. 핵심 디자인 결정은 단발 응답이 아니라 **비동기·상태 보존 워크스페이스(asynchronous, stateful workspace)**라는 점.&lt;/p&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;flowchart LR
 User["수학자"] --&gt;|"의도 (자주 흐림)"| WS["Stateful Workspace"]
 WS --&gt; Idea["ideation"]
 WS --&gt; Lit["literature search"]
 WS --&gt; Comp["computational exploration"]
 WS --&gt; Proof["theorem proving"]
 WS --&gt; Theory["theory building"]
 WS -.-&gt;|"실패 가설 추적"| WS
 WS --&gt;|"native math artifact"| User&lt;/pre&gt;&lt;h3 id="contribution-1"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;불확실성 관리, 사용자 의도 정제, 실패한 가설 추적, native 수학 산출물 출력 — 이 네 가지를 한 시스템에 묶음&lt;/li&gt;
&lt;li&gt;초기 테스트에서 연구자들이 &lt;strong&gt;미해결 문제 해결&lt;/strong&gt;, 새로운 연구 방향 식별, 간과된 &lt;a class="link" href="https://en.wikipedia.org/wiki/Literature_review" target="_blank" rel="noopener"
 &gt;literature&lt;/a&gt; 참조 발견&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://epoch.ai/frontiermath" target="_blank" rel="noopener"
 &gt;FrontierMath&lt;/a&gt; Tier 4에서 &lt;strong&gt;48%&lt;/strong&gt; — 평가된 모든 AI 시스템 중 최고점&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-1"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;이건 &lt;a class="link" href="https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/" target="_blank" rel="noopener"
 &gt;AlphaProof&lt;/a&gt; 류의 자동 정리 증명과 결이 다르다. &lt;strong&gt;수학자를 대체하는 시스템이 아니라, 수학자의 사고 흐름 — 흐릿한 의도 → 탐색 → 막다른 길 → 재시도 — 을 그대로 인터페이스화한 시스템&lt;/strong&gt;이다. &lt;a class="link" href="https://www.anthropic.com/news/skills" target="_blank" rel="noopener"
 &gt;Claude Skills&lt;/a&gt; 같은 비동기 워크플로우 인프라가 일반 도메인에서 시도하는 것을, 수학이라는 verifiable 영역에서 먼저 검증한 셈. 다음 라운드 &amp;ldquo;에이전트 워크벤치&amp;quot;의 reference design이 될 수 있다.&lt;/p&gt;
&lt;h2 id="3-goat--you-need-better-attention-priors--260115380"&gt;3. GOAT — You Need Better Attention Priors — 2601.15380
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/litman_e_1" target="_blank" rel="noopener"
 &gt;Elon Litman&lt;/a&gt;, &lt;a class="link" href="https://gabe-guo.github.io/" target="_blank" rel="noopener"
 &gt;Gabe Guo&lt;/a&gt; (2026-01-21, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-2"&gt;핵심
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Attention_%28machine_learning%29" target="_blank" rel="noopener"
 &gt;Attention&lt;/a&gt;을 &lt;a class="link" href="https://optimaltransport.github.io/" target="_blank" rel="noopener"
 &gt;Entropic Optimal Transport&lt;/a&gt; 렌즈로 보면, 표준 &lt;a class="link" href="https://en.wikipedia.org/wiki/Softmax_function" target="_blank" rel="noopener"
 &gt;softmax attention&lt;/a&gt;은 &lt;strong&gt;암묵적 uniform prior로 정규화된 transport 문제&lt;/strong&gt;다. 저자들은 이 &amp;ldquo;naive assumption&amp;quot;을 &lt;strong&gt;학습 가능한 연속 prior&lt;/strong&gt;로 대체하는 **GOAT (Generalized Optimal transport Attention with Trainable priors)**를 제안한다.&lt;/p&gt;
&lt;h3 id="contribution-2"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/Dao-AILab/flash-attention" target="_blank" rel="noopener"
 &gt;FlashAttention&lt;/a&gt; 같은 최적화 커널과 &lt;strong&gt;완전 호환&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2309.17453" target="_blank" rel="noopener"
 &gt;attention sink&lt;/a&gt; 현상의 EOT 기반 설명 및 해소 — 표준 attention의 representational trade-off 회피&lt;/li&gt;
&lt;li&gt;공간 정보를 core attention 계산에 흡수, &lt;strong&gt;extrapolatable prior&lt;/strong&gt; 학습 — 학습된 &lt;a class="link" href="https://en.wikipedia.org/wiki/Transformer_%28deep_learning_architecture%29#Positional_encoding" target="_blank" rel="noopener"
 &gt;positional embedding&lt;/a&gt;의 유연성 + 고정 encoding의 length generalization&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-2"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/abs/1706.03762" target="_blank" rel="noopener"
 &gt;2017년 Transformer&lt;/a&gt; 이후 attention의 prior가 uniform이라는 사실은 거의 한 번도 의심받지 않았다. GOAT는 attention sink 같은 &lt;strong&gt;현장 엔지니어들이 patch로 메우던 현상&lt;/strong&gt;이 사실 prior 설계 문제였음을 보여준다. &lt;a class="link" href="https://arxiv.org/abs/2312.00752" target="_blank" rel="noopener"
 &gt;Mamba&lt;/a&gt;·&lt;a class="link" href="https://arxiv.org/abs/2305.13048" target="_blank" rel="noopener"
 &gt;RWKV&lt;/a&gt; 같은 &lt;a class="link" href="https://en.wikipedia.org/wiki/Mamba_%28deep_learning_architecture%29" target="_blank" rel="noopener"
 &gt;non-attention 아키텍처&lt;/a&gt;가 등장한 시점에 attention을 더 일반화하는 방향이 어디까지 가능한가에 대한 흥미로운 답.&lt;/p&gt;
&lt;h2 id="4-why-fine-tuning-encourages-hallucinations--260415574"&gt;4. Why Fine-Tuning Encourages Hallucinations — 2604.15574
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/kaplan_g_1" target="_blank" rel="noopener"
 &gt;Guy Kaplan&lt;/a&gt;, &lt;a class="link" href="https://zorikg.github.io/" target="_blank" rel="noopener"
 &gt;Zorik Gekhman&lt;/a&gt;, Zhen Zhu, Lotem Rozner, Yuval Reif, &lt;a class="link" href="https://swabhs.com/" target="_blank" rel="noopener"
 &gt;Swabha Swayamdipta&lt;/a&gt;, &lt;a class="link" href="https://dhoiem.cs.illinois.edu/" target="_blank" rel="noopener"
 &gt;Derek Hoiem&lt;/a&gt;, &lt;a class="link" href="https://schwartz-lab-huji.github.io/" target="_blank" rel="noopener"
 &gt;Roy Schwartz&lt;/a&gt; (2026-04-16, &lt;a class="link" href="https://arxiv.org/list/cs.CL/new" target="_blank" rel="noopener"
 &gt;cs.CL&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-3"&gt;핵심
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Large_language_model" target="_blank" rel="noopener"
 &gt;LLM&lt;/a&gt;이 &lt;a class="link" href="https://en.wikipedia.org/wiki/Hallucination_%28artificial_intelligence%29" target="_blank" rel="noopener"
 &gt;할루시네이션&lt;/a&gt;을 일으키는 주요 원인 중 하나는 &lt;strong&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Fine-tuning_%28deep_learning%29" target="_blank" rel="noopener"
 &gt;supervised fine-tuning&lt;/a&gt;(SFT) 동안 새로운 사실 정보에 노출되는 것&lt;/strong&gt;. 사전학습으로 획득한 지식 대비 할루시네이션이 늘어난다. 저자들은 이걸 &lt;strong&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Continual_learning" target="_blank" rel="noopener"
 &gt;continual learning&lt;/a&gt; 문헌의 지식 열화(knowledge degradation) 문제&lt;/strong&gt;로 재정의하고, 그 도구로 해결한다.&lt;/p&gt;
&lt;h3 id="contribution-3"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;self-distillation 기반 SFT 방법&lt;/strong&gt; 제안 — 출력 분포 drift를 정규화하여 효과적 사실 학습과 할루시네이션 최소화 동시 달성&lt;/li&gt;
&lt;li&gt;새 지식 습득이 불필요한 상황: parameter group을 &lt;strong&gt;freeze&lt;/strong&gt;하여 사실적 plasticity를 억제, task 성능 유지하면서 할루시네이션 감소&lt;/li&gt;
&lt;li&gt;SFT 유발 할루시네이션의 메커니즘을 3가지 가설로 조사: capacity 한계, &lt;a class="link" href="https://en.wikipedia.org/wiki/Imitation_learning#Behavioral_cloning" target="_blank" rel="noopener"
 &gt;behavior cloning&lt;/a&gt;, localized interference&lt;/li&gt;
&lt;li&gt;주된 원인: &lt;strong&gt;겹치는 의미적 표현 간 간섭 (interference among overlapping semantic representations)&lt;/strong&gt;. self-distillation이 이 간섭을 완화함으로써 성공&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-3"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;&amp;ldquo;SFT가 할루시네이션을 만든다&amp;quot;는 관찰은 &lt;a class="link" href="https://arxiv.org/abs/2405.05904" target="_blank" rel="noopener"
 &gt;Gekhman 외 2024&lt;/a&gt;에서도 나왔다. 이번 논문은 그 &lt;strong&gt;메커니즘을 표현 간섭으로 특정하고 self-distillation으로 푼다&lt;/strong&gt;는 점에서 한 단계 나간다. &lt;a class="link" href="https://en.wikipedia.org/wiki/Reinforcement_learning_from_human_feedback" target="_blank" rel="noopener"
 &gt;RLHF&lt;/a&gt; 이전 단계인 SFT 그 자체가 안전·사실성의 결함 지점이라는 통찰은 &lt;a class="link" href="https://en.wikipedia.org/wiki/AI_alignment" target="_blank" rel="noopener"
 &gt;alignment&lt;/a&gt; 파이프라인 전체 재설계를 시사한다. instruction tuning을 무지성으로 돌리던 시기는 끝.&lt;/p&gt;
&lt;h2 id="5-aristotelian-representation-hypothesis--260214486"&gt;5. Aristotelian Representation Hypothesis — 2602.14486
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://fabian-groeger.com/" target="_blank" rel="noopener"
 &gt;Fabian Gröger&lt;/a&gt;, Shuo Wen, &lt;a class="link" href="https://people.epfl.ch/maria.brbic" target="_blank" rel="noopener"
 &gt;Maria Brbić&lt;/a&gt; (&lt;a class="link" href="https://www.epfl.ch/" target="_blank" rel="noopener"
 &gt;EPFL&lt;/a&gt;, 2026-02-16, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-4"&gt;핵심
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;Platonic Representation Hypothesis&lt;/a&gt; (Huh, Cheung, Wang, &lt;a class="link" href="http://web.mit.edu/phillipi/" target="_blank" rel="noopener"
 &gt;Isola&lt;/a&gt;, 2024)는 &lt;strong&gt;신경망 표현이 현실의 공통 통계 모델로 수렴 중&lt;/strong&gt;이라는 주장. 이 논문은 그 주장의 측정 도구 자체를 의심한다.&lt;/p&gt;
&lt;h3 id="contribution-4"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;기존 representational similarity metric이 &lt;strong&gt;network scale에 confound&lt;/strong&gt; — 모델 depth/width 증가만으로 유사도 점수가 체계적으로 부풀려짐&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;permutation 기반 null-calibration 프레임워크&lt;/strong&gt; — 어떤 representational similarity metric이든 통계적 보장이 있는 calibrated score로 변환&lt;/li&gt;
&lt;li&gt;보정 후 결과: 전역 &lt;a class="link" href="https://en.wikipedia.org/wiki/Spectral_theory" target="_blank" rel="noopener"
 &gt;spectral measure&lt;/a&gt;가 보고한 수렴은 &lt;strong&gt;대부분 사라진다&lt;/strong&gt;. 하지만 &lt;strong&gt;local neighborhood similarity&lt;/strong&gt; (단, local distance가 아님)는 modality를 가로질러 유의미한 일치 유지&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Aristotelian Representation Hypothesis&lt;/strong&gt; 제안: 신경망 표현은 &lt;strong&gt;공유된 local neighborhood 관계&lt;/strong&gt;로 수렴한다 — 거리(Platonic 절대 형상)가 아니라 이웃 구조(Aristotelian 관계 카테고리)&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-4"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;이건 메타 논문이다. &lt;strong&gt;결과가 아니라 측정의 결함을 지적한다.&lt;/strong&gt; &lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;Platonic Representation&lt;/a&gt; 가설은 2024년 이후 &lt;a class="link" href="https://en.wikipedia.org/wiki/Multimodal_learning" target="_blank" rel="noopener"
 &gt;멀티모달 정렬&lt;/a&gt;의 이론적 근거로 자주 인용됐다. 이 calibration framework가 표준으로 자리잡으면, 지난 2년간의 &amp;ldquo;표현 수렴&amp;rdquo; 주장들은 다시 검사받아야 한다. 그리고 새로 남는 결론 — local neighborhood만 수렴한다 — 은 &lt;a class="link" href="https://en.wikipedia.org/wiki/Self-supervised_learning#Contrastive_self-supervised_learning" target="_blank" rel="noopener"
 &gt;contrastive learning&lt;/a&gt; 류 &lt;a class="link" href="https://en.wikipedia.org/wiki/Word_embedding" target="_blank" rel="noopener"
 &gt;embedding&lt;/a&gt; 학습이 왜 잘 작동하는지에 대한 더 깔끔한 설명이기도 하다.&lt;/p&gt;
&lt;h2 id="묶어서-본-흐름"&gt;묶어서 본 흐름
&lt;/h2&gt;&lt;p&gt;다섯 논문이 향하는 곳: &lt;strong&gt;이미 깔린 추상화 계층을 다시 의심한다.&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;의심받는 계층&lt;/th&gt;
 &lt;th&gt;무엇을 가정했나&lt;/th&gt;
 &lt;th&gt;무엇이 더 나은가&lt;/th&gt;
 &lt;th&gt;논문&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;검색 인터페이스&lt;/td&gt;
 &lt;td&gt;top-k similarity가 충분&lt;/td&gt;
 &lt;td&gt;에이전트가 raw corpus 직접 탐색&lt;/td&gt;
 &lt;td&gt;DCI&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;수학 워크플로우&lt;/td&gt;
 &lt;td&gt;단발 질의응답&lt;/td&gt;
 &lt;td&gt;비동기·상태 보존 워크벤치&lt;/td&gt;
 &lt;td&gt;AI Co-Mathematician&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Attention prior&lt;/td&gt;
 &lt;td&gt;uniform 분포&lt;/td&gt;
 &lt;td&gt;학습 가능한 prior + EOT&lt;/td&gt;
 &lt;td&gt;GOAT&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;SFT 목적함수&lt;/td&gt;
 &lt;td&gt;새 지식 = 좋은 것&lt;/td&gt;
 &lt;td&gt;self-distillation으로 간섭 완화&lt;/td&gt;
 &lt;td&gt;Why FT Hallucinates&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;표현 유사도 metric&lt;/td&gt;
 &lt;td&gt;spectral이 충분&lt;/td&gt;
 &lt;td&gt;scale에 robust한 calibration&lt;/td&gt;
 &lt;td&gt;Aristotelian&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;quadrantChart
 title 이번 주 5편 — 추상화 계층 × 영향 범위
 x-axis "낮은 계층 (구조/이론)" --&gt; "높은 계층 (워크플로우)"
 y-axis "좁은 영향" --&gt; "넓은 영향"
 quadrant-1 "재설계 후보 (높은 계층 + 넓은 영향)"
 quadrant-2 "기반 재교정 (낮은 계층 + 넓은 영향)"
 quadrant-3 "특수 케이스"
 quadrant-4 "도구 단계"
 "DCI (retrieval)": [0.55, 0.85]
 "AI Co-Math": [0.85, 0.6]
 "GOAT (attention)": [0.15, 0.75]
 "SFT halluc.": [0.5, 0.7]
 "Aristotelian": [0.25, 0.55]&lt;/pre&gt;&lt;p&gt;&lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;지난 디지스트&lt;/a&gt;는 &amp;ldquo;추론 향상은 어디서 오는가&amp;quot;를 협력·영속성·구조로 풀었다. 이번 주는 한 층 더 들어간다 — &lt;strong&gt;그 추론을 받쳐주는 인터페이스/prior가 옳게 깔려 있는가&lt;/strong&gt;라는 질문이다. 둘은 충돌하지 않는다. 오히려 같은 흐름의 다음 단계로 보인다: 모델 크기를 키우는 라운드는 끝났고, 다음 라운드의 차별화는 &lt;strong&gt;에이전트 협력 토폴로지(지난 주) + 추상화 계층 재교정(이번 주)&lt;/strong&gt; 에서 나온다.&lt;/p&gt;
&lt;h2 id="인사이트"&gt;인사이트
&lt;/h2&gt;&lt;p&gt;이번 주 다섯 편을 묶으면 한 가지 공통 자세가 드러난다 — &lt;strong&gt;&amp;ldquo;당연하다고 받아들이던 디폴트를 한 번만 더 의심해 보자.&amp;rdquo;&lt;/strong&gt; DCI는 검색 = top-k라는 디폴트를, AI Co-Mathematician은 응답 = 단발 텍스트라는 디폴트를, GOAT는 attention prior = uniform이라는 디폴트를, SFT 할루시네이션 논문은 SFT가 &lt;a class="link" href="https://en.wikipedia.org/wiki/Knowledge_injection" target="_blank" rel="noopener"
 &gt;knowledge injection&lt;/a&gt;을 무료로 해 준다는 디폴트를, Aristotelian 논문은 표현 유사도 metric이 신뢰할 만하다는 디폴트를 의심한다. 이 다섯 디폴트는 각각 산업 전체가 한 번도 진지하게 의심하지 않은 채 그 위에 stack을 쌓아 올린 가정들이다.&lt;/p&gt;
&lt;p&gt;스케일이 새로운 능력을 만들어내는 라운드 — &lt;a class="link" href="https://en.wikipedia.org/wiki/GPT-4" target="_blank" rel="noopener"
 &gt;2020-2024년&lt;/a&gt; — 가 일단락된 후, 차세대 차별화는 모델 파라미터 수가 아니라 &lt;strong&gt;모델이 세계와 만나는 인터페이스 해상도&lt;/strong&gt;에서 나온다. DCI의 raw corpus 인터페이스, AI Co-Mathematician의 stateful workspace, GOAT의 학습된 prior, self-distillation SFT, neighborhood 기반 표현 calibration — 다섯 다 같은 메타-원칙의 다른 응용이다: &lt;strong&gt;abstraction layer는 비용 없는 단순화가 아니라 정보 손실이 일어나는 지점이다. 손실을 줄이려면 layer를 다시 설계하라.&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;지난 주 픽&lt;/a&gt;이 에이전트 협력의 위쪽 — 어떻게 협력하고 누적하고 구조화하는가 — 을 봤다면, 이번 주는 아래쪽 — 그 아래 깔린 검색·표현·prior가 옳게 깔려 있는가 — 를 본다. 두 흐름이 같은 시점에 모이고 있다는 것 자체가, 다음 라운드의 키워드가 모델 크기가 아니라 &lt;strong&gt;stack 전체 재교정&lt;/strong&gt;임을 보여준다.&lt;/p&gt;
&lt;h2 id="참고"&gt;참고
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;Papers (이번 주 5편)&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.05242" target="_blank" rel="noopener"
 &gt;Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction (2605.05242)&lt;/a&gt; — Li, Zhang, Lu, Feng, Choi, Zou, Han, Chen, Lin 외 (2026-05-03, &lt;a class="link" href="https://arxiv.org/list/cs.IR/new" target="_blank" rel="noopener"
 &gt;cs.IR&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.06651" target="_blank" rel="noopener"
 &gt;AI Co-Mathematician: Accelerating Mathematicians with Agentic AI (2605.06651)&lt;/a&gt; — Zheng, von Glehn, Buesing, Roy, Wattenberg, Viégas, Davies, Kohli 외 (&lt;a class="link" href="https://deepmind.google/" target="_blank" rel="noopener"
 &gt;Google DeepMind&lt;/a&gt;, 2026-05-07, &lt;a class="link" href="https://arxiv.org/list/cs.AI/new" target="_blank" rel="noopener"
 &gt;cs.AI&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2601.15380" target="_blank" rel="noopener"
 &gt;You Need Better Attention Priors — GOAT (2601.15380)&lt;/a&gt; — Litman, Guo (2026-01-21, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2604.15574" target="_blank" rel="noopener"
 &gt;Why Fine-Tuning Encourages Hallucinations and How to Fix It (2604.15574)&lt;/a&gt; — Kaplan, Gekhman, Zhu, Rozner, Reif, Swayamdipta, Hoiem, Schwartz (2026-04-16, &lt;a class="link" href="https://arxiv.org/list/cs.CL/new" target="_blank" rel="noopener"
 &gt;cs.CL&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2602.14486" target="_blank" rel="noopener"
 &gt;Revisiting the Platonic Representation Hypothesis: An Aristotelian View (2602.14486)&lt;/a&gt; — Gröger, Wen, Brbić (&lt;a class="link" href="https://www.epfl.ch/" target="_blank" rel="noopener"
 &gt;EPFL&lt;/a&gt;, 2026-02-16, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;Background&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;The Platonic Representation Hypothesis&lt;/a&gt; — Huh, Cheung, Wang, &lt;a class="link" href="http://web.mit.edu/phillipi/" target="_blank" rel="noopener"
 &gt;Isola&lt;/a&gt; (2024) — 이번 주 5번 논문이 도전하는 원전&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/1706.03762" target="_blank" rel="noopener"
 &gt;Attention Is All You Need&lt;/a&gt; — Vaswani 외 (2017) — GOAT가 일반화 대상으로 삼는 baseline&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/Dao-AILab/flash-attention" target="_blank" rel="noopener"
 &gt;FlashAttention&lt;/a&gt; — &lt;a class="link" href="https://tridao.me/" target="_blank" rel="noopener"
 &gt;Tri Dao&lt;/a&gt; — GOAT가 호환을 강조하는 커널&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2405.05904" target="_blank" rel="noopener"
 &gt;Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations? (2405.05904)&lt;/a&gt; — Gekhman 외 (2024) — 이번 주 4번 논문의 선행 연구&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://optimaltransport.github.io/" target="_blank" rel="noopener"
 &gt;Entropic Optimal Transport&lt;/a&gt; — GOAT의 수학적 프레임워크&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://brightbenchmark.github.io/" target="_blank" rel="noopener"
 &gt;BRIGHT benchmark&lt;/a&gt; · &lt;a class="link" href="https://github.com/beir-cellar/beir" target="_blank" rel="noopener"
 &gt;BEIR&lt;/a&gt; · &lt;a class="link" href="https://browsecomp.github.io/" target="_blank" rel="noopener"
 &gt;BrowseComp&lt;/a&gt; · &lt;a class="link" href="https://epoch.ai/frontiermath" target="_blank" rel="noopener"
 &gt;FrontierMath&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2302.00487" target="_blank" rel="noopener"
 &gt;Continual Learning (survey)&lt;/a&gt; — SFT 할루시네이션 논문의 도구 기원&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2309.17453" target="_blank" rel="noopener"
 &gt;Attention Sink (Streaming LLM)&lt;/a&gt; — Xiao 외 (2023)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Society_of_Mind" target="_blank" rel="noopener"
 &gt;Society of Mind&lt;/a&gt; · &lt;a class="link" href="https://en.wikipedia.org/wiki/Free_energy_principle" target="_blank" rel="noopener"
 &gt;Active Inference&lt;/a&gt; — 지난 주 디지스트에서 다룬 인지 프레임워크&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;Related blog posts&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;이번 주 arxiv 논문 3편 디지스트 — 멀티에이전트 토론, MIA, 후설 현상학&lt;/a&gt; — 이 시리즈의 직전 회차 (협력·영속성·구조)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/" target="_blank" rel="noopener"
 &gt;arxiv.org&lt;/a&gt; — 프리프린트 서버&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>