<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Theory on ICE-ICE-BEAR-BLOG</title><link>https://ice-ice-bear.github.io/ko/tags/theory/</link><description>Recent content in Theory on ICE-ICE-BEAR-BLOG</description><generator>Hugo -- gohugo.io</generator><language>ko</language><lastBuildDate>Sat, 09 May 2026 00:00:00 +0900</lastBuildDate><atom:link href="https://ice-ice-bear.github.io/ko/tags/theory/index.xml" rel="self" type="application/rss+xml"/><item><title>이번 주 arxiv 논문 5편 디지스트 — 인터페이스와 prior를 다시 보는 한 주</title><link>https://ice-ice-bear.github.io/ko/posts/2026-05-09-arxiv-papers-week-digest/</link><pubDate>Sat, 09 May 2026 00:00:00 +0900</pubDate><guid>https://ice-ice-bear.github.io/ko/posts/2026-05-09-arxiv-papers-week-digest/</guid><description>&lt;img src="https://ice-ice-bear.github.io/" alt="Featured image of post 이번 주 arxiv 논문 5편 디지스트 — 인터페이스와 prior를 다시 보는 한 주" /&gt;&lt;h2 id="개요"&gt;개요
&lt;/h2&gt;&lt;p&gt;지난 며칠 사이 &lt;a class="link" href="https://arxiv.org/" target="_blank" rel="noopener"
 &gt;arxiv&lt;/a&gt;에서 눈에 들어온 논문 5편. 분야는 &lt;a class="link" href="https://en.wikipedia.org/wiki/Information_retrieval" target="_blank" rel="noopener"
 &gt;정보 검색&lt;/a&gt;, 수학 보조 에이전트, &lt;a class="link" href="https://en.wikipedia.org/wiki/Attention_%28machine_learning%29" target="_blank" rel="noopener"
 &gt;attention&lt;/a&gt; 구조, &lt;a class="link" href="https://en.wikipedia.org/wiki/Fine-tuning_%28deep_learning%29" target="_blank" rel="noopener"
 &gt;SFT&lt;/a&gt;로 인한 &lt;a class="link" href="https://en.wikipedia.org/wiki/Hallucination_%28artificial_intelligence%29" target="_blank" rel="noopener"
 &gt;할루시네이션&lt;/a&gt;, &lt;a class="link" href="https://en.wikipedia.org/wiki/Feature_learning" target="_blank" rel="noopener"
 &gt;표현 학습&lt;/a&gt; 이론으로 다 다른데, 묶어 읽으면 한 가지 의문이 반복된다 — &lt;strong&gt;&amp;ldquo;우리가 당연하게 받아들이던 인터페이스와 prior가, 사실 모델의 진짜 능력을 가로막고 있는 건 아닌가?&amp;rdquo;&lt;/strong&gt; &lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;지난 디지스트&lt;/a&gt;가 협력·영속성·구조라는 세 축으로 추론 향상의 출처를 봤다면, 이번 주는 그 한 단계 아래 — &lt;strong&gt;이미 깔린 추상화 계층을 다시 의심하는 흐름&lt;/strong&gt;이다.&lt;/p&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;graph TD
 Theme["이번 주의 한 줄: &amp;lt;br/&amp;gt; 깔린 인터페이스/prior를 다시 의심한다"]
 Theme --&gt; Retrieval["검색 인터페이스 &amp;lt;br/&amp;gt; (top-k similarity)"]
 Theme --&gt; Workflow["수학 워크플로우 &amp;lt;br/&amp;gt; (단발 응답)"]
 Theme --&gt; Arch["Attention prior &amp;lt;br/&amp;gt; (uniform 가정)"]
 Theme --&gt; Training["SFT 목적함수 &amp;lt;br/&amp;gt; (사실성과 충돌)"]
 Theme --&gt; Repr["표현 유사도 metric &amp;lt;br/&amp;gt; (스케일에 오염)"]

 Retrieval --&gt; P1["DCI (2605.05242)"]
 Workflow --&gt; P2["AI Co-Mathematician (2605.06651)"]
 Arch --&gt; P3["GOAT (2601.15380)"]
 Training --&gt; P4["Self-distillation SFT (2604.15574)"]
 Repr --&gt; P5["Aristotelian Repr. (2602.14486)"]&lt;/pre&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;#&lt;/th&gt;
 &lt;th&gt;논문&lt;/th&gt;
 &lt;th&gt;분야&lt;/th&gt;
 &lt;th&gt;한 줄 요약&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.05242" target="_blank" rel="noopener"
 &gt;Direct Corpus Interaction (2605.05242)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.IR&lt;/td&gt;
 &lt;td&gt;임베딩 없이 &lt;code&gt;grep&lt;/code&gt;·셸 도구로 corpus를 직접 뒤지는 에이전트가 강한 retriever를 이긴다&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;2&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.06651" target="_blank" rel="noopener"
 &gt;AI Co-Mathematician (2605.06651)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.AI&lt;/td&gt;
 &lt;td&gt;수학자용 비동기·상태 보존 워크벤치, &lt;a class="link" href="https://epoch.ai/frontiermath" target="_blank" rel="noopener"
 &gt;FrontierMath Tier 4&lt;/a&gt; 48%&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;3&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2601.15380" target="_blank" rel="noopener"
 &gt;GOAT — You Need Better Attention Priors (2601.15380)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.LG&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://optimaltransport.github.io/" target="_blank" rel="noopener"
 &gt;Entropic Optimal Transport&lt;/a&gt; 관점에서 attention prior를 학습 가능하게&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;4&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2604.15574" target="_blank" rel="noopener"
 &gt;Why Fine-Tuning Encourages Hallucinations (2604.15574)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.CL&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Fine-tuning_%28deep_learning%29" target="_blank" rel="noopener"
 &gt;SFT&lt;/a&gt;가 만드는 할루시네이션을 &lt;a class="link" href="https://en.wikipedia.org/wiki/Knowledge_distillation" target="_blank" rel="noopener"
 &gt;self-distillation&lt;/a&gt;으로 줄인다&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;5&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://arxiv.org/abs/2602.14486" target="_blank" rel="noopener"
 &gt;Aristotelian Representation Hypothesis (2602.14486)&lt;/a&gt;&lt;/td&gt;
 &lt;td&gt;cs.LG&lt;/td&gt;
 &lt;td&gt;&lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;Platonic Representation&lt;/a&gt; 수렴은 metric 결함; 진짜 수렴은 local neighborhood&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="1-direct-corpus-interaction--260505242"&gt;1. Direct Corpus Interaction — 2605.05242
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/li_z_1" target="_blank" rel="noopener"
 &gt;Zhuofeng Li&lt;/a&gt;, Haoxiang Zhang, &lt;a class="link" href="https://lupantech.github.io/" target="_blank" rel="noopener"
 &gt;Pan Lu&lt;/a&gt;, &lt;a class="link" href="https://bunsenfeng.github.io/" target="_blank" rel="noopener"
 &gt;Shangbin Feng&lt;/a&gt;, &lt;a class="link" href="https://maszhongming.github.io/" target="_blank" rel="noopener"
 &gt;Ming Zhong&lt;/a&gt;, &lt;a class="link" href="https://homes.cs.washington.edu/~yejin/" target="_blank" rel="noopener"
 &gt;Yejin Choi&lt;/a&gt;, &lt;a class="link" href="https://www.james-zou.com/" target="_blank" rel="noopener"
 &gt;James Zou&lt;/a&gt;, &lt;a class="link" href="https://hanj.cs.illinois.edu/" target="_blank" rel="noopener"
 &gt;Jiawei Han&lt;/a&gt;, &lt;a class="link" href="https://wenhuchen.github.io/" target="_blank" rel="noopener"
 &gt;Wenhu Chen&lt;/a&gt;, &lt;a class="link" href="https://cs.uwaterloo.ca/~jimmylin/" target="_blank" rel="noopener"
 &gt;Jimmy Lin&lt;/a&gt; 외 (2026-05-03, &lt;a class="link" href="https://arxiv.org/list/cs.IR/new" target="_blank" rel="noopener"
 &gt;cs.IR&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심"&gt;핵심
&lt;/h3&gt;&lt;p&gt;현대 &lt;a class="link" href="https://en.wikipedia.org/wiki/Information_retrieval" target="_blank" rel="noopener"
 &gt;retrieval&lt;/a&gt; 시스템은 lexical이든 semantic이든 corpus를 &lt;strong&gt;고정된 similarity 인터페이스로 압축한다&lt;/strong&gt;. top-k라는 단발 step 이후에야 추론이 시작되는 구조. 에이전트가 강해질수록 이 압축이 병목이 된다. 정확한 lexical 제약, 희박한 단서들의 결합, local context 체크, 다단계 가설 수정 — 모두 기존 retriever 호출로는 표현하기 어렵다. 한 번 걸러 나간 증거는 더 강한 downstream 추론으로도 되돌릴 수 없다.&lt;/p&gt;
&lt;p&gt;저자들의 제안은 &lt;strong&gt;Direct Corpus Interaction (DCI)&lt;/strong&gt; — 임베딩 모델도, &lt;a class="link" href="https://en.wikipedia.org/wiki/Vector_database" target="_blank" rel="noopener"
 &gt;vector index&lt;/a&gt;도, retrieval API도 없이, 에이전트가 &lt;a class="link" href="https://en.wikipedia.org/wiki/Grep" target="_blank" rel="noopener"
 &gt;grep&lt;/a&gt;·파일 읽기·셸 명령·경량 스크립트 같은 범용 터미널 도구로 raw corpus를 직접 뒤지게 한다.&lt;/p&gt;
&lt;h3 id="contribution"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;오프라인 인덱싱 불필요, 진화하는 local corpus에 자연스럽게 적응&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://brightbenchmark.github.io/" target="_blank" rel="noopener"
 &gt;BRIGHT&lt;/a&gt;·&lt;a class="link" href="https://github.com/beir-cellar/beir" target="_blank" rel="noopener"
 &gt;BEIR&lt;/a&gt; 여러 데이터셋에서 sparse·dense·reranking 강 baseline 모두 능가&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://browsecomp.github.io/" target="_blank" rel="noopener"
 &gt;BrowseComp-Plus&lt;/a&gt;·multi-hop QA에서 기존 semantic retriever 없이도 강한 정확도&lt;/li&gt;
&lt;li&gt;결론: 에이전트가 강해질수록 retrieval 품질은 추론력만이 아니라 &lt;strong&gt;모델이 corpus와 상호작용하는 인터페이스의 해상도&lt;/strong&gt;에 의존한다&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;이건 그냥 &amp;ldquo;RAG보다 더 잘하는 방법&amp;quot;이 아니다. &lt;strong&gt;검색 = top-k similarity&lt;/strong&gt; 라는 &lt;a class="link" href="https://en.wikipedia.org/wiki/Dense_passage_retrieval" target="_blank" rel="noopener"
 &gt;지난 10년의 디폴트&lt;/a&gt;를 의심하는 논문이다. &lt;a class="link" href="https://www.anthropic.com/claude-code" target="_blank" rel="noopener"
 &gt;Claude Code&lt;/a&gt;가 &lt;code&gt;grep&lt;/code&gt;·&lt;code&gt;find&lt;/code&gt;로 코드베이스를 뒤지는 방식이 사실은 일반화 가능한 인터페이스라는 얘기이기도 하다. 검색 인덱스 산업이 가정해 온 추상화 계층 자체가 다음 라운드에선 옵션 중 하나로 격하될 수 있다.&lt;/p&gt;
&lt;h2 id="2-ai-co-mathematician--260506651"&gt;2. AI Co-Mathematician — 2605.06651
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/zheng_d_3" target="_blank" rel="noopener"
 &gt;Daniel Zheng&lt;/a&gt;, &lt;a class="link" href="https://research.google/people/ingrid-von-glehn/" target="_blank" rel="noopener"
 &gt;Ingrid von Glehn&lt;/a&gt;, Yori Zwols, Lars Buesing, &lt;a class="link" href="http://danroy.org/" target="_blank" rel="noopener"
 &gt;Daniel M. Roy&lt;/a&gt;, &lt;a class="link" href="https://www.bewitched.com/" target="_blank" rel="noopener"
 &gt;Martin Wattenberg&lt;/a&gt;, &lt;a class="link" href="https://www.fernandaviegas.com/" target="_blank" rel="noopener"
 &gt;Fernanda Viégas&lt;/a&gt;, &lt;a class="link" href="https://research.google/people/alex-davies/" target="_blank" rel="noopener"
 &gt;Alex Davies&lt;/a&gt;, &lt;a class="link" href="https://research.google/people/PushmeetKohli/" target="_blank" rel="noopener"
 &gt;Pushmeet Kohli&lt;/a&gt; 외 (&lt;a class="link" href="https://deepmind.google/" target="_blank" rel="noopener"
 &gt;Google DeepMind&lt;/a&gt;, 2026-05-07, &lt;a class="link" href="https://arxiv.org/list/cs.AI/new" target="_blank" rel="noopener"
 &gt;cs.AI&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-1"&gt;핵심
&lt;/h3&gt;&lt;p&gt;수학자가 &lt;a class="link" href="https://en.wikipedia.org/wiki/Intelligent_agent" target="_blank" rel="noopener"
 &gt;AI 에이전트&lt;/a&gt;와 &lt;strong&gt;상호작용적으로 열린 연구를 수행&lt;/strong&gt;하는 워크벤치. 핵심 디자인 결정은 단발 응답이 아니라 **비동기·상태 보존 워크스페이스(asynchronous, stateful workspace)**라는 점.&lt;/p&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;flowchart LR
 User["수학자"] --&gt;|"의도 (자주 흐림)"| WS["Stateful Workspace"]
 WS --&gt; Idea["ideation"]
 WS --&gt; Lit["literature search"]
 WS --&gt; Comp["computational exploration"]
 WS --&gt; Proof["theorem proving"]
 WS --&gt; Theory["theory building"]
 WS -.-&gt;|"실패 가설 추적"| WS
 WS --&gt;|"native math artifact"| User&lt;/pre&gt;&lt;h3 id="contribution-1"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;불확실성 관리, 사용자 의도 정제, 실패한 가설 추적, native 수학 산출물 출력 — 이 네 가지를 한 시스템에 묶음&lt;/li&gt;
&lt;li&gt;초기 테스트에서 연구자들이 &lt;strong&gt;미해결 문제 해결&lt;/strong&gt;, 새로운 연구 방향 식별, 간과된 &lt;a class="link" href="https://en.wikipedia.org/wiki/Literature_review" target="_blank" rel="noopener"
 &gt;literature&lt;/a&gt; 참조 발견&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://epoch.ai/frontiermath" target="_blank" rel="noopener"
 &gt;FrontierMath&lt;/a&gt; Tier 4에서 &lt;strong&gt;48%&lt;/strong&gt; — 평가된 모든 AI 시스템 중 최고점&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-1"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;이건 &lt;a class="link" href="https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/" target="_blank" rel="noopener"
 &gt;AlphaProof&lt;/a&gt; 류의 자동 정리 증명과 결이 다르다. &lt;strong&gt;수학자를 대체하는 시스템이 아니라, 수학자의 사고 흐름 — 흐릿한 의도 → 탐색 → 막다른 길 → 재시도 — 을 그대로 인터페이스화한 시스템&lt;/strong&gt;이다. &lt;a class="link" href="https://www.anthropic.com/news/skills" target="_blank" rel="noopener"
 &gt;Claude Skills&lt;/a&gt; 같은 비동기 워크플로우 인프라가 일반 도메인에서 시도하는 것을, 수학이라는 verifiable 영역에서 먼저 검증한 셈. 다음 라운드 &amp;ldquo;에이전트 워크벤치&amp;quot;의 reference design이 될 수 있다.&lt;/p&gt;
&lt;h2 id="3-goat--you-need-better-attention-priors--260115380"&gt;3. GOAT — You Need Better Attention Priors — 2601.15380
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/litman_e_1" target="_blank" rel="noopener"
 &gt;Elon Litman&lt;/a&gt;, &lt;a class="link" href="https://gabe-guo.github.io/" target="_blank" rel="noopener"
 &gt;Gabe Guo&lt;/a&gt; (2026-01-21, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-2"&gt;핵심
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Attention_%28machine_learning%29" target="_blank" rel="noopener"
 &gt;Attention&lt;/a&gt;을 &lt;a class="link" href="https://optimaltransport.github.io/" target="_blank" rel="noopener"
 &gt;Entropic Optimal Transport&lt;/a&gt; 렌즈로 보면, 표준 &lt;a class="link" href="https://en.wikipedia.org/wiki/Softmax_function" target="_blank" rel="noopener"
 &gt;softmax attention&lt;/a&gt;은 &lt;strong&gt;암묵적 uniform prior로 정규화된 transport 문제&lt;/strong&gt;다. 저자들은 이 &amp;ldquo;naive assumption&amp;quot;을 &lt;strong&gt;학습 가능한 연속 prior&lt;/strong&gt;로 대체하는 **GOAT (Generalized Optimal transport Attention with Trainable priors)**를 제안한다.&lt;/p&gt;
&lt;h3 id="contribution-2"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/Dao-AILab/flash-attention" target="_blank" rel="noopener"
 &gt;FlashAttention&lt;/a&gt; 같은 최적화 커널과 &lt;strong&gt;완전 호환&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2309.17453" target="_blank" rel="noopener"
 &gt;attention sink&lt;/a&gt; 현상의 EOT 기반 설명 및 해소 — 표준 attention의 representational trade-off 회피&lt;/li&gt;
&lt;li&gt;공간 정보를 core attention 계산에 흡수, &lt;strong&gt;extrapolatable prior&lt;/strong&gt; 학습 — 학습된 &lt;a class="link" href="https://en.wikipedia.org/wiki/Transformer_%28deep_learning_architecture%29#Positional_encoding" target="_blank" rel="noopener"
 &gt;positional embedding&lt;/a&gt;의 유연성 + 고정 encoding의 length generalization&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-2"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/abs/1706.03762" target="_blank" rel="noopener"
 &gt;2017년 Transformer&lt;/a&gt; 이후 attention의 prior가 uniform이라는 사실은 거의 한 번도 의심받지 않았다. GOAT는 attention sink 같은 &lt;strong&gt;현장 엔지니어들이 patch로 메우던 현상&lt;/strong&gt;이 사실 prior 설계 문제였음을 보여준다. &lt;a class="link" href="https://arxiv.org/abs/2312.00752" target="_blank" rel="noopener"
 &gt;Mamba&lt;/a&gt;·&lt;a class="link" href="https://arxiv.org/abs/2305.13048" target="_blank" rel="noopener"
 &gt;RWKV&lt;/a&gt; 같은 &lt;a class="link" href="https://en.wikipedia.org/wiki/Mamba_%28deep_learning_architecture%29" target="_blank" rel="noopener"
 &gt;non-attention 아키텍처&lt;/a&gt;가 등장한 시점에 attention을 더 일반화하는 방향이 어디까지 가능한가에 대한 흥미로운 답.&lt;/p&gt;
&lt;h2 id="4-why-fine-tuning-encourages-hallucinations--260415574"&gt;4. Why Fine-Tuning Encourages Hallucinations — 2604.15574
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://arxiv.org/a/kaplan_g_1" target="_blank" rel="noopener"
 &gt;Guy Kaplan&lt;/a&gt;, &lt;a class="link" href="https://zorikg.github.io/" target="_blank" rel="noopener"
 &gt;Zorik Gekhman&lt;/a&gt;, Zhen Zhu, Lotem Rozner, Yuval Reif, &lt;a class="link" href="https://swabhs.com/" target="_blank" rel="noopener"
 &gt;Swabha Swayamdipta&lt;/a&gt;, &lt;a class="link" href="https://dhoiem.cs.illinois.edu/" target="_blank" rel="noopener"
 &gt;Derek Hoiem&lt;/a&gt;, &lt;a class="link" href="https://schwartz-lab-huji.github.io/" target="_blank" rel="noopener"
 &gt;Roy Schwartz&lt;/a&gt; (2026-04-16, &lt;a class="link" href="https://arxiv.org/list/cs.CL/new" target="_blank" rel="noopener"
 &gt;cs.CL&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-3"&gt;핵심
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Large_language_model" target="_blank" rel="noopener"
 &gt;LLM&lt;/a&gt;이 &lt;a class="link" href="https://en.wikipedia.org/wiki/Hallucination_%28artificial_intelligence%29" target="_blank" rel="noopener"
 &gt;할루시네이션&lt;/a&gt;을 일으키는 주요 원인 중 하나는 &lt;strong&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Fine-tuning_%28deep_learning%29" target="_blank" rel="noopener"
 &gt;supervised fine-tuning&lt;/a&gt;(SFT) 동안 새로운 사실 정보에 노출되는 것&lt;/strong&gt;. 사전학습으로 획득한 지식 대비 할루시네이션이 늘어난다. 저자들은 이걸 &lt;strong&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Continual_learning" target="_blank" rel="noopener"
 &gt;continual learning&lt;/a&gt; 문헌의 지식 열화(knowledge degradation) 문제&lt;/strong&gt;로 재정의하고, 그 도구로 해결한다.&lt;/p&gt;
&lt;h3 id="contribution-3"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;self-distillation 기반 SFT 방법&lt;/strong&gt; 제안 — 출력 분포 drift를 정규화하여 효과적 사실 학습과 할루시네이션 최소화 동시 달성&lt;/li&gt;
&lt;li&gt;새 지식 습득이 불필요한 상황: parameter group을 &lt;strong&gt;freeze&lt;/strong&gt;하여 사실적 plasticity를 억제, task 성능 유지하면서 할루시네이션 감소&lt;/li&gt;
&lt;li&gt;SFT 유발 할루시네이션의 메커니즘을 3가지 가설로 조사: capacity 한계, &lt;a class="link" href="https://en.wikipedia.org/wiki/Imitation_learning#Behavioral_cloning" target="_blank" rel="noopener"
 &gt;behavior cloning&lt;/a&gt;, localized interference&lt;/li&gt;
&lt;li&gt;주된 원인: &lt;strong&gt;겹치는 의미적 표현 간 간섭 (interference among overlapping semantic representations)&lt;/strong&gt;. self-distillation이 이 간섭을 완화함으로써 성공&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-3"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;&amp;ldquo;SFT가 할루시네이션을 만든다&amp;quot;는 관찰은 &lt;a class="link" href="https://arxiv.org/abs/2405.05904" target="_blank" rel="noopener"
 &gt;Gekhman 외 2024&lt;/a&gt;에서도 나왔다. 이번 논문은 그 &lt;strong&gt;메커니즘을 표현 간섭으로 특정하고 self-distillation으로 푼다&lt;/strong&gt;는 점에서 한 단계 나간다. &lt;a class="link" href="https://en.wikipedia.org/wiki/Reinforcement_learning_from_human_feedback" target="_blank" rel="noopener"
 &gt;RLHF&lt;/a&gt; 이전 단계인 SFT 그 자체가 안전·사실성의 결함 지점이라는 통찰은 &lt;a class="link" href="https://en.wikipedia.org/wiki/AI_alignment" target="_blank" rel="noopener"
 &gt;alignment&lt;/a&gt; 파이프라인 전체 재설계를 시사한다. instruction tuning을 무지성으로 돌리던 시기는 끝.&lt;/p&gt;
&lt;h2 id="5-aristotelian-representation-hypothesis--260214486"&gt;5. Aristotelian Representation Hypothesis — 2602.14486
&lt;/h2&gt;&lt;p&gt;&lt;a class="link" href="https://fabian-groeger.com/" target="_blank" rel="noopener"
 &gt;Fabian Gröger&lt;/a&gt;, Shuo Wen, &lt;a class="link" href="https://people.epfl.ch/maria.brbic" target="_blank" rel="noopener"
 &gt;Maria Brbić&lt;/a&gt; (&lt;a class="link" href="https://www.epfl.ch/" target="_blank" rel="noopener"
 &gt;EPFL&lt;/a&gt;, 2026-02-16, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;).&lt;/p&gt;
&lt;h3 id="핵심-4"&gt;핵심
&lt;/h3&gt;&lt;p&gt;&lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;Platonic Representation Hypothesis&lt;/a&gt; (Huh, Cheung, Wang, &lt;a class="link" href="http://web.mit.edu/phillipi/" target="_blank" rel="noopener"
 &gt;Isola&lt;/a&gt;, 2024)는 &lt;strong&gt;신경망 표현이 현실의 공통 통계 모델로 수렴 중&lt;/strong&gt;이라는 주장. 이 논문은 그 주장의 측정 도구 자체를 의심한다.&lt;/p&gt;
&lt;h3 id="contribution-4"&gt;Contribution
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;기존 representational similarity metric이 &lt;strong&gt;network scale에 confound&lt;/strong&gt; — 모델 depth/width 증가만으로 유사도 점수가 체계적으로 부풀려짐&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;permutation 기반 null-calibration 프레임워크&lt;/strong&gt; — 어떤 representational similarity metric이든 통계적 보장이 있는 calibrated score로 변환&lt;/li&gt;
&lt;li&gt;보정 후 결과: 전역 &lt;a class="link" href="https://en.wikipedia.org/wiki/Spectral_theory" target="_blank" rel="noopener"
 &gt;spectral measure&lt;/a&gt;가 보고한 수렴은 &lt;strong&gt;대부분 사라진다&lt;/strong&gt;. 하지만 &lt;strong&gt;local neighborhood similarity&lt;/strong&gt; (단, local distance가 아님)는 modality를 가로질러 유의미한 일치 유지&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Aristotelian Representation Hypothesis&lt;/strong&gt; 제안: 신경망 표현은 &lt;strong&gt;공유된 local neighborhood 관계&lt;/strong&gt;로 수렴한다 — 거리(Platonic 절대 형상)가 아니라 이웃 구조(Aristotelian 관계 카테고리)&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="왜-지금-의미가-큰가-4"&gt;왜 지금 의미가 큰가
&lt;/h3&gt;&lt;p&gt;이건 메타 논문이다. &lt;strong&gt;결과가 아니라 측정의 결함을 지적한다.&lt;/strong&gt; &lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;Platonic Representation&lt;/a&gt; 가설은 2024년 이후 &lt;a class="link" href="https://en.wikipedia.org/wiki/Multimodal_learning" target="_blank" rel="noopener"
 &gt;멀티모달 정렬&lt;/a&gt;의 이론적 근거로 자주 인용됐다. 이 calibration framework가 표준으로 자리잡으면, 지난 2년간의 &amp;ldquo;표현 수렴&amp;rdquo; 주장들은 다시 검사받아야 한다. 그리고 새로 남는 결론 — local neighborhood만 수렴한다 — 은 &lt;a class="link" href="https://en.wikipedia.org/wiki/Self-supervised_learning#Contrastive_self-supervised_learning" target="_blank" rel="noopener"
 &gt;contrastive learning&lt;/a&gt; 류 &lt;a class="link" href="https://en.wikipedia.org/wiki/Word_embedding" target="_blank" rel="noopener"
 &gt;embedding&lt;/a&gt; 학습이 왜 잘 작동하는지에 대한 더 깔끔한 설명이기도 하다.&lt;/p&gt;
&lt;h2 id="묶어서-본-흐름"&gt;묶어서 본 흐름
&lt;/h2&gt;&lt;p&gt;다섯 논문이 향하는 곳: &lt;strong&gt;이미 깔린 추상화 계층을 다시 의심한다.&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;의심받는 계층&lt;/th&gt;
 &lt;th&gt;무엇을 가정했나&lt;/th&gt;
 &lt;th&gt;무엇이 더 나은가&lt;/th&gt;
 &lt;th&gt;논문&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;검색 인터페이스&lt;/td&gt;
 &lt;td&gt;top-k similarity가 충분&lt;/td&gt;
 &lt;td&gt;에이전트가 raw corpus 직접 탐색&lt;/td&gt;
 &lt;td&gt;DCI&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;수학 워크플로우&lt;/td&gt;
 &lt;td&gt;단발 질의응답&lt;/td&gt;
 &lt;td&gt;비동기·상태 보존 워크벤치&lt;/td&gt;
 &lt;td&gt;AI Co-Mathematician&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Attention prior&lt;/td&gt;
 &lt;td&gt;uniform 분포&lt;/td&gt;
 &lt;td&gt;학습 가능한 prior + EOT&lt;/td&gt;
 &lt;td&gt;GOAT&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;SFT 목적함수&lt;/td&gt;
 &lt;td&gt;새 지식 = 좋은 것&lt;/td&gt;
 &lt;td&gt;self-distillation으로 간섭 완화&lt;/td&gt;
 &lt;td&gt;Why FT Hallucinates&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;표현 유사도 metric&lt;/td&gt;
 &lt;td&gt;spectral이 충분&lt;/td&gt;
 &lt;td&gt;scale에 robust한 calibration&lt;/td&gt;
 &lt;td&gt;Aristotelian&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;pre class="mermaid" style="visibility:hidden"&gt;quadrantChart
 title 이번 주 5편 — 추상화 계층 × 영향 범위
 x-axis "낮은 계층 (구조/이론)" --&gt; "높은 계층 (워크플로우)"
 y-axis "좁은 영향" --&gt; "넓은 영향"
 quadrant-1 "재설계 후보 (높은 계층 + 넓은 영향)"
 quadrant-2 "기반 재교정 (낮은 계층 + 넓은 영향)"
 quadrant-3 "특수 케이스"
 quadrant-4 "도구 단계"
 "DCI (retrieval)": [0.55, 0.85]
 "AI Co-Math": [0.85, 0.6]
 "GOAT (attention)": [0.15, 0.75]
 "SFT halluc.": [0.5, 0.7]
 "Aristotelian": [0.25, 0.55]&lt;/pre&gt;&lt;p&gt;&lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;지난 디지스트&lt;/a&gt;는 &amp;ldquo;추론 향상은 어디서 오는가&amp;quot;를 협력·영속성·구조로 풀었다. 이번 주는 한 층 더 들어간다 — &lt;strong&gt;그 추론을 받쳐주는 인터페이스/prior가 옳게 깔려 있는가&lt;/strong&gt;라는 질문이다. 둘은 충돌하지 않는다. 오히려 같은 흐름의 다음 단계로 보인다: 모델 크기를 키우는 라운드는 끝났고, 다음 라운드의 차별화는 &lt;strong&gt;에이전트 협력 토폴로지(지난 주) + 추상화 계층 재교정(이번 주)&lt;/strong&gt; 에서 나온다.&lt;/p&gt;
&lt;h2 id="인사이트"&gt;인사이트
&lt;/h2&gt;&lt;p&gt;이번 주 다섯 편을 묶으면 한 가지 공통 자세가 드러난다 — &lt;strong&gt;&amp;ldquo;당연하다고 받아들이던 디폴트를 한 번만 더 의심해 보자.&amp;rdquo;&lt;/strong&gt; DCI는 검색 = top-k라는 디폴트를, AI Co-Mathematician은 응답 = 단발 텍스트라는 디폴트를, GOAT는 attention prior = uniform이라는 디폴트를, SFT 할루시네이션 논문은 SFT가 &lt;a class="link" href="https://en.wikipedia.org/wiki/Knowledge_injection" target="_blank" rel="noopener"
 &gt;knowledge injection&lt;/a&gt;을 무료로 해 준다는 디폴트를, Aristotelian 논문은 표현 유사도 metric이 신뢰할 만하다는 디폴트를 의심한다. 이 다섯 디폴트는 각각 산업 전체가 한 번도 진지하게 의심하지 않은 채 그 위에 stack을 쌓아 올린 가정들이다.&lt;/p&gt;
&lt;p&gt;스케일이 새로운 능력을 만들어내는 라운드 — &lt;a class="link" href="https://en.wikipedia.org/wiki/GPT-4" target="_blank" rel="noopener"
 &gt;2020-2024년&lt;/a&gt; — 가 일단락된 후, 차세대 차별화는 모델 파라미터 수가 아니라 &lt;strong&gt;모델이 세계와 만나는 인터페이스 해상도&lt;/strong&gt;에서 나온다. DCI의 raw corpus 인터페이스, AI Co-Mathematician의 stateful workspace, GOAT의 학습된 prior, self-distillation SFT, neighborhood 기반 표현 calibration — 다섯 다 같은 메타-원칙의 다른 응용이다: &lt;strong&gt;abstraction layer는 비용 없는 단순화가 아니라 정보 손실이 일어나는 지점이다. 손실을 줄이려면 layer를 다시 설계하라.&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;지난 주 픽&lt;/a&gt;이 에이전트 협력의 위쪽 — 어떻게 협력하고 누적하고 구조화하는가 — 을 봤다면, 이번 주는 아래쪽 — 그 아래 깔린 검색·표현·prior가 옳게 깔려 있는가 — 를 본다. 두 흐름이 같은 시점에 모이고 있다는 것 자체가, 다음 라운드의 키워드가 모델 크기가 아니라 &lt;strong&gt;stack 전체 재교정&lt;/strong&gt;임을 보여준다.&lt;/p&gt;
&lt;h2 id="참고"&gt;참고
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;Papers (이번 주 5편)&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.05242" target="_blank" rel="noopener"
 &gt;Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction (2605.05242)&lt;/a&gt; — Li, Zhang, Lu, Feng, Choi, Zou, Han, Chen, Lin 외 (2026-05-03, &lt;a class="link" href="https://arxiv.org/list/cs.IR/new" target="_blank" rel="noopener"
 &gt;cs.IR&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2605.06651" target="_blank" rel="noopener"
 &gt;AI Co-Mathematician: Accelerating Mathematicians with Agentic AI (2605.06651)&lt;/a&gt; — Zheng, von Glehn, Buesing, Roy, Wattenberg, Viégas, Davies, Kohli 외 (&lt;a class="link" href="https://deepmind.google/" target="_blank" rel="noopener"
 &gt;Google DeepMind&lt;/a&gt;, 2026-05-07, &lt;a class="link" href="https://arxiv.org/list/cs.AI/new" target="_blank" rel="noopener"
 &gt;cs.AI&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2601.15380" target="_blank" rel="noopener"
 &gt;You Need Better Attention Priors — GOAT (2601.15380)&lt;/a&gt; — Litman, Guo (2026-01-21, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2604.15574" target="_blank" rel="noopener"
 &gt;Why Fine-Tuning Encourages Hallucinations and How to Fix It (2604.15574)&lt;/a&gt; — Kaplan, Gekhman, Zhu, Rozner, Reif, Swayamdipta, Hoiem, Schwartz (2026-04-16, &lt;a class="link" href="https://arxiv.org/list/cs.CL/new" target="_blank" rel="noopener"
 &gt;cs.CL&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2602.14486" target="_blank" rel="noopener"
 &gt;Revisiting the Platonic Representation Hypothesis: An Aristotelian View (2602.14486)&lt;/a&gt; — Gröger, Wen, Brbić (&lt;a class="link" href="https://www.epfl.ch/" target="_blank" rel="noopener"
 &gt;EPFL&lt;/a&gt;, 2026-02-16, &lt;a class="link" href="https://arxiv.org/list/cs.LG/new" target="_blank" rel="noopener"
 &gt;cs.LG&lt;/a&gt;)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;Background&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://phillipi.github.io/prh/" target="_blank" rel="noopener"
 &gt;The Platonic Representation Hypothesis&lt;/a&gt; — Huh, Cheung, Wang, &lt;a class="link" href="http://web.mit.edu/phillipi/" target="_blank" rel="noopener"
 &gt;Isola&lt;/a&gt; (2024) — 이번 주 5번 논문이 도전하는 원전&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/1706.03762" target="_blank" rel="noopener"
 &gt;Attention Is All You Need&lt;/a&gt; — Vaswani 외 (2017) — GOAT가 일반화 대상으로 삼는 baseline&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/Dao-AILab/flash-attention" target="_blank" rel="noopener"
 &gt;FlashAttention&lt;/a&gt; — &lt;a class="link" href="https://tridao.me/" target="_blank" rel="noopener"
 &gt;Tri Dao&lt;/a&gt; — GOAT가 호환을 강조하는 커널&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2405.05904" target="_blank" rel="noopener"
 &gt;Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations? (2405.05904)&lt;/a&gt; — Gekhman 외 (2024) — 이번 주 4번 논문의 선행 연구&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://optimaltransport.github.io/" target="_blank" rel="noopener"
 &gt;Entropic Optimal Transport&lt;/a&gt; — GOAT의 수학적 프레임워크&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://brightbenchmark.github.io/" target="_blank" rel="noopener"
 &gt;BRIGHT benchmark&lt;/a&gt; · &lt;a class="link" href="https://github.com/beir-cellar/beir" target="_blank" rel="noopener"
 &gt;BEIR&lt;/a&gt; · &lt;a class="link" href="https://browsecomp.github.io/" target="_blank" rel="noopener"
 &gt;BrowseComp&lt;/a&gt; · &lt;a class="link" href="https://epoch.ai/frontiermath" target="_blank" rel="noopener"
 &gt;FrontierMath&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2302.00487" target="_blank" rel="noopener"
 &gt;Continual Learning (survey)&lt;/a&gt; — SFT 할루시네이션 논문의 도구 기원&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/abs/2309.17453" target="_blank" rel="noopener"
 &gt;Attention Sink (Streaming LLM)&lt;/a&gt; — Xiao 외 (2023)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://en.wikipedia.org/wiki/Society_of_Mind" target="_blank" rel="noopener"
 &gt;Society of Mind&lt;/a&gt; · &lt;a class="link" href="https://en.wikipedia.org/wiki/Free_energy_principle" target="_blank" rel="noopener"
 &gt;Active Inference&lt;/a&gt; — 지난 주 디지스트에서 다룬 인지 프레임워크&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;Related blog posts&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://ice-ice-bear.github.io/ko/p/2026-05-06-arxiv-papers-pick-multiagent-debate-mia-husserl/" &gt;이번 주 arxiv 논문 3편 디지스트 — 멀티에이전트 토론, MIA, 후설 현상학&lt;/a&gt; — 이 시리즈의 직전 회차 (협력·영속성·구조)&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://arxiv.org/" target="_blank" rel="noopener"
 &gt;arxiv.org&lt;/a&gt; — 프리프린트 서버&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>