AI 코딩 에이전트의 OS 레이어 — agentmemory와 agent-skills 같은 날 동시 등장

개요

같은 시각 30초 간격으로 등장한 두 GitHub 링크. 둘 다 “AI 코딩 에이전트의 ergonomic 결함"을 풀려는 도구지만, 노리는 결함이 다르다. rohitg00/agentmemory는 세션 간 메모리 인프라를, addyosmani/agent-skills는 시니어 엔지니어의 워크플로 강제력을 푼다. 묶어서 보면 에이전트 시대의 OS 레이어가 모양을 갖추고 있다.

graph TD
    Agent["AI 코딩 에이전트"] --> Memory["메모리/상태 레이어"]
    Agent --> Skills["워크플로/룰 레이어"]
    Agent --> Model["모델 레이어"]
    Agent --> UI["UI 레이어"]

    Memory --> AM["agentmemory <br/> MCP + REST"]
    Skills --> AS["agent-skills <br/> Markdown 스킬 번들"]
    Model --> Claude["Claude / GPT / Gemini"]
    UI --> CC["Claude Code / Cursor / Cline"]

1. agentmemory — 영속 메모리, MCP로 모든 에이전트와 공유

rohitg00/agentmemory는 "#1 Persistent memory for AI coding agents based on real-world benchmarks” 를 표방한다. 2026-02-25 생성, 약 2,400 stars, Apache 2.0. 홈페이지는 agent-memory.dev.

풀려는 문제

매 세션마다 아키텍처를 다시 설명해야 함
같은 버그를 다시 발견함
같은 선호(라이브러리 선택, 코드 스타일)를 다시 가르쳐야 함
CLAUDE.md나 .cursorrules 같은 빌트인 메모리는 200줄 cap에 stale

작동 방식

에이전트가 한 일을 silently capture → 압축 → 검색 가능한 메모리로 저장 → 다음 세션 시작 시 적절한 컨텍스트만 inject. 핵심은 단일 MCP 서버 1개만 띄우면 16개 이상 에이전트가 같은 메모리를 공유한다는 것.

지원되는 클라이언트:

Claude Code · Cursor · Gemini CLI · Codex CLI
Cline · Goose · Windsurf · Roo Code · OpenCode
MCP가 안 되는 에이전트도 REST API로 붙음 (104개 endpoint)

임베딩은 로컬 all-MiniLM-L6-v2를 사용 → API 키 필요 없음, 무료.

벤치마크 — LongMemEval-S

LongMemEval (ICLR 2025, 500 questions) 결과:

지표	agentmemory	BM25 fallback
R@5	95.2%	86.2%
R@10	98.6%	—
MRR	88.2%	—

임베딩 + 하이브리드가 단순 키워드 BM25보다 R@5 기준 9%p 높다.

토큰 절감

방식	연간 토큰	연간 비용
풀 컨텍스트 paste	19.5M+	컨텍스트 window 초과
LLM-summarized	~650K	~$500
agentmemory	~170K	~$10
agentmemory + local embed	~170K	$0

시작

npx @agentmemory/agentmemory

의미

이 도구의 핵심 베팅은 한 줄로 정리된다 — “메모리는 에이전트가 아니라 인프라 레이어에 있어야 한다.” 에이전트별로 메모리를 짜는 대신 MCP 서버 1개로 모든 에이전트가 공유하면, Claude Code 세션에서 학습한 게 다음 Cursor 세션에 그대로 흘러간다. 50일 전쯤 viral한 GitHub gist(1,050 stars)에서 시작 → 그 디자인 문서를 코드로 구현한 형태. Karpathy의 LLM Wiki 패턴 + confidence scoring + lifecycle + knowledge graph + hybrid search.

2. agent-skills — 시니어 엔지니어의 워크플로를 스킬로 패키징

addyosmani/agent-skills는 “Production-grade engineering skills for AI coding agents.” 를 표방한다. 2026-02-15 생성, 약 33,500 stars, MIT. 동일 시점 비교에서 agentmemory보다 14배 많은 stars — 워크플로 표준 후보로 가장 빠르게 모이는 곳이다.

풀려는 문제

“에이전트가 코드를 짜기는 짜는데, 시니어가 한 것 같지 않다.”

스펙 없이 바로 코드 짠다
테스트를 안 짠다
보안 고려가 없다
큰 PR을 한 번에 던진다

6단계 라이프사이클

DEFINE → PLAN → BUILD → VERIFY → REVIEW → SHIP
/spec   /plan   /build   /test    /review  /ship

각 슬래시 커맨드 = 라이프사이클 한 단계 → 필요한 스킬을 자동 활성화.

20개 스킬 분류

Define: idea-refine, spec-driven-development
Plan: planning-and-task-breakdown
Build: incremental-implementation, test-driven-development, context-engineering, source-driven-development, frontend-ui-engineering, api-and-interface-design
Verify: browser-testing-with-devtools, debugging-and-error-recovery
Review: code-review-and-quality, code-simplification, security-and-hardening, performance-optimization
Ship: git-workflow-and-versioning, ci-cd-and-automation, deprecation-and-migration, documentation-and-adrs, shipping-and-launch

어디서 동작하나

Claude Code (marketplace 설치, 권장): /plugin marketplace add addyosmani/agent-skills
Cursor: .cursor/rules/에 SKILL.md 복사
Gemini CLI · Windsurf · OpenCode · GitHub Copilot · Kiro IDE · Codex — 마크다운만 읽으면 다 동작

Agent Personas

code-reviewer — Senior Staff Engineer 관점, “would a staff engineer approve this?”
test-engineer — QA, Prove-It 패턴
security-auditor — OWASP, threat modeling

의미

agent-skills의 베팅은 “에이전트는 LLM 무게가 아니라 워크플로의 강제력에서 차이가 난다.” TDD를 “할 수 있다” 가 아니라 “Red-Green-Refactor를 안 하면 코드가 안 나간다” 같은 강제 흐름으로 만든다. 코드 리뷰도 5축 review, 100줄 단위 size, Nit/Optional/FYI severity 라벨 같은 구체 룰. Markdown만으로 풀어서 에이전트 종속성 zero — Claude/Cursor/Gemini 다 같은 스킬을 쓸 수 있다. 33K 스타가 말해주듯 현재 에이전트 워크플로 표준에 가장 가까운 후보다.

3. 두 도구 비교

항목	agentmemory	agent-skills
누가	rohitg00	addyosmani
무엇	TypeScript 라이브러리 + MCP 서버	Markdown 스킬 번들
라이선스	Apache 2.0	MIT
Stars (2026-05)	~2,400	~33,500
생성	2026-02-25	2026-02-15
도메인	메모리/상태 인프라	엔지니어링 워크플로
종속성 끊는 방식	MCP 표준	Markdown 표준

4. 묶어서 본 의미 — 에이전트 시대의 OS 레이어

flowchart LR
    M["메모리/상태"] --> AM["agentmemory"]
    W["워크플로/룰"] --> AS["agent-skills"]
    Mo["모델"] --> LLM["Claude / GPT / Gemini"]
    UI["UI"] --> Tools["Claude Code / Cursor / Cline"]

3-4년 전 “어떤 IDE 쓰지?” 가 결정 포인트였다면, 이제는 “어떤 메모리 + 스킬 셋업?” 이 결정 포인트가 되고 있다. 둘 다 모델 종속성을 의도적으로 끊어두고 (MCP와 Markdown), 모델은 갈아치울 수 있어도 메모리/스킬은 누적되도록 설계한 게 공통점이다.

인사이트

같은 시각 같은 사람이 30초 간격으로 등장시킨 두 링크가 정확히 에이전트 OS 레이어의 다른 두 슬롯을 메우고 있다는 점이 이 디지스트의 핵심이다. agentmemory는 상태를, agent-skills는 프로세스를 인프라 레이어로 끌어내려 모델 위에 올라가는 공통 부품으로 만들었다. 두 도구가 모델 종속성을 의도적으로 끊는 방식 — MCP 서버 하나, Markdown 한 더미 — 도 같은 방향이다. 모델은 갈아치워도 메모리와 스킬은 누적된다는 베팅. 33K vs 2.4K stars 차이는 시점 차가 아니라 워크플로 표준 후보가 메모리 인프라보다 한발 앞서 모이고 있다는 신호로 읽힌다. 다음 분기 흥미로운 질문은 두 가지 — 메모리 표준이 MCP 위에서 단일화될지, 그리고 agent-skills 같은 스킬 번들이 IDE 마켓플레이스의 새로운 SaaS 카테고리가 될지. 결정 포인트가 IDE 선택에서 메모리·스킬 셋업으로 옮겨가는 흐름은 이미 시작됐다.

참고

핵심 리포지토리

rohitg00/agentmemory · 홈페이지 agent-memory.dev
addyosmani/agent-skills

관련 에이전트 / 클라이언트

Claude Code · Cursor · Cline · Windsurf
Gemini CLI · Codex · OpenCode · Goose · Roo Code
GitHub Copilot · Kiro IDE

프로토콜과 표준

Model Context Protocol (MCP)
OWASP — security-auditor 페르소나의 기준

벤치마크 / 임베딩

논문: LongMemEval (arXiv:2410.10813, ICLR 2025)
sentence-transformers/all-MiniLM-L6-v2 — agentmemory의 로컬 임베딩 모델