Featured image of post AI 코딩 에이전트의 OS 레이어 — agentmemory와 agent-skills 같은 날 동시 등장

AI 코딩 에이전트의 OS 레이어 — agentmemory와 agent-skills 같은 날 동시 등장

같은 시각 30초 간격으로 등장한 두 GitHub 도구 agentmemory와 agent-skills를 메모리 인프라와 워크플로 강제력이라는 두 레이어로 비교 정리한 분석

개요

같은 시각 30초 간격으로 등장한 두 GitHub 링크. 둘 다 “AI 코딩 에이전트의 ergonomic 결함"을 풀려는 도구지만, 노리는 결함이 다르다. rohitg00/agentmemory는 세션 간 메모리 인프라를, addyosmani/agent-skills는 시니어 엔지니어의 워크플로 강제력을 푼다. 묶어서 보면 에이전트 시대의 OS 레이어가 모양을 갖추고 있다.

1. agentmemory — 영속 메모리, MCP로 모든 에이전트와 공유

rohitg00/agentmemory"#1 Persistent memory for AI coding agents based on real-world benchmarks” 를 표방한다. 2026-02-25 생성, 약 2,400 stars, Apache 2.0. 홈페이지는 agent-memory.dev.

풀려는 문제

  • 매 세션마다 아키텍처를 다시 설명해야 함
  • 같은 버그를 다시 발견함
  • 같은 선호(라이브러리 선택, 코드 스타일)를 다시 가르쳐야 함
  • CLAUDE.md.cursorrules 같은 빌트인 메모리는 200줄 cap에 stale

작동 방식

에이전트가 한 일을 silently capture → 압축 → 검색 가능한 메모리로 저장 → 다음 세션 시작 시 적절한 컨텍스트만 inject. 핵심은 단일 MCP 서버 1개만 띄우면 16개 이상 에이전트가 같은 메모리를 공유한다는 것.

지원되는 클라이언트:

임베딩은 로컬 all-MiniLM-L6-v2를 사용 → API 키 필요 없음, 무료.

벤치마크 — LongMemEval-S

LongMemEval (ICLR 2025, 500 questions) 결과:

지표agentmemoryBM25 fallback
R@595.2%86.2%
R@1098.6%
MRR88.2%

임베딩 + 하이브리드가 단순 키워드 BM25보다 R@5 기준 9%p 높다.

토큰 절감

방식연간 토큰연간 비용
풀 컨텍스트 paste19.5M+컨텍스트 window 초과
LLM-summarized~650K~$500
agentmemory~170K~$10
agentmemory + local embed~170K$0

시작

npx @agentmemory/agentmemory

의미

이 도구의 핵심 베팅은 한 줄로 정리된다 — “메모리는 에이전트가 아니라 인프라 레이어에 있어야 한다.” 에이전트별로 메모리를 짜는 대신 MCP 서버 1개로 모든 에이전트가 공유하면, Claude Code 세션에서 학습한 게 다음 Cursor 세션에 그대로 흘러간다. 50일 전쯤 viral한 GitHub gist(1,050 stars)에서 시작 → 그 디자인 문서를 코드로 구현한 형태. Karpathy의 LLM Wiki 패턴 + confidence scoring + lifecycle + knowledge graph + hybrid search.

2. agent-skills — 시니어 엔지니어의 워크플로를 스킬로 패키징

addyosmani/agent-skills“Production-grade engineering skills for AI coding agents.” 를 표방한다. 2026-02-15 생성, 약 33,500 stars, MIT. 동일 시점 비교에서 agentmemory보다 14배 많은 stars — 워크플로 표준 후보로 가장 빠르게 모이는 곳이다.

풀려는 문제

“에이전트가 코드를 짜기는 짜는데, 시니어가 한 것 같지 않다.”

  • 스펙 없이 바로 코드 짠다
  • 테스트를 안 짠다
  • 보안 고려가 없다
  • 큰 PR을 한 번에 던진다

6단계 라이프사이클

DEFINE → PLAN → BUILD → VERIFY → REVIEW → SHIP
/spec   /plan   /build   /test    /review  /ship

각 슬래시 커맨드 = 라이프사이클 한 단계 → 필요한 스킬을 자동 활성화.

20개 스킬 분류

  • Define: idea-refine, spec-driven-development
  • Plan: planning-and-task-breakdown
  • Build: incremental-implementation, test-driven-development, context-engineering, source-driven-development, frontend-ui-engineering, api-and-interface-design
  • Verify: browser-testing-with-devtools, debugging-and-error-recovery
  • Review: code-review-and-quality, code-simplification, security-and-hardening, performance-optimization
  • Ship: git-workflow-and-versioning, ci-cd-and-automation, deprecation-and-migration, documentation-and-adrs, shipping-and-launch

어디서 동작하나

Agent Personas

  • code-reviewer — Senior Staff Engineer 관점, “would a staff engineer approve this?”
  • test-engineer — QA, Prove-It 패턴
  • security-auditorOWASP, threat modeling

의미

agent-skills의 베팅은 “에이전트는 LLM 무게가 아니라 워크플로의 강제력에서 차이가 난다.” TDD를 “할 수 있다” 가 아니라 “Red-Green-Refactor를 안 하면 코드가 안 나간다” 같은 강제 흐름으로 만든다. 코드 리뷰도 5축 review, 100줄 단위 size, Nit/Optional/FYI severity 라벨 같은 구체 룰. Markdown만으로 풀어서 에이전트 종속성 zero — Claude/Cursor/Gemini 다 같은 스킬을 쓸 수 있다. 33K 스타가 말해주듯 현재 에이전트 워크플로 표준에 가장 가까운 후보다.

3. 두 도구 비교

항목agentmemoryagent-skills
누가rohitg00addyosmani
무엇TypeScript 라이브러리 + MCP 서버Markdown 스킬 번들
라이선스Apache 2.0MIT
Stars (2026-05)~2,400~33,500
생성2026-02-252026-02-15
도메인메모리/상태 인프라엔지니어링 워크플로
종속성 끊는 방식MCP 표준Markdown 표준

4. 묶어서 본 의미 — 에이전트 시대의 OS 레이어

3-4년 전 “어떤 IDE 쓰지?” 가 결정 포인트였다면, 이제는 “어떤 메모리 + 스킬 셋업?” 이 결정 포인트가 되고 있다. 둘 다 모델 종속성을 의도적으로 끊어두고 (MCP와 Markdown), 모델은 갈아치울 수 있어도 메모리/스킬은 누적되도록 설계한 게 공통점이다.

인사이트

같은 시각 같은 사람이 30초 간격으로 등장시킨 두 링크가 정확히 에이전트 OS 레이어의 다른 두 슬롯을 메우고 있다는 점이 이 디지스트의 핵심이다. agentmemory는 상태를, agent-skills는 프로세스를 인프라 레이어로 끌어내려 모델 위에 올라가는 공통 부품으로 만들었다. 두 도구가 모델 종속성을 의도적으로 끊는 방식 — MCP 서버 하나, Markdown 한 더미 — 도 같은 방향이다. 모델은 갈아치워도 메모리와 스킬은 누적된다는 베팅. 33K vs 2.4K stars 차이는 시점 차가 아니라 워크플로 표준 후보가 메모리 인프라보다 한발 앞서 모이고 있다는 신호로 읽힌다. 다음 분기 흥미로운 질문은 두 가지 — 메모리 표준이 MCP 위에서 단일화될지, 그리고 agent-skills 같은 스킬 번들이 IDE 마켓플레이스의 새로운 SaaS 카테고리가 될지. 결정 포인트가 IDE 선택에서 메모리·스킬 셋업으로 옮겨가는 흐름은 이미 시작됐다.

참고

핵심 리포지토리

관련 에이전트 / 클라이언트

프로토콜과 표준

벤치마크 / 임베딩

Hugo로 만듦
JimmyStack 테마 사용 중