第四章:KV Cache 管理与路由

Dynamo 的 KV Cache 系统提供智能路由、RadixTree 索引和多层存储能力。

本章概述

本章深入解析 Dynamo 的 KV Cache 管理系统,包括 KV Cache 原理、优化技术综述、KV-Aware Router、RadixTree 索引、KV Cache Manager 以及事件系统。


子文档列表

序号文件主题内容简介
101-transformer-kv-cache.mdKV Cache 原理Self-Attention 中的 KV Cache
202-kv-optimization-survey.md优化技术综述PagedAttention、Prefix Caching、Offloading
303-kv-aware-router.mdKV-Aware Router路由问题、评分机制、代价函数
404-radix-tree-indexing.mdRadixTree 索引RadixTree、Block Hash、KvIndexer
505-kv-cache-manager.mdKV Cache ManagerV1/V2 架构、块类型、多层存储
606-kv-event-system.mdKV 事件系统事件类型、Publisher、Aggregator

阅读顺序建议

flowchart LR A["01-KV Cache 原理"] --> B["02-优化技术综述"] B --> C["03-KV-Aware Router"] C --> D["04-RadixTree 索引"] D --> E["05-KV Cache Manager"] E --> F["06-KV 事件系统"] style A fill:#e1f5fe style B fill:#e1f5fe style C fill:#fff3e0 style D fill:#fff3e0 style E fill:#e8f5e9 style F fill:#e8f5e9

关键概念速查

概念说明详见文档
KV Cache存储历史 Key/Value 的缓存01-transformer-kv-cache.md
PagedAttentionvLLM 的分页 KV 管理02-kv-optimization-survey.md
Prefix Caching前缀复用技术02-kv-optimization-survey.md
KV-Aware Router基于 KV 命中的智能路由03-kv-aware-router.md
RadixTree前缀索引数据结构04-radix-tree-indexing.md
KvIndexer分布式 KV 索引器04-radix-tree-indexing.md

架构总览

graph TB subgraph router["路由层"] KVRouter["KV-Aware Router"] Indexer["KvIndexer
RadixTree"] end subgraph manager["管理层"] KVManager["KV Cache Manager"] BlockAlloc["Block Allocator"] end subgraph storage["存储层"] GPU["GPU HBM"] CPU["CPU DRAM"] SSD["NVMe SSD"] end subgraph event["事件层"] Publisher["KV Event Publisher"] NATS[("NATS")] Aggregator["Event Aggregator"] end KVRouter --> Indexer KVRouter --> KVManager KVManager --> BlockAlloc BlockAlloc --> GPU BlockAlloc --> CPU BlockAlloc --> SSD KVManager --> Publisher Publisher --> NATS NATS --> Aggregator Aggregator --> Indexer

下一章

完成本章阅读后,建议继续阅读 第五章:分布式通信机制,了解 Dynamo 的通信架构。