第七章:HTTP API 层原理

Dynamo 的 HTTP API 层提供 OpenAI 兼容的 REST API 接口,支持流式响应和动态模型管理。

本章概述

本章深入解析 Dynamo 的 HTTP API 层,包括 REST API 基础、HTTP Server 设计、OpenAI 兼容 API、流式响应处理以及错误处理。


子文档列表

序号文件主题内容简介
101-rest-api-basics.mdREST API 基础REST 原则、SSE、OpenAI 规范
202-http-server-design.mdHTTP Server 设计Axum、DeploymentState、路由
303-openai-compatible-api.mdOpenAI 兼容 APIchat/completions、models、nvext
404-streaming-response.md流式响应处理SSE 实现、断开检测、Token 聚合
505-error-handling.md错误处理HttpError、响应格式

阅读顺序建议

flowchart LR A["01-REST API 基础"] --> B["02-HTTP Server 设计"] B --> C["03-OpenAI 兼容 API"] C --> D["04-流式响应处理"] D --> E["05-错误处理"] style A fill:#e1f5fe style B fill:#e1f5fe style C fill:#fff3e0 style D fill:#fff3e0 style E fill:#e8f5e9

关键概念速查

概念说明详见文档
SSEServer-Sent Events 流式传输01-rest-api-basics.md
AxumRust HTTP 框架02-http-server-design.md
ModelManager动态模型管理器02-http-server-design.md
chat/completions聊天补全 API03-openai-compatible-api.md
nvextNVIDIA 扩展字段03-openai-compatible-api.md
DeltaGenerator增量响应生成器04-streaming-response.md

架构总览

graph TB subgraph http["HTTP 层"] Axum["Axum Router"] Chat["/v1/chat/completions"] Models["/v1/models"] Health["/health"] end subgraph state["状态管理"] ModelMgr["ModelManager"] DeployState["DeploymentState"] end subgraph handler["处理器"] ChatHandler["Chat Handler"] StreamHandler["Stream Handler"] DeltaGen["DeltaGenerator"] end subgraph backend["后端"] Engine["LLM Engine"] end Axum --> Chat Axum --> Models Axum --> Health Chat --> ChatHandler ChatHandler --> ModelMgr ModelMgr --> DeployState ChatHandler --> StreamHandler StreamHandler --> DeltaGen DeltaGen --> Engine

API 端点列表

端点方法说明
/v1/chat/completionsPOST聊天补全
/v1/completionsPOST文本补全
/v1/modelsGET模型列表
/v1/models/{id}GET模型详情
/healthGET健康检查
/metricsGETPrometheus 指标

总索引

完成本章阅读后,您已完成 Dynamo 架构分析的全部内容。返回 总索引 查看完整文档结构。