Ai

Published on
December 31, 2025
提示缓存：10倍更便宜的 LLM Token，原理是什么？
ai
深入解析 LLM 的提示缓存机制，了解 KV 缓存如何工作，为什么能节省成本并降低延迟，以及 OpenAI 和 Anthropic 不同的缓存策略。
Published on
December 31, 2025
从文本到词元：分词管道的工作原理
ai
深入解析搜索引擎中的分词流程，了解文本如何经过大小写转换、字符折叠、分词、停用词过滤和词干提取等步骤，最终转化为可搜索的词元。
Published on
September 5, 2025
GPU网络通信基础
ai gpu
深入解析大规模AI训练中的GPU网络通信原理、架构设计与优化策略，包括Scale Out/Up方案、层次化交换机拓扑以及通信模式。
Published on
May 27, 2025
大型语言模型 (LLM) 与人工智能体 (Agent) 技术深度研究报告
ai
本报告系统梳理了 LLM 与 AI Agent 的核心概念、架构模块、工作流设计及选型评估，兼顾理论深度与实际应用示例。

提示缓存：10倍更便宜的 LLM Token，原理是什么？