Published onDecember 31, 2025提示缓存:10倍更便宜的 LLM Token,原理是什么?ai深入解析 LLM 的提示缓存机制,了解 KV 缓存如何工作,为什么能节省成本并降低延迟,以及 OpenAI 和 Anthropic 不同的缓存策略。
Published onDecember 31, 2025从文本到词元:分词管道的工作原理ai深入解析搜索引擎中的分词流程,了解文本如何经过大小写转换、字符折叠、分词、停用词过滤和词干提取等步骤,最终转化为可搜索的词元。
Published onSeptember 5, 2025GPU网络通信基础aigpu深入解析大规模AI训练中的GPU网络通信原理、架构设计与优化策略,包括Scale Out/Up方案、层次化交换机拓扑以及通信模式。
Published onMay 27, 2025大型语言模型 (LLM) 与人工智能体 (Agent) 技术深度研究报告ai本报告系统梳理了 LLM 与 AI Agent 的核心概念、架构模块、工作流设计及选型评估,兼顾理论深度与实际应用示例。