logo

All Posts

  • Published on
    深入解析搜索引擎中的分词流程,了解文本如何经过大小写转换、字符折叠、分词、停用词过滤和词干提取等步骤,最终转化为可搜索的词元。
  • Published on
    B树是一种自平衡树数据结构,专为磁盘存储优化。与二叉搜索树不同,B树的每个节点可以有成百上千个子节点,这大大减少了树的深度,使得在磁盘上的查找效率显著提高。本文深入解析B树的设计原理、实现细节,以及为什么50多年来它一直是数据库索引的首选数据结构。
  • Published on
    本文介绍如何使用现有数据库构建一个简单而高效的搜索引擎。通过分词、索引和权重系统,实现一个不需要外部服务、易于理解和调试的搜索解决方案。
  • Published on
    Go 1.25 引入了新的 http.CrossOriginProtection 中间件到标准库中,这让我们思考:是否已经到了可以在不依赖基于令牌的检查(如双重提交cookie)的情况下防止 CSRF 攻击的时候?是否可以在不引入第三方包的情况下构建安全的 Web 应用程序?答案可能是谨慎的"是"——只要满足几个重要条件。