logo

All Posts

  • Published on
    本文介绍了针对Databricks集群在高并发场景下的优化策略。主要包括两个层面:集群优化(启用Photon加速、Delta缓存、高并发模式等)和代码优化(合理使用UDFs、collect()、广播变量、分区调优等)。通过这些措施可以显著提升集群性能,建议根据实际场景选择合适的优化组合。
  • Published on
    树状数组是一种高效的数据结构,用于处理前缀和查询和单点修改的问题。它通过二进制分段的方式,实现高效的修改和查询操作。相比线段树,它的实现更简单,常数更小,但功能相对受限。在实际应用中,如果问题可以用树状数组解决,它通常是比线段树更好的选择。
  • Published on
    线段树是一种高效的数据结构,用于处理区间查询和修改操作。它通过将区间划分为多个小区间,并用树状结构管理这些区间的数据,从而在查询和修改操作之间取得了很好的平衡。
  • Published on
    InnoDB 是 MySQL 的默认存储引擎,提供了 ACID 事务支持、行级锁定、外键约束等特性。通过多版本并发控制(MVCC)机制实现了高并发性能,同时保证了数据的一致性和可靠性。
  • Published on
    加密邮件协议(SMTP、POP3、IMAP)可通过特定端口号、SNI、服务器证书信息和流量模式来识别。SMTP 通常使用 465 或 587 端口,POP3 使用 995 端口,IMAP 使用 993 端口。分析 TLS 握手特征和证书的 Common Name 也有助于识别。这种识别对网络管理、安全分析和性能优化至关重要,能帮助更好地理解和管理网络通信。