Attention Sandbox

通过可调参数观察注意力权重如何变化,理解上下文聚焦行为。

核心概念

缩放点积注意力可视化

难度

入门

状态

已发布

阅读时长

约 1 分钟

更新日期

2026/03/17

交互仿真

直接动手调参,观察变量变化与行为差异。

Attention Sandbox

调节参数,观察不同 token 之间的注意力权重如何变化。

注意力矩阵(Q -> K)

当前 Query 的权重分布

关联主题

模拟目标

  • 观察不同 query 与 key 对齐后的权重变化
  • 对比温度系数对分布尖锐程度的影响

交互参数

  • Token 数量
  • 向量维度
  • 温度系数
  • Query 观察索引

建议实验

  1. 固定 token 和维度,降低温度,观察分布是否更尖锐。
  2. 固定温度,提升维度,观察权重是否更平滑。
  3. 修改 token 序列并重新采样,比较不同语义排列的注意力变化。

配套内容

建议配合这些教程、路径和论文一起学习,理解会更连贯。