Triton 中的融合 Softmax📅 2026年04月20日 · 📝 2026年04月22日 · ☕ 5 分钟 · ✍️ k4i如何在 Triton 中编写融合 softmax kernel,消除冗余内存访问,性能超越 PyTorch 原生实现。