FlashAttenty-4 在NVIDIA Blackwell GPU上点击 1,605个TFLOPSBitRSS2026年1月22日分享NVIDIA的FlashAttention-4在布莱克韦尔芯片上实现了71%的硬件效率,为AI培训工作量提供比FA2快3.6x. (多读)