FlashAttention-4 frappe 1,605 TFLOPS sur les processeurs NVIDIA Blackwell
FlashAttention-4 de NVIDIA atteint 71% d'efficacité matérielle sur les puces Blackwell, fournissant 3,6x de accélération sur FA2 pour les charges de travail d'entraînement en AI. (En savoir plus)





