FlashAttention-4: 1605 TFLOPS на графических процессорах NVIDIA Blackwell
FlashAttention-4 от NVIDIA достигает 71% аппаратной эффективности на чипах Blackwell, обеспечивая 3,6-кратное ускорение по сравнению с FA2 для учебных нагрузок ИИ. (Читать далее)






