Data Jinshi 24 Februari, DeepSeek hari ini meluncurkan 'Minggu Sumber Terbuka', dengan repositori kode pertama yang menjadi Flash MLA - inti dekode MLA efisien yang dioptimalkan untuk GPU Hopper, dirancang khusus untuk menangani urutan panjang yang dapat bervariasi. Menurut penjelasan, inspirasi dari Flash MLA berasal dari FlashAttention 2&3 dan proyek cutlass.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
2 Suka
Hadiah
2
1
Bagikan
Komentar
0/400
ZhaoZhao
· 02-24 02:24
Data Jinshi 24 Februari, DeepSeek hari ini meluncurkan "Minggu Sumber Terbuka", repositori kode Sumber Terbuka pertama adalah Flash MLA - inti dekompresi MLA efisien yang dioptimalkan untuk GPU Hopper, dirancang khusus untuk mengolah urutan panjang variabel. Menurut informasi, inspirasi Flash MLA berasal dari FlashAttention 2&3 dan proyek cutlass.
DeepSeek memulai Minggu Sumber Terbuka
Data Jinshi 24 Februari, DeepSeek hari ini meluncurkan 'Minggu Sumber Terbuka', dengan repositori kode pertama yang menjadi Flash MLA - inti dekode MLA efisien yang dioptimalkan untuk GPU Hopper, dirancang khusus untuk menangani urutan panjang yang dapat bervariasi. Menurut penjelasan, inspirasi dari Flash MLA berasal dari FlashAttention 2&3 dan proyek cutlass.