[Parallel-Hackers] Fwd: tensor vs cuda cores
Hugo Ameln
hugova at stacken.kth.se
Thu Sep 25 18:49:06 CEST 2025
Hejsan vi har ju börjat och implementera matris-multiplikation för att
förstå cuda-c/c++ och hur cuda-cores funkar. Jag har undersökt hur vi
borde göra detta i vårt faktiska program och svaret är tensor-cores.
Till skilnad från cuda-cores så är dem byggda för specifika tensor
operationer. Detta innebär b.l.a att matrismultiplikation är inbyggt i
hårdvaran på ett väldigt snabbt sätt!
Ni kan hitta mer information här
https://docs.nvidia.com/cuda/cutensor/latest/getting_started.html
det finns så klart en HIP-Tensor ekvivalent implementation här:
https://rocm.docs.amd.com/projects/hipTensor/en/latest/
Det kan vara smart att också experimentera med tensor-cores, ugh så
mycket att göra!
mvh Hugo :)
More information about the Parallel-Hackers
mailing list