98
szerkesztés
Módosítások
→Hatékony hossz választás
if (n % 16 != 0) lda += (16 - n%16); // most lda%16==0
float* A = _mm_malloc(sizeof(float)*n*lda, 64);
// használat
for (int i = 0; i < n; i++)
for (int j = 0; j < n; j++)
A[i*lda + j] = ...
</pre>