Módosítások

Intel Xeon Phi

96 bájt hozzáadva, 2016. május 3., 13:50
Hatékony hossz választás
if (n % 16 != 0) lda += (16 - n%16); // most lda%16==0
float* A = _mm_malloc(sizeof(float)*n*lda, 64);
 
// használat
for (int i = 0; i < n; i++)
for (int j = 0; j < n; j++)
A[i*lda + j] = ...
</pre>
98
szerkesztés

Navigációs menü