Módosítások

Intel Xeon Phi

908 bájt hozzáadva, 2016. május 3., 11:28
Offload
</pre>
Ekkor minden memória területet 2x kell másolni, egyszer fel a kártyára, majd másodszor vissza a hoszt gépre, pedig elegendő lenne csak az eredmény vektort visszamásolni. Ezen optimalizálással egy későbbi fejezetben foglalkozunk.<p /> Futás során kaphatunk részletes riportot is, hogy pontosan milyen adatmozgatások történnek az alkalmazás futása során. Ehhez nincs szükség másra csak az '''OFFLOAD_REPORT''' környezeti változó megfelelő beállítása. A beállított értékek 1, 2 vagy 3 lehetnek, attól függően mennyire részletes riportot szeretnénk kapni. <br />beállítás:<pre>export OFFLOAD_REPORT=3</pre>példa kimenet a hello alkalmazásra:<pre>Hello world from host![Offload] [MIC 0] [File] hello_offload.cc[Offload] [MIC 0] [Line] 5[Offload] [MIC 0] [Tag] Tag 0Hello world from coprocessor![Offload] [HOST] [Tag 0] [CPU Time] 0.554653(seconds)[Offload] [MIC 0] [Tag 0] [CPU->MIC Data] 0 (bytes)[Offload] [MIC 0] [Tag 0] [MIC Time] 0.000140(seconds)[Offload] [MIC 0] [Tag 0] [MIC->CPU Data] 0 (bytes)Bye</pre>
====Offload + OpenMP====
98
szerkesztés

Navigációs menü