„Intel Xeon Phi” változatai közötti eltérés

Innen: KIFÜ Wiki
(Hardver bemutatása)
(Hardver bemutatása)
3. sor: 3. sor:
 
==Hardver bemutatása==
 
==Hardver bemutatása==
 
Intel® Xeon Phi™ Coprocessor 7120P
 
Intel® Xeon Phi™ Coprocessor 7120P
 +
<gallery>
 +
Fájl:Xeon-phi-family-rwd.png.rendition.intel.web.720.405.png|
 +
</gallery>
 +
 
{| class="wikitable" border="1"
 
{| class="wikitable" border="1"
 
|-
 
|-

A lap 2016. május 2., 12:54-kori változata

Az oldalon található információk segítséget nyújtanak a HPC felhasználóinknak, hogy alkalmazásaikat miként portolhatják valamint optimalizálhatják a hatékonyabb futást szem előtt tartva Intel Xeon Phi koprocesszor kártyákon.

Hardver bemutatása

Intel® Xeon Phi™ Coprocessor 7120P

CPU threads/Core max threads CPU Freq Memória L1 cache L2 cache Interfész
64 4 Hardver 244 1238 GHz 16GB GDDR5 32KB/core 512KB/core PCIe
OpenMP-nél csak 240 ~100 cycles

~174 GB/s

~3 cycles ~10 cycles ~7 GB/s

~1 microsecond

Használati módok

támogatott mód

Offload

Offload + OpenMP

támogatott, de nem preferált használat

automatikus kódátvitel

BUDAPEST2[cn10] phi (0)$ export SINK_LD_LIBRARY_PATH=/opt/intel/composerxe/compiler/lib/mic BUDAPEST2[cn10] phi (0)$ micnativeloadex hello_phi Hello world! I have 244 logical cores. BUDAPEST2[cn10] phi (0)$

nem támogatott mód

közvetlen natív használat

Alkalmazások optimalizálása a kártyára

Ebben a fejezetben optimalizálási lehetőségeket mutatunk be, melyek segítségül szolgálhatnak az egyes alkalmazások hatékonyabb futása érdekében ezzel jobban kihasználni a rendelkezésre álló erőforrások adta számítási kapacitás.

Hosszredukció

Vektorizáció

SIMD

AoS -> SoA

Hatékony hossz választás

"Héj ciklusok" kiköszöbölése

Regularizáció

Párhuzamosítás

Párhuzamos szálak ütemezése

Ciklus kifejtés

Automatikus ciklusösszevonás