„Intel Xeon Phi” változatai közötti eltérés
(→Hardver bemutatása) |
(→Hardver bemutatása) |
||
17. sor: | 17. sor: | ||
! L2 cache | ! L2 cache | ||
! Interfész | ! Interfész | ||
+ | ! Ptot | ||
+ | ! Számítási kapacitás | ||
|- | |- | ||
− | | | + | | 61 |
| 4 Hardver | | 4 Hardver | ||
| 244 | | 244 | ||
26. sor: | 28. sor: | ||
| 512KB/core | | 512KB/core | ||
| PCIe | | PCIe | ||
+ | | 300W | ||
+ | | 1,1 PFlop/s | ||
|- | |- | ||
| | | | ||
37. sor: | 41. sor: | ||
| ~7 GB/s | | ~7 GB/s | ||
~1 microsecond | ~1 microsecond | ||
+ | | | ||
+ | | | ||
|} | |} | ||
+ | |||
+ | Az Intel® 1. generációs Xeon Phi™ koprocesszorában található 61 processzor ugyanazt a 16GB memóriát éri el, de semmilyen módon se fér hozzá közvetlenül a hoszt gép fizikai memóriájához.<br /> | ||
+ | [[Budapest2_klaszter|Budapest2]] és [[HPC#Szupersz.C3.A1m.C3.ADt.C3.B3g.C3.A9peink_.C3.B6sszehasonl.C3.ADt.C3.A1sa|Debrecen3-Phi]] gépeinkben számítási nodonként 2-2 Phi™ koprocesszor található. <br/> | ||
+ | A kártyákon általános célú Linux kernel fut melyre a belépés limitáltan csak a rendszergazdák számára lehetséges SSH-n keresztül a hoszt gépről. Természetesen a kártyára belépve olyan érzésünk lehet, mintha egy sok processzoros gépen dolgoznánk, ami rendelkezik rengeteg memóriával. Ez így is van, de a hatékonyabb kihasználás érdekében az SSH-n keresztüli elérés nem lehetséges, csak a Slurm segítségével valamint a programozási nyelvek által támogatott csatornákon keresztül. Ennek részletezése lentebb megtalálható. | ||
==Használati módok== | ==Használati módok== |
A lap 2016. május 2., 13:21-kori változata
Az oldalon található információk segítséget nyújtanak a HPC felhasználóinknak, hogy alkalmazásaikat miként portolhatják valamint optimalizálhatják a hatékonyabb futást szem előtt tartva Intel Xeon Phi koprocesszor kártyákon.
Tartalomjegyzék
[elrejtés]Hardver bemutatása
Intel® Xeon Phi™ Coprocessor 7120P
CPU | threads/Core | max threads | CPU Freq | Memória | L1 cache | L2 cache | Interfész | Ptot | Számítási kapacitás |
---|---|---|---|---|---|---|---|---|---|
61 | 4 Hardver | 244 | 1238 GHz | 16GB GDDR5 | 32KB/core | 512KB/core | PCIe | 300W | 1,1 PFlop/s |
OpenMP-nél csak 240 | ~100 cycles
~174 GB/s |
~3 cycles | ~10 cycles | ~7 GB/s
~1 microsecond |
Az Intel® 1. generációs Xeon Phi™ koprocesszorában található 61 processzor ugyanazt a 16GB memóriát éri el, de semmilyen módon se fér hozzá közvetlenül a hoszt gép fizikai memóriájához.
Budapest2 és Debrecen3-Phi gépeinkben számítási nodonként 2-2 Phi™ koprocesszor található.
A kártyákon általános célú Linux kernel fut melyre a belépés limitáltan csak a rendszergazdák számára lehetséges SSH-n keresztül a hoszt gépről. Természetesen a kártyára belépve olyan érzésünk lehet, mintha egy sok processzoros gépen dolgoznánk, ami rendelkezik rengeteg memóriával. Ez így is van, de a hatékonyabb kihasználás érdekében az SSH-n keresztüli elérés nem lehetséges, csak a Slurm segítségével valamint a programozási nyelvek által támogatott csatornákon keresztül. Ennek részletezése lentebb megtalálható.
Használati módok
támogatott mód
Offload
Offload + OpenMP
támogatott, de nem preferált használat
automatikus kódátvitel
BUDAPEST2[cn10] phi (0)$ export SINK_LD_LIBRARY_PATH=/opt/intel/composerxe/compiler/lib/mic BUDAPEST2[cn10] phi (0)$ micnativeloadex hello_phi Hello world! I have 244 logical cores. BUDAPEST2[cn10] phi (0)$
nem támogatott mód
közvetlen natív használat
Alkalmazások optimalizálása a kártyára
Ebben a fejezetben optimalizálási lehetőségeket mutatunk be, melyek segítségül szolgálhatnak az egyes alkalmazások hatékonyabb futása érdekében ezzel jobban kihasználni a rendelkezésre álló erőforrások adta számítási kapacitás.