Módosítások

NIIF szuperszámítógépek használata

501 bájt hozzáadva, 2013. október 15., 11:36
Az ütemező használata
Számláink állapotáról a következő paranccsal kapunk információt:
<code>
sbalance
</code>
A parancs Bob számára a következő táblázatot jeleníti meg. A felhasználó két számlához (foobar,barfoo) is hozzáfér. Saját magát megcsillagozva látja a listában. Bobbal mindkét számlán (Account oszlop) Alice is osztozik. A második oszlopban (Usage) az egyes felhasználók elhasznált gépideje, a negyeik oszlopban pedig a számla összesített gépideje látható. Az utolsó két oszlop a maximális (Account Limit) és a még alérhető (Available) gépidőről ad tájékoztatást.
<pre>
sbalance
 
Scheduler Account Balance
---------- ----------- + ---------------- ----------- + ------------- -----------
Nagyüzemi (production) futtatások előtt gépidőbecslést érdemes végezni. Ehhez a következő parancs használható:
<code>
sestimate -N NODES -t WALLTIME
</code>
ahol a <code>NODES</code> a lefoglalni kívánt node-ok száma, a <code>WALLTIME</code> pedig a futás maximális ideje.
Az ütemezőben lévő jobokról az <code>squeue</code>, a klaszter általános állapotáról az <code>sinfo</code> parancs ad tájékoztatást. Minden beküldött jobhoz egy egyedi azonosítószám (JOBID) rendelődik. Ennek ismeretében további információkat kérhetünk. Feladott vagy már futó job jellemzői:
<code>
scontrol show job JOBID
</code>
Minden job egy ún. számlázási adatbázisba (accounting) is bekerül. Ebből az adatbázisból visszakereshetők a lefuttatott feladatok jellemzői és erőforrás-felhasználás statisztikái. A részletes statisztikát a következő paranccsal tudjuk megnézni:
<code>
sacct -l -j JOBID
</code>
A felhasznált memóriáról a következő parancs ad tájékoztatást:
<code>
smemory JOBID
</code>
A lemezhasználatról pedig a
<code>
sdisk JOBID
</code>
 
==== Példa ====
Ennek a 2 node-os batch jobnak a jellemző memóriaterhelés a következő volt: kb. 10GB virtuális és 6.5GB RSS memóriát használt el node-onként.
<pre>
smemory 430
 
MaxVMSize MaxVMSizeNode AveVMSize MaxRSS MaxRSSNode AveRSS
---------- -------------- ---------- ---------- ---------- ----------
10271792K cn06 10271792K 6544524K cn06 6544524K
10085152K cn07 10085152K 6538492K cn07 6534876K
</pre>
=== Feladatok futtatása ===
</pre>
ahol az <code>ACCOUNT</code> a terhelendő számla neve (elérhető számláinkről az <code>sbalance</code> parancs ad felvilágosítást), a <code>NAME</code> a job rövid neve, a <code>TIME</code> pedig a maximális walltime idő (<code>DD-HH:MM:SS</code>).
 
A jobok feladását a következő parancs végzi:
<code>
sbatch jobscript.sh
</code>
 
Sikeres feladás esetén a következő kimenetet kapjuk:
</pre>
ahol a <code>JOBID</code> a feladat egyedi azonosítószáma.
 
A feladat leállítását a következő parancs végzi:
<code>
scancel JOBID
</code>
 
==== Tömbfeladatok (arrayjob) ====
214
szerkesztés

Navigációs menü