Módosítások

Debrecen2 GPU klaszter en

107 bájt törölve, 2021. június 24., 12:02
nincs szerkesztési összefoglaló
sbalance
</pre>
A második oszlopban The second column (Usage) az egyes felhasználók elhasznált gépidejeshows the machine time spent by each user, a negyedik oszlopban pedig a számla összesített gépideje láthatóand the fourth column shows the total machine time of the account. Az utolsó két oszlop a maximális The last two columns provide information about the maximum (Account Limit) és a még elérhető (Available) gépidőről ad tájékoztatástand available machine time.
<pre>
Scheduler Account Balance
</pre>
=== A gépidő becslése Estimating CPU time ===Nagyüzemi It is advisable to estimate the wall clock time before large-scale (production) futtatások előtt gépidőbecslést érdemes végezniruns. Ehhez a következő parancs használhatóTo do this, use the following command:
<pre>
sestimate -N NODES -t WALLTIME
</pre>
ahol a <code>NODES</code> a lefoglalni kívánt node-ok száma, a <code>WALLTIME</code> pedig a futás maximális ideje.
'''Fontos, hogy a lefoglalni kívánt gépidőt a lehető legpontosabban adjuk meg, mivel az ütemező ez alapján where <code>NODES</code> is rangsorolja a futtatásra váró feladatokat. Általában igaz, hogy a rövidebb job hamarabb sorra kerül. Érdemes minden futás idejét utólag az the number of nodes to be reserved and <code>sacctWALLTIME</code> paranccsal is ellenőriznithe maximum run time.'''
'''It is important to specify the wall clock time you want to reserve as accurately as possible, as the scheduler also ranks the jobs waiting to be run based on this. It is generally true that the shorter job will take place sooner. It is advisable to check the actual run time with the <code>sacct</code> command afterwards.''' === Állapotinformációk Status information ===Az ütemezőben lévő jobokról az The <code>squeue</code>, a klaszter általános állapotáról az and the <code>sinfo</code> parancs ad tájékoztatástcommand provide information about the general state of the cluster. Minden beküldött jobhoz egy egyedi azonosítószám Each job submitted is assigned a unique identification number (JOBID) rendelődik. Ennek ismeretében további információkat kérhetünkKnowing this, we can ask for more information. Feladott vagy már futó Characteristics of the submitted or already running job jellemzői:
<pre>
scontrol show job JOBID
</pre>
Minden Each job egy ún. számlázási adatbázisba (accounting) is bekerül. Ebből az adatbázisból visszakereshetők also put into a lefuttatott feladatok jellemzői és erőforrásso-felhasználás statisztikáicalled accounting database. A részletes statisztikát a következő paranccsal tudjuk megnézniFrom this you can retrieve the characteristics of the jobs you have run and the statistics of resource usage. You can view detailed statistics with the following command:
<pre>
sacct -l -j JOBID
</pre>
A felhasznált memóriáról a következő parancs ad tájékoztatástThe following command provides information about the memory used:
<pre>
smemory JOBID
</pre>
A lemezhasználatról pedig aThe next one shows disk usage:
<pre>
sdisk JOBID
</pre>
==== Slurm figyelmeztető üzenetek SLURM warnings ====
<pre>
Resources/AssociationResourceLimit - Erőforrásra vár

Navigációs menü