SLIDE 21 INSTITUTO DE BIOCOMPUTACIÓN Y FÍSICA DE SISTEMAS COMPLEJOS
Clusters & Grid computing en entornos de software libre
INSTITUTO DE BIOCOMPUTACIÓN Y FÍSICA DE SISTEMAS COMPLEJOS
Clusters & Grid computing en entornos de software libre
Monitorización: Estado Operacional
Chequeo frecuente (~15 minutos) de los puntos clave que Chequeo frecuente (~15 minutos) de los puntos clave que hacen al cluster operativo hacen al cluster operativo:
: ► Controlar que los daemons del sistema están lanzados
– Generales: nfsserver, portmapd,… – Particulares: pvfsd, dhcpd…
► ¿ Están todos los nodos encendidos ?
– Responden los nodos al “ping”
► Directorios NFS montados adecuadamente
– /home, /pvfs, /usr/local/sys,… accesibles en todo el cluster
Scripts: Shell, PERL,… Scripts: Shell, PERL,…