Ir al contenido

Pregunta

Feliz lunes de trabajo y problemas! jaja

 

Quería plantearos una duda con la que me llevo comiendo la cabeza este fin de semana desde que me surgió en el trabajo, la cosa es:

 

Estoy probando diferente herramientas de benchmark para monitorizar CPU, disco, ram, etc.

 

El caso que probando una de estas herramientas hemos detectado que algunos de los nodos que tenemos en el cluster están dando un problema con sus Glops, usando el "Linpack" me da una media de 750 Gflops por nodo con 30.000 matrices en 25s. Pero usando la misma configuración hemos visto que algún nodo funciona mal y su media baja hasta los 350, e incluso hasta los 40! tardando hasta 8 minutos, que en comparación de los 25 segundos es una eternidad.

 

La cosa es; he comprobado que no hubiera subprocesos activos, monitorizado la carga de caché, si la CPU funcionaba correctamente, todo! lo único que hemos visto es que los "governos" en vez de estar en modo "ondemand" se ponen en modo "userspace", por tanto la conclusión es que tiene que ser algo de la frecuencia de la CPU y los governors cuando les da el punto de ponerse de forma extraña, el problema es que no tenemos claro que es lo que les pasa.

 

Si alguien tiene una idea de qué podría ver o hacer para tratar de solucionar esto sería de agradecer.

 

También hemos pensado que pueda ser el turbo boost de los procesadores, que interfieran de alguna forma con los governors y estes se ralenticen, pero no hemos encontrado evidencia de que sea eso.

 

pd. Como nota decir que si reiniciamos el nodo, este vuelve a la normalidad y su media sigue en los 750 Gflops.

 

 

Compartir este post


Enlace al post
Compartir en otros sitios

2 respuestas a esta pregunta

Recommended Posts

  • 0

No tengo mucha idea de hardware. Buscando por tus palabras clave he encontrado estas dos entradas:

 

Debian wiki

 

Arch wiki

 

En ambos casos, depende del chip y del kernel.

 

No sé si te servirá de algo, y si ya has visto lo que se comenta en ellas   :)

Compartir este post


Enlace al post
Compartir en otros sitios

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Invitado
Responder esta pregunta...

×   Has incluido contenido con formato.   Eliminar formato

  Sólo se permiten 75 emoticonos como máximo.

×   Tu enlace ha sido insertado automáticamente.   Deshacer y mostrar como enlace

×   Su contenido anterior ha sido restaurado.   Limpiar editor

×   No puedes pegar imágenes directamente. Súbelas a algún hosting de imágenes y pega la dirección URL


×
×
  • Crear Nuevo...