Si somos administradores de un servidor es problable que de vez en cuando estemos experimentando problemas de hardware que no nos dejan dormir bien por las noches. A veces los servidores caen, y es irremediable, pero lo que no tenemos por qué admitir es que caigan sin avisarnos, dejando nuestra página Web inaccesible durante un periodo indefinido, ya que perderemos usuarios sin darnos cuenta.
Una fantástica solución a este problema sería que el servidor enviara automáticamente en cuanto detecte cualquier problema de estos tipos Error de Comunicaciones entre la CPU y la placa base Error de Memoria – problemas ECC Errores de caché de la CPU o similares ¿Pero cómo configurarlo? A continuación os traigo un script que podréis usar para permitir que el servidor os envíe un email en caso de catástrofe, así podréis controlarlo todo el tiempo, incluso desde vuestro propio teléfono móvil.
Fijaros que tendréis que sustituir el email que aparece en el campo “AEMAIL=” por vuestra propia dirección de correo electrónico. Antes de usarlo asegúrate de tener instalado mcelog. Si aún no lo hiciste, escribe en la terminal yum install mcelog apt-get update && apt-get install mcelog El código que tendrás que usar es el siguiente #!/bin/bash # Linux 64 bit kernel shell script to collect hardware errors via /var/log/mcelog # and send email alert. # ————————————————————————- # Copyright (c) 2008 nixCraft project # This script is licensed under GNU GPL version 2.0 or above # ————————————————————————- # This script is part of nixCraft shell script collection (NSSC) # Visit http//bash.cyberciti.biz/ for more information. # ————————————————————————- # Tested under RHEL and Debian Linux 64 bit version. # mcelog must be installed. # See http//www.cyberciti.biz/tips/linux-server-predicting-hardware-failure.html LOGGER=/usr/bin/logger FILE=/var/log/mcelog AEMAIL=”[email protected]” ASUB=”H/W Error – $(hostname)” AMESS=”Warning – Hardware errors found on $(hostname) @ $(date). See log file for the details /var/log/mcelog.” OK_MESS=”$0 – OK NO Hardware Error Found.” WARN_MESS=”$0 – ERROR Hardware Error Found.” die(){ echo “$@” exit 999 } warn(){ echo $AMESS