Verificare che le attività siano eseguite

Non so come spiegarlo. Una volta che si avvia decine o hundres di server, ognuno dei quali esegue una sorta di lavori periodici (per lo più da cron), c'è un problema di assicurarsi (o nel modo più sicuro ansible) che queste attività siano effettivamente eseguite. Voglio dire, ricevi un'email se un lavoro non riesce, e se non riesce, non c'è posta se non funziona per qualsiasi ragione. Certo, potrei cambiarli e farli submit un'email "correttamente corsa", solo per essere invasa da posta che la maggior parte del tempo non voglio vedere.

In sostanza, voglio essere notificata solo se:

  • Come mantenere il cron da stamping?
  • È ansible configurare cron (su linux) per leggere un utente crontab da un file controllato in un'applicazione?
  • Come salvare ed uscire da crontab -e?
  • Tecniche per monitorare le attività di cron?
  • logrotate cron lavoro che non ruota determinati registri
  • Impedisci che i lavori di cron duplicati siano in esecuzione
    • un task ha funzionato e fallito
    • un task non è stato eseguito al momento previsto.

    C'è un modo per fare questo?

    2 Solutions collect form web for “Verificare che le attività siano eseguite”

    Suppongo che tu stai utilizzando un sistema UNIX / LINUX se stai utilizzando il cron, quindi il modo più semplice per monitorare "un'attività non correre al momento previsto" è la logging remota a un server di log (?), Qualcosa del genere nel tuo syslog.conf:

     cron.!=info; @logserver.yourdomain.tld 

    Quindi è ansible esplorare tali registri per errori o semplicemente aggiungere uno script di analisi del log per eseguire questo lavoro.

    Ma in each caso ci sarà sempre possibilità che la logging sia rotta e tu non ricevi solo messaggi di errore.

    Non credo che ci sia già qualcosa di fatto. Potresti impostare tutte le attività per registrare in un singolo file il loro stato: timestamp, server, task, stato, altre informazioni.

    E che tu analizzi questo file periodicamente e invia un messaggio di posta elettronica quando lo stato è fallito o avviso o le attività hanno vecchi timestamp. Per essere sicuri che questo script sia stato riuscito, invierà un'email anche se tutto è ok.

    In questo modo non sanetworking inondati da email, sarà solo una e-mail di volta in volta.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.