È ansible get un elenco di processi in esecuzione con un Cloudwatch Alarm?

Abbiamo un'istanza EC2 (Ubuntu) che dispone di alcune applicazioni basate su Java e recentemente stiamo ottenendo colpi di picchi di utilizzo della CPU che innescano uno dei nostri allarmi Cloudwatch. Nel momento in cui entriamo nel server per esaminare l'utilizzo della CPU, le cose si sono calmate.

Quello che vorremmo vedere in una delle email di allarme è un elenco dei processi in esecuzione e del loro utilizzo della CPU (%) al momento dell'allarme. È anche ansible?

  • Qualcuno ha alcuna esperienza quando si tratta di velocità di Amazon RDS vs MySQL su un piccolo server?
  • Come posso bloccare il traffico in entrata da IP AWS di Amazon?
  • EC2 - guasto hardware
  • Alti carichi della CPU, ma i migliori processi in cima tutto intorno 0%
  • AWS SQS + SNS + Lambda
  • Gruppo di protezione per la modifica di un'istanza aws tramite l'indirizzo IP esterno
  • Perché le istanze EC2 T2 a volte iniziano con crediti a zero CPU
  • Cloudwatch allarga un comportmento strano
  • Impostazione di Amazon Cloudwatch per get un avviso quando il server è in discesa
  • Quali autorizzazioni / criteri per il ruolo IAM da utilizzare con lo script di monitoraggio CloudWatch?
  • archiviare e visualizzare le metriche dell'ambiente amazon ec2 cloudwatch
  • Cloudformation ELB Cloudwatch Allarmi InsufficientData
  • 3 Solutions collect form web for “È ansible get un elenco di processi in esecuzione con un Cloudwatch Alarm?”

    Per rispondere alla tua domanda n. Non è ansible configurare CloudWatch per elencare i processi sul server each volta che viene raggiunta una soglia. Dovresti usare un altro software per farlo. CloudWatch registra solo metriche, ad esempio se si desidera sapere quanti processi sono in esecuzione, è ansible configurare CloudWatch per monitorarlo.

    Vi suggerisco di provare a utilizzare la contabilità dei processi e eseguire in cima per raccogliere istantanee dei dati di sistema each 10 minuti (impostazione predefinita) o ridurre 5 minuti se è necessaria una migliore risoluzione.

    apt-get install atop acct

    Quindi è ansible controllare facilmente che cosa stava succedendo ad un certo punto usando la syntax

    atop -r atop.log.file -b 00:00 -e 00:05

    L'esempio precedente mostrerà ciò che stava succedendo nell'istantanea di utilizzo del sistema tra 00:00 e 00:05

    Non ho esperienza fare niente di simile, ma in teoria, è ansible farlo con i blocchi esistenti:

     CloudWatch -> SNS -> HTTP/HTTPS -> homebrew webapp -> collect data and email it 
    • Imposta l'allarme CloudWatch in modo che pubblichi un messaggio SNS ad un argomento quando si spegne.
    • Avere un webapp in esecuzione sull'istanza EC2 che, quando viene colpito un particolare indirizzo, raccoglie l'elenco dei processi in esecuzione e le e-mail.
    • Aggiungere un abbonamento all'argomento SNS con l'endpoint di webapp. È ansible scegliere HTTP o HTTPS come protocollo.

    Puoi combinare questo con il suggerimento di utilizzare in atop e configurare il tuo webapp per submit le ultime uscite N-minuti.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.