Arresto grazioso del cluster Kubernetes

Abbiamo un cluster di 4 nodes Kubernetes, installato utilizzando Juju 2.0 e il canale ufficiale di Kubernetes. L'unico scopo di questa installazione locale e privata è lo sviluppo e la sperimentazione.

Uno dei problemi più grandi e documentati di questa installazione è la mancanza completa di una graziosa procedura di arresto del server. Poiché solo come i nodes etcd scendono, l'integer config viene perso.

  • Rilevamento di events Kubernetes OOMKilled nei registri GKE
  • Esporre la port 80 e 443 su Google Container Engine senza il bilanciatore di carico
  • Se i server intensivi io e CPU sono separati in cluster di kubernetes?
  • GCE: controllo di salute e prova di Liveness
  • VM Inaccessibile
  • IP statico con "kubectl expose" su Google Container Engine rimane in stato <in attesa> per sempre
  • Abbiamo trascorso una notevole quantità di tempo in cerca di un script automatico di backup / ripristino / procedure per Kubernetes. La risposta più frequente al problema che abbiamo è distribuire il server da un graffio utilizzando Juju each volta che lo avvio. Dato 30-35 minuti. il tempo di implementazione non sembra una soluzione attraente?

    Avete una soluzione fattibile a questo problema?

  • etcd2 non riesce ad avviare il mio nodo CoreOS
  • Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.