kernel: journal commette l'errore di I / O

Ho alcuni problemi con un server Dell 1950. Sto installando RHEL 4.6 con Oracle e un altro software qui.

Sto casualmente ottenendo un messaggio di errore che dice "kernel: journal commit errore di I / O" nella mia session ssh e sul monitor che ho collegato al server vedo un errore scorrendo da che dice "errore EXT3-fs (dispositivo sda5) in start_transaction: il giornale ha interrotto ".

  • Come posso eseguire automaticamente Firefox su Ubuntu Server Startup System?
  • Configurazione ACL avanzata di OpenLDAP
  • Accelerare la creazione di un grande filesystem ext3 su CentOS 5
  • Come eliminare il contenuto di una directory in Centos
  • Openvpn non instradare su Internet su un'interface tun
  • flashcache con mdadm e LVM
  • È accaduto più volte ma mai nello stesso punto durante l'installazione. In realtà, quest'ultima volta il sistema era in esecuzione e stavo cercando di importre un database in oracle.

    Questo è accaduto su diversi dischi rigidi, quindi sono abbastanza sicuro che non sia il problema. Questo mi fa pensare che il regolatore di raid sta andando male.

    Che cosa ne pensate?

    ** AGGIORNARE **

    Abbastanza sicuro che fosse un disco duro. Ho gettato un'altra unità nel server e sono in esecuzione per circa 48 ore con problemi fuori.

    5 Solutions collect form web for “kernel: journal commette l'errore di I / O”

    Ho visto questi errori prima, ma non durante il process di installazione.

    Ciò significa che l'unità ha avuto sufficienti errori che il sistema operativo lo ha portto alla modalità di sola lettura. Se potessi trovare i registri completi, probabilmente ci sarebbero alcuni errori di I / O che sono stati riprovati e funzionati prima degli errori completi di errore che hai visto. Qualcosa con i blocchi reali menzionati.

    Si tratta di un errore del sistema di archiviazione. È sicuramente la scheda RAID, le unità nell'arrays RAID, i cavi dalla scheda alle unità, il backplane con cui si collegano le unità, lo slot in cui è inserita la scheda di raid, l'alimentazione per i dischi rigidi o qualcos'altro in tra la CPU e gli effettivi blocchi di memory.

    Sono presenti tre possibilità:

    1. Ci sono problemi di memory (spesso causano guasti "casuali"). Se hai ECC ram in là, allora ovviamente è less probabile.

    2. C'è qualche problema con l'autobus. Ho avuto lo stesso problema con un controller APIC rotto su una scheda madre Tyan dual Opteron qualche anno fa. C'erano altre voci di registro che li accennavano, ma la maggior parte dei sintomi erano corrotti su unità disco con rimontaggi automatici di sola lettura. Nel mio caso sapevo che non era un disco collegato perché era una scatola esterna FC RAID ed era soddisfacente.

    3. Il controller RAID è a castello.

    Questo è nell'ordine che considero i problemi.

    Potrebbe essere il controller RAID male come ha detto (provare un ricambio se ne hai uno). Potrebbe essere il driver per il controller (controllare se i driver alternativi sono disponibili, anche se la prestazione è peggiore, è bene avere un punto di riferimento .) Potrebbe essere il kernel (less probabile però in RHEL, è abbastanza ben testato.) Potrebbe essere una ctriggers RAM che scompiglia la cache di blocchi.

    Un problema hardware è la causa più probabile, tuttavia, basata sul comportmento di errore apparentemente random.

    Controllare che il disco non sia pieno – in particolare la partizione radice. Utilizzare df per visualizzare l'utilizzo del disco di sistema dei file:

    df -h 

    Cercare partizioni vicine o pari al 100% di utilizzo

    provare:

    arresto -rF ora

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.