RAID e database

Utilizzo Postgresql 8.4 e volevo sapere quale tipo di RAID è utilizzato per la maggior parte dei database. Ho letto ovunque che RAID10 è il più adatto e RAID5 non è una buona opzione. ex: http://www.revsys.com/writings/postgresql-performance.html

Il mio server è Dell Poweredge 2950. Il supporto Dell mi ha detto che non hanno molti clienti che utilizzano RAID10. La maggior parte delle volte utilizza la cache del controller RAID5 + raid ON.

  • Qualcuno può aiutarmi a installare il server Pelasy MYSQL? Questo mi stava stringendo
  • Posso rimuovere l'authorization della tabella di creazione in postgresql 8.3?
  • Maschere di authorization MOLTO peculiari in UID, GID e nomi di file in Linux
  • Più istanze di Postgres dopo l'aggiornamento di Ubuntu
  • La saggezza di aggiungere l'unità esterna USB all'arrays RAID10 di Linux
  • Visualizza le ultime query in MySQL
  • Cosa ne pensi di questo? Quale livello di RAID si utilizza per i server di database?

    Grazie !

    8 Solutions collect form web for “RAID e database”

    Pol,

    Probabilmente vado con RAID10 se hai un sacco di scrittura fatto al tuo database.

    Ecco un buon caso di mondo reale da considerare … sostituire un file server che dispone solo di un singolo HDD da 1TB con un nuovo server con quattro dischi rigidi da 1TB. La decisione è stata fatta per andare con RAID5.

    La prestazione è stata notevolmente più lento sulla nuova macchina. È stato scoperto in seguito che il server ha gestito un numero maggiore di scritture di quanto originariamente pensato. La pena di scrittura da RAID5 era piuttosto male.

    La decisione corretta in questo era di andare con RAID10.

    La risposta migliore dipende dal profilo più adatto al database: OLTP o OLAP. Per semplificare ulteriormente, il database fa più scrivere o leggere più? Un database che esegue più scritture rispetto alle letture funziona normalmente meglio su raid10 rispetto a raid5 (assumendo lo stesso numero di unità utilizzate). Come ha detto Karl, se il vostro set di dati (o unità) sono grandi, stare lontano da R5 e utilizzare R6 se R10 non è la tua selezione.

    È dipendente dal carico di lavoro e devi benchmarkare.

    In teoria, RAID 5 è lento per piccole scritture. Una grande cache può attenuare questo enorme (o persino renderlo identico nelle performance a RAID 1 + 0 per una determinata impostazione).

    Spesso RAID 1 + 0 è politicamente difficile poiché lo spazio aggiuntivo è considerato sprecato. Cercare di spiegare che avere spazio vuoto su un RAID5 che potrebbe essere utilizzato per get performance è una forma diversa di sprecare spazio.

    Se non è ansible benchmark e lo spazio già su disco, andare sempre con RAID 1 + 0. Se non è ansible benchmark e si è costretti ad andare a RAID5 o RAID6, assicuratevi di indicare chiaramente che RAID6 e RAID5 hanno il rischio di performance più elevato per i carichi di scrittura intensiva. Assicurarsi che l'insistenza che la crei in un modo che crei il rischio di performance più elevato senza prima provare viene anche messo in scrittura.

    Quando fai riferimento, fai chiarezza al gruppo di applicazioni che esegue il benchmarking su come funziona il RAID5, il fatto che il controller dispone di una cache che può mitigare la pena di scrittura di piccole size e che il benchmark deve essere su un set di dati identico alla produzione .

    Fai tutto questo per iscritto. Gli errori di configuration di storage sono il gioco di responsabilità più diffuso in molti ambienti. Fondamentalmente non ti verrà concesso di benchmark e dovrai indovinare, quindi assicuratevi di avere l'evidenza che hai fatto un'idea migliore o che ti sia stato detto di fare qualcosa contrario alle migliori pratiche.

    Qui troverai una relazione sulle performance e la scalabilità di HP Proliant DL380 G5.
    i test sono basati su vari file system (jfs, xfs, reiserfs, ext2 e ext3).

    Sinceramente, nella mia esperienza, non vedo una differenza di RAID5 su RAID10 da una prospettiva di ridondanza dei dati. Tuttavia, RAID10 offre un aumento delle performance a causa del fatto che il RAID è a righe. RAID 10 è fondamentalmente RAID0 e RAID1. Due set di RAID0 vengono rispecchiati (RAID1). Usiamo RAID5 su RAID10. Ma non abbiamo bisogno del guadagno delle performance da RAID10. Dipende solo dal tuo ambiente e da quello che stai lavorando. Raccommand di provare un RAID5. Se sembra che la prestazione è più lenta passare a RAID10 e vedere se il guadagno di performance aiuta. Se hai piccoli o medi carichi di lavoro, RAID5 dovrebbe fare il trucco.

    Per get performance migliori utilizzare SSD, quindi R10, quindi 1 o 0, quindi 5, quindi 6.

    RAID5 viene utilizzato perché è più facile da configurare e pensare al RAID10. Non è necessario un numero pari di dischi e più persone ne hanno familiarità.

    In passato, abbiamo sempre fatto RAID5 (Dell PowerEdge 2650-2950), ma nella nostra ultima macchina (in esecuzione MS-SQL, non PostgreSQL) ho testato sia RAID10 che RAID5. Ho scoperto che per il nostro carico di lavoro, RAID10 ci ha dato un aumento di performance moderato (~ 10%).

    Se hai il tempo, ti suggerisco di impostare il server in entrambi i modi e di eseguire normali attività DB (backup e ripristino, qualunque lavori o rapporti potresti fare).

    Gli SSD non forniscono sempre performance ottimali. Leggono i dati in blocchi ordinati, che potrebbero non essere ciò che richiede il database.

    Quando decidete quale RAID e il filesystem da utilizzare per un database, le domande più importnti sono:

    • Quanto è grande il set di dati / unità?
    • Quanti soldi hai?
    • È leggero o pesante?

    Se il set di dati è grande, vale a dire> 10 TB, si desidera evitare RAID5. Si potrebbe perdere un secondo disco durante la ricostruzione dell'arrays, con conseguente perdita totale di dati. RAID6 e RAID10 sono buoni profili, ma sono consapevoli delle restrizioni con RAID10. Inoltre: scegli un filesystem di journaled che non richiede un normale fsck-ing; in altre parole, evitare l'ext3 e andare con qualcosa di simile a xfs … o meglio ancora, andare a Solaris e utilizzare zfs. Avete un'idea di quanto tempo ci vuole per fsck un volume di 10tb?

    Se si dispone di più soldi, è ansible acquistare un armadio esterno e potrebbero get ulteriori incrementi di velocità poiché la macchina non provocherà l'attività del sistema (logging, ecc.) Durante la lettura dal set di dati. È inoltre ansible get un controller RAID migliore con più RAM e rendimenti superiori o dischi più veloci. Fondamentalmente, ottieni quello per cui paghi.

    Se i dati sono letti, puoi attaccare a Raid10. Se i tuoi dati sono bilanciati lettura / scrittura o scrittura pesanti, probabilmente avresti meglio attaccato con raid6.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.