Quanto sono intelligenti i controller / armadi RAID?

Quanto sono intelligenti i controller RAID quando sono sotto carico?

Dato un controller e un armadio moderati a high-end (cioè il kit di corrente standard Dell o HP off-the-shelf …), RAID 5, fibre 10gb, alless 3/4 di spazio utilizzato e un sacco di piccole, sequenziali con l'accesso pesante a lettura / scrittura a file che potrebbero essere trovati su un file o un server di posta elettronica …

  • La saggezza di aggiungere l'unità esterna USB all'arrays RAID10 di Linux
  • Le istantanee + RAID contano come una buona soluzione di backup in loco?
  • RAID con 4 unità offre un miglioramento minimo della velocità
  • Dove viene salvata la configuration ZFS?
  • Azionamento logico sbagliato accidentalmente HP Smart Array P800 controller
  • Perché linux inizia automaticamente un resync hardware RAID1, su due nuovi e vuoti dischi e come si arresta?
  • Domanda di attuazione pratica : data la stessa quantità di spazio, cosa sarebbe più veloce, un piccolo numero di grandi unità ad alta velocità (cioè 4x 1TB 15.000 giri / min) o un numero maggiore di unità più piccole, moderate o basse (9x 500GB 7200 o 10.000 giri / min)?

    Domanda teorica : Gli armadi / controllori RAID sanno where è la testa di un drive attualmente e la posizione di cui hanno bisogno per cercare in modo che possano assegnare letture all'unità con la distanza di percorrenza minima? O import?

    Quali altre variables entrano in gioco riducendo al minimo il tempo di risposta e massimizzando il throughput con un gran numero di piccoli file non sequenziali su un arrays di storage condiviso? Si noti che la cache non entra in gioco pesantemente a causa della natura dei dati.

  • Come ricordare i livelli RAID?
  • Qual è la combinazione RAID più veloce e più sicura per le unità SATA?
  • Utilizzare lo stesso tipo di disco in un RAID o diversi produttori / batch
  • 7 Solutions collect form web for “Quanto sono intelligenti i controller / armadi RAID?”

    Dalla tua descrizione il tuo carico di lavoro sarà un accesso fortemente random, quindi il fattore limitante è operazioni di IO casuali al secondo. Su un RAID-5 si otterrà (in pratica) leggermente less di un I / O letto o scrittura per giro del disco per mandrino fisico. In questa situazione, più dischi fisici e RPM più veloci consentono una maggiore produttività.

    In una situazione di I / O fortemente random in cui il set di lavoro delle richieste di dati sovraccarica la cache, il throughput del sistema è una function del numero di dischi fisici x la velocità del disco. Più dischi è migliore, più velocemente è meglio.

    Sulla vostra domanda teorica, i dischi supportno una funzionalità nota come ' code queue ' tagged . Ciò consente al controllore di submit le richieste di I / O ai dischi e di ricevere le richieste in modo asincrono. La scheda interna del disco è consapevole della posizione delle testine del disco e può ottimizzare le operazioni completandole nell'ordine in cui decida è ottimale. L'algorithm per questa è una variante su ' Ascensore che cerca '

    I risultati possono essere restituiti fuori servizio, ma vengono contrassegnati con il numero di richiesta in modo che il controller RAID conosca quale richiesta corrisponda alla risposta a (da qui il "tag"). SATA ha un protocollo leggermente diverso conosciuto da un ' command in coda locale ' che fa qualcosa di simile.

    In questo caso, il controller RAID non deve essere a conoscenza della posizione fisica delle testine del disco in quanto gestito dal firmware sul disco stesso.

    Su un carico di lavoro ad accesso fortemente random, un singolo paio di loop FC supporterà un sacco di dischi. Per un carico di lavoro come il video FC diventerà un collo di bottiglia più rapidamente.

    Alcuni controller possono supportre size di cache impressionanti. Puoi provare a stimare la dimensione del set di lavoro e vedere se è ansible effettivamente aggiornare la cache del controller per accontentarla. Se hai uno background nelle statistiche, puoi build un model monte-carlo basato sulle statistiche di utilizzo raccolte dalle richieste.

    Un'altra possibilità per migliorare le performance potrebbe essere quella di utilizzare uno strato di dischi a stato solido per la memorizzazione rapida, anche se dipende dal fatto che il controller supporti questa configuration.

    IOPS, IOPS e IOPS. Queste sono quelle che devi considerare. Potresti get più IOPS da un'unità di rotazione più veloce. In alternativa potresti get più IOPS da un count più alto del mandrino.

    C'è un buon articolo comparativo di Adaptec che risponde quasi esattamente alla stessa domanda.

    Se avete in mente alcune unità (ad es. Da un fornitore specifico) allora è ansible eseguire le matematiche.

    Attualmente non ci sono dischi 1TB 15krpm, perciò questo è teorico al meglio ma abbiamo scenari di utilizzo simili e per un sistema a metà livello, come stai guardando, vorrei consigliare l'utilizzo di dischi SAS da 2,5 "SFF, idealmente a 15krpm , Una serie di size adeguate non è molto costosa ed è seriamente veloce per il traffico ristretto e estremamente veloce anche per i casi troppo brevi. Guarda l'HP MSA 70.

    Ho fatto un sacco di test sui server Dell con i controller Perc5 / i e 6 / i. Rivediamo Dells e riesco raramente a resistere alla tentazione di velocizzarli quando each nuovo server o configuration di un nuovo disco passa attraverso le nostre porte. NB I test con un tester di dischi dei miei progetti. Non faccio alcuna affermazione speciale per il mio tester diverso da diversi anni di esperienza suggerisce che si correlano bene con la velocità del server quando è in loco. Vedere http://ratsauce.sourceforge.net/index.html#diskthrasher per i dettagli coraggiosi.

    Comunque, la mia esperienza suggerisce che alless fino a sei dischi RAID5, each disco aggiuntivo produce un utile aumento della velocità. Ho testato con i dischi SAS 15K e con i dischi SATA (Western Digital RE2 e RE3) e mentre i dischi SATA sono ovviamente molto più lenti all'accesso a caso, un disco a sei SATA RAID5 è alless buono come un quattro SAS a 15K disco RAID5. Quindi vorrei andare per dischi più economici.

    La tua domanda sul posizionamento testa sulle letture si applica solo a RAID1 o RAID10 e non li uso più, quindi non posso commentare. Dalla mia memory un po 'fioca una RAID1 su una Perc 4e / Di è notevolmente più veloce di un singolo disco, suggerendo che ci sia qualche beneficio. Tuttavia la differenza era piccola, forse 10-20% in più della velocità, e questo potrebbe essere stato solo dovuto a una migliore memorizzazione nella memory del controller RAID.

    Per inciso, se decidete di applicare la mia applicazione di dischi, includo un sacco di risultati di test da vari configurazioni di dischi.

    JR

    In generale la risposta dipenderà dal sistema che stai guardando. Se vuoi che il sistema sia veloce, considero di solito l'IOP che l'unità è in grado di utilizzare e di decidere. Tuttavia avrei una tendenza a preferire un gran numero di unità rispetto a un minor numero.

    Ci sono altre cose che possono essere fatte in Linux per aumentare le performance.

    Generalmente le teste in un sistema Raid devono essere sincronizzate in un sistema Raid5 / 6. Assicurarsi di non wherer leggere un'area prima di poterlo scrivere facendo le scritture abbastanza grandi.

    Penso che ci siano solo troppe variables da considerare qui per essere in grado di fare un suggerimento generale. Confrontando il numero di unità e le loro velocità non è pratico, perché altri fattori come il numero di teste e piatti saranno anche in gioco, quindi dipende anche dal model di azionamento.

    Idealmente, scegliete alcuni templates differenti che soddisfano i requisiti dell'applicazione e confrontandoli tra loro con il tuo carico di lavoro effettivo, quindi comprate quello che si adatta alla fattura.

    Finché ricorderai che la maggior parte dei SAN "grandi" hanno un costo superiore al 50%, il risultato finale è di solito abbastanza veloce.

    Il grande è il frontend NAS (finora con l'exception di NetApp) non è in grado di gestire alcun carico di metadati seri, quindi fai attenzione.

    I controllori Raid potrebbero in teoria conoscere l'ultima posizione sperimentata e utilizzarla quando riordinano le richieste (questo è in fondo una parte tradizionale degli algoritmi di ascensore), ma in questi giorni le cache dei RAM giganti sono semplicemente più semplici.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.