Qual è lo stato attuale (2016) di SSD in RAID?

Ci sono molte risorse disponibili online che discutono con l'utilizzo di unità SSD nelle configurazioni RAID – tuttavia questi sono in gran parte appartenenti a pochi anni e l'ecosistema SSD è molto veloce – proprio come ci aspettiamo il rilascio del prodotto Intel "Optane" entro la fine dell'anno che cambierà tutto … di nuovo.

Premetterò la mia domanda affermando che vi è una differenza qualitativa tra gli SSD a livello di consumo (ad es. Intel 535) e SSD di tipo datacenter (ad esempio Intel DC S3700).

  • SW SSD Raid 1 su HW RAID 10
  • Formato RAID 10 Stripe per XenServer
  • Come ricordare i livelli RAID?
  • ZFS o hardware RAID5
  • Perché RAID 0 è classificato come RAID quando non è ridondante?
  • Estendere RAID 5 per utilizzare lo spazio inutilizzato e aggiungere altri dischi?
  • La mia preoccupazione principale riguarda il supporto TRIM in scenari RAID. A mio avviso, nonostante sia passato più di 6 anni da quando SSD sono stati introdotti in computer di consumo e 4 anni da quando NVMe era commercialmente disponibile – i controller RAID di oggi non supportno ancora i comandi TRIM a SSD collegati – ad exception di RAID Intel controllori in modalità RAID-0.

    Sono sorpreso che il supporto TRIM non sia presente in modalità RAID-1, dato il modo in cui gli azionamenti si specchiano a vicenda, sembra semplice. Ma mi allontano.

    Voglio notare che se si desidera una tolleranza agli errori con i dischi (sia HDD che SSD), li utilizzerebbe in una configuration RAID – ma siccome gli SSD sarebbero senza TRIM significa che potrebbero subire una scrittura-amplificazione che comport usura extra, che a sua volta causerebbe il fallimento dei SSD prematuramente – si tratta di una ironia sfortunata: un sistema progettato per proteggere contro il guasto dell'azionamento potrebbe finire per far sì che ne risulti direttamente.

    Così:

    1. È il supporto TRIM necessario per i moderni SSD (2015-2016)?

      1.1. C'è qualche differenza nella necessità di supportre TRIM tra SSD SATA, SATA-Express e NVMe?

    2. Spesso gli azionamenti vengono pubblicizzati come aventi una migliore raccolta rifiuti incorporata; ciò evita la necessità di TRIM ? Come funziona il loro process GC in ambienti RAID?

      1.1. Ad esempio, vedi questo QA dal 2010 che descrive un degrado delle performance gravi, a causa di non-TRIMming ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) – e questo articolo dal 2015 fa il caso che l'utilizzo di TRIM è fortemente raccomandato ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim -right / ). Qual è la tua risposta a questi argomenti forti per la necessità di TRIM ?

    3. Molti articoli e discussioni degli anni precedenti riguardano il flash SLC vs MLC e che SLC è preferibile a causa della sua lunga durata di vita – tuttavia sembra che tutti gli SSD di oggi (indipendentemente da where si trovano sullo spettro consumer-to-enterprise) sono MLC Questi giorni – è questa distinzione di rilevanza più?

      1.1 E cosa succede con il flash TLC?

    4. Gli SSD di Enterprise tendono ad avere limiti di durata / scrittura molto più elevati (spesso misurati in quante volte è ansible sovrascrivere completamente l'unità in un giorno, durante la durata prevista di 5 anni dell'unità) – se il limite di scrittura è molto elevato (es. 100 scrive complete al giorno) significa che non hanno bisogno di TRIM a tutti perché questi limiti sono così alti, o – al contrario – sono quei limiti raggiungibili solo utilizzando TRIM ?

    4 Solutions collect form web for “Qual è lo stato attuale (2016) di SSD in RAID?”

    Cerchiamo di rispondere una domanda alla volta:

    • È il supporto TRIM necessario per i moderni SSD (2015-2016)?

    Breve risposta: nella maggior parte dei casi, no. Risposta lunga: se si dispone di un sufficiente spazio di riserva (~ 20%), anche l'unità a consumo di solito ha valori di consistenza molto buona (ma è necessario evitare le unità che, invece, soffocano su sostenute scrive). Gli azionamenti Enterprise-grade sono ancora migliori, sia perché dispongono di un maggior spazio di riserva per impostazione predefinita e perché il loro controller / firmware combo è ottimizzato verso l'uso continuo dell'unità. Ad esempio, dare un'occhiata all'unità S3700 a cui si fa riferimento: anche senza tagliare, ha una buona consistenza di scrittura.

    • Spesso gli azionamenti vengono pubblicizzati come avere una migliore raccolta di rifiuti integrata, cosa che evita la necessità di TRIM? Come funziona il loro process GC in ambienti RAID

    Il collettore di rifiuti di azionamento fa la sua magia all'interno della sandbox per l'azionamento – sa nulla sull'ambiente esterno. Ciò significa che è (in gran parte) non influenzato dal livello RAID dell'arrays. Detto questo, alcuni livelli di RAID (fondamentalmente basati sulla parità) possono talvolta aumentare il fattore di amplificazione della scrittura, e questo a sua volta significa un lavoro più elevato per le routine GC.

    • Molti articoli e discussioni degli anni precedenti riguardano il flash SLC vs MLC e che SLC è preferibile, a causa della sua lunga durata di vita, tuttavia sembra che tutti gli SSD (a prescindere da where si trovano sullo spettro consumer-to-enterprise) sono MLC questi giorni – è questa distinzione di rilevanza più

    Le unità SLC sono scomparse fondamentalmente dall'impresa, essendo relegate principalmente a compiti militari e industriali. L'impresa contrassegnata è divisa in tre categorie:

    • Il flash HMLC / MLCe è quello con i migliori circuiti integrati MLC, certificati per sostenere alless 25000/30000 loops di riscrittura;
    • I chip 3D MLC sono classificati a circa 5000-10000 loops di riscrittura;
    • i normali schemi planari MLC e 3D TLC sono valutati a circa 3000 loops di riscrittura.

    In realtà, uno qualsiasi dei tipi di flash precedenti dovrebbe fornire un sacco di capacità di scrittura totale e, infatti, è ansible trovare unità enterprise con tutti i tipi di flash sopra descritti.

    La reale differenziazione tra unità enterprise e consumer è:

    • il controller / firmware combo, con unità enterprise molto più difficile da morire a causa di bug inatteso del controller;
    • la cache di scrittura protetta da potenza, estremamente importnte per impedire corruzioni al livello di Flash Translation (FTL), memorizzato sul flash stesso.

    I driver di qualità Enterprise sono migliori soprattutto per i loro controller e condensatori di potenza, piuttosto che per un migliore flash.

    • Gli SSD di Enterprise tendono ad avere limiti di durata / scrittura molto più elevati (spesso misurati in quante volte è ansible sovrascrivere completamente l'unità in un giorno, durante una durata di vita di cinque anni dell'azionamento), ciò evita qualsiasi preoccupazione per la scrittura-amplificazione causata da non eseguire TRIM?

    Come detto sopra, gli azionamenti di livello enterprise hanno spazio di riserva di default (+ 20%) molto più elevato che, a sua volta, riduce drasticamente la necessità di regolare TRIMs

    Comunque, come nota laterale, si consiglia di considerare alcuni RAID software che supportno i TRIM (qualcuno ha detto Linux MDRAID? )

    TRIM non è una cosa che mi preoccupa mai quando usi SSD sui moderni controller RAID. Gli SSD sono migliorati, le funzionalità del controller RAID hardware sono state ottimizzate per questi carichi di lavoro e la solida resistenza è di solito in atto.

    TRIM è per unità SATA inferiori. Per SAS SSDs, abbiamo SCmap unmap e forse è per questo che non incontro TRIM esigenze …

    Ma l'altro commentatore è corretto. L'archiviazione definita dal software (SDS) sta cambiando come utilizziamo gli SSD. Nelle soluzioni SDS, i controller RAID sono irrilevanti. E le cose come TRIM tendono ad essere less importnti perché gli SSD stanno riempendo ruoli specificati. Penso alla memory di memorizzazione di Nimble o alla ZFS L2ARC e ZIL … soddisfano tutte le esigenze specifiche e il software sta sfruttando le risorse in modo più intelligente.

    shodanshok ha toccato la risposta reale qui. Se si riserva spazio aggiuntivo, "over-provision", la consistenza di performance e durata della scrittura SSD migliorerà nel tempo e la mancanza di supporto TRIM diventa in gran parte irrilevante. Riservare che lo spazio aggiuntivo può essere fatto semplicemente come, a partire da un nuovo SSD, partizionando less della piena capacità. La maggior parte dei controller in-drive gestisce lo spazio mai utilizzato come lo spazio riservato e quindi riduce significativamente l'amplificazione della scrittura. Per l'avvio e il sistema operativo, è probabilmente sufficiente lo spazio riservato al 10%. Per gli azionamenti che vengono ri-scritti spesso, aumenta lo spazio.

    Livelli RAID con SSD Una risposta sopra suggerisce che i livelli RAID con parità, come RAID 5, aumentano l'amplificazione della scrittura. Esiste davvero più di un modo per interpretarlo: l'impatto su un disco o l'impatto sul set di unità.

    Rispetto a nessuna ridondanza, RAID 5 aggiunge le scritture all'insieme in quanto aggiunge la parità di checksum. Rispetto ad un arrays RAID 0 di unità (n-1), l'impatto di unità dell'allineamento RAID 5 con unità n non è nulla. Ognuna delle unità n riceve altretanti scritture. RAID 5 aggiunge 1 / (n-1) scritture aggiuntive all'insieme. RAID 1 e RAID 10, tuttavia, aggiungere scritture aggiuntive al 100% per l'insieme, perché tutto scritto a un SSD viene scritto sul proprio mirror.

    Quindi, in termini di scrittura su un set RAID 5 contro un RAID 10 impostato con lo stesso numero di unità, gli SSD presenti nell'insieme RAID 5 riceveranno less scritture. E ciò rimane vero anche se si aumenta il numero di SSD nel RAID 10 impostato per equalizzare la capacità utilizzabile.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.