raid 5 vs raid 6

RAID 5 vs. RAID 6 – Was ist besser und wann?

Unterschiedliche RAID-Level bieten unterschiedliche Vorteile. Einige bieten Leistungssteigerungen durch die Bündelung von Speicherkapazität und Lese-/Schreib-E/A, während andere durch Datenredundanz vor Hardwarefehlern schützen.

Unter diesen Ebenen waren RAID 5 und 6 in letzter Zeit zwei der beliebtesten, da sie eine Kombination aus Leistung und Sicherheit bieten. Aufgrund ihrer verschiedenen Ähnlichkeiten kann es verwirrend sein, herauszufinden, wann es am besten ist, RAID 5 vs RAID 6 zu verwenden.

Daher werden wir in diesem Artikel besprechen, was diese beiden RAID-Level genau sind, ihre wichtigsten Ähnlichkeiten und Unterschiede und wann einer der beiden verwendet werden sollte.

Was ist RAID 5?

Wie bereits erwähnt, konzentrieren sich verschiedene RAID-Level in unterschiedlichem Maße auf Datenschutz und Leistungsverbesserung. RAID 5 bietet beides durch block-interleaved verteilte Parität.

RAID 5-Array-Layout

Dies bedeutet, dass Striping auf Blockebene erfolgt. Die Größe dieser Blöcke, auch bekannt als Chunk-Größe, muss der Benutzer festlegen, reicht jedoch normalerweise von 64 KB bis 1 MB.

Zusätzlich wird für jeden Stripe ein Block Paritätsdaten geschrieben. Diese Paritätsblöcke sind über das Array verteilt, anstatt auf einer dedizierten Paritätsfestplatte gespeichert zu werden.

Wir werden weiter unten in diesem Artikel behandeln, warum RAID 5 Parität so behandelt, aber letztendlich führt dies dazu, dass eine Festplatte für Paritätsdaten reserviert wird.

Profis:
  • Fehlertoleranz gegen Ausfall einzelner Festplatten
  • Hohe nutzbare Speicherkapazität
  • Hohe Lesegeschwindigkeit
  • Kann mit einem Hardware-Controller eingerichtet oder über Software implementiert werden
Nachteile:
  • Einbußen bei der Schreibleistung
  • Kann nur einen Festplattenfehler verarbeiten. Mehr führt zum Ausfall des Arrays
  • Riskanter Umbauprozess

Was ist RAID 6?

RAID 6 ist RAID 5 sehr ähnlich, verwendet jedoch zwei verteilte Paritätsblöcke über einen Stripe anstelle von einem. Dieses eine Detail ändert alles, von der Fehlertoleranz des Arrays bis hin zur Leistung und dem nutzbaren Speicher.

RAID 6-Array-Layout

Das zweimalige Schreiben von Parität macht das Array viel zuverlässiger, aber aus dem gleichen Grund erleidet die Schreibleistung auch die doppelte Strafe. Die Leseleistung ist jedoch, ähnlich wie RAID 5, ausgezeichnet.

Profis:
  • Fehlertoleranz gegenüber zwei Datenträgerfehlern
  • Hervorragende Leseleistung
  • Neuaufbau nach Datenträgerausfall ist sicherer
Nachteile:
  • Höherer Overhead für die Schreibleistung
  • Zwei Festplatten Speicherplatz, der für die Parität benötigt wird

RAID 5 vs. RAID 6 – Hauptunterschiede

RAID 5 und 6 unterscheiden sich hauptsächlich darin, dass RAID 6 zwei Paritätsblöcke pro Stripe verwendet, während RAID 5 nur einen verwendet. Aber wie gesagt, dies führt auch zu einer Reihe anderer Unterschiede, die wir in den folgenden Abschnitten behandeln werden.

Fehlertoleranz

Das erste, was sich auf die Paritätsblockanzahl auswirkt, ist die Fehlertoleranz. In einem RAID 5-Array wird für jeden Stripe ein blockgroßer Teil der Paritätsdaten geschrieben. Im Falle eines Festplattenausfalls können die verlorenen Daten mithilfe der Paritätsdaten und der Daten auf den anderen Festplatten im Array neu berechnet werden.

RAID5-Fehler

Im Wesentlichen bedeutet dies, dass ein RAID 5-Array einen Festplattenausfall ohne Datenverlust verarbeiten kann. Normalerweise jedenfalls. Diese Fehlertoleranz war der Grund, warum RAID 5 bis in die 2010er Jahre sehr beliebt war. Heutzutage wird RAID 5 jedoch selten verwendet, da seine Zuverlässigkeit nicht mehr auf dem neuesten Stand ist. Dies liegt an der Art und Weise, wie die meisten Hardware-RAID-Controller Wiederherstellungen verarbeiten.

Wenn der Controller während der Neuerstellung auf einen nicht behebbaren Lesefehler (Unrecoverable Read Error, URE) stößt, markiert er normalerweise das gesamte Array als fehlgeschlagen, um weitere Datenbeschädigungen zu verhindern. Wenn Sie keine Sicherungen haben oder planen, Daten von einzelnen Festplatten wiederherzustellen, gehen die Daten verloren.

Die Festplattengrößen sind in den letzten zwei Jahrzehnten exponentiell gewachsen, aber die Verbesserungen der Lese- / Schreibgeschwindigkeit waren viel moderater. Im Wesentlichen nahm die Größe der Arrays viel stärker zu als die Datenübertragungsgeschwindigkeiten, was bedeutete, dass die Wiederherstellungszeiten sehr lang wurden.

Je nach Setup kann die Neuerstellung des Arrays nach einem Festplattenausfall Stunden bis Tage dauern. Solche Wiederaufbauzeiten bedeuteten eine höhere Wahrscheinlichkeit, während des Wiederaufbaus auf UREs zu stoßen.d, was zu einer höheren Wahrscheinlichkeit führt, dass das gesamte Array ausfällt.

In den letzten Jahren sind die URE-Vorkommensraten in HDDs dank technologischer Verbesserungen deutlich gesunken. Aus diesem Grund wird RAID 5 immer noch hier und da verwendet. Aber der allgemeine Branchenkonsens ist, sich immer noch für RAID 6 oder andere Ebenen zu entscheiden, und das aus gutem Grund.

In RAID 6 werden Paritätsdaten zweimal pro Stripe geschrieben. Dies bedeutet, dass ein RAID-6-Array bis zu zwei Festplattenausfälle ohne Datenverlust aushalten kann. Dadurch ist RAID 6 deutlich zuverlässiger und damit besser für größere Arrays mit wichtigen Daten geeignet.

Schreibleistung

Festplattenkopf

Ein RAID 5-Array muss die Daten lesen, die Parität berechnen, die Daten schreiben und dann die Parität. Aus diesem Grund erleidet RAID 5 eine Strafe für Workloads mit Schreibvorgängen.

RAID 6 beinhaltet das doppelte Berechnen und Schreiben der Parität, was für die Zuverlässigkeit von Vorteil ist, aber es bedeutet auch, dass es den doppelten Aufwand für Schreibvorgänge erleidet.

Für kleinere E/A-Größen (in der Regel 256 KB und darunter) haben RAID 5 und 6 eine sehr vergleichbare Schreibleistung. Aber mit größeren I/O-Größen ist RAID 5 definitiv überlegen.

Anzahl der Festplatten

RAID 5 erfordert zwei Festplatten für Striping und einen Festplattenspeicher zum Speichern von Paritätsdaten. Dies bedeutet, dass ein RAID 5-Array mindestens 3 Festplatteneinheiten benötigt.

RAID 6 ist ähnlich, erfordert jedoch mindestens 4 Festplatten, da Paritätsdaten zwei Festplatten belegen.

Nutzbarer Speicher

In einem RAID 5-Array kann der nutzbare Speicher mit (N – 1) x (kleinste Festplattengröße) berechnet werden, wobei N die Anzahl der Festplatteneinheiten ist. Zum Beispiel haben wir unten ein RAID 5-Array mit drei 1-TB-Festplatten gezeigt. Ein Speicherplatz wird zum Speichern von Paritätsdaten verwendet, und da die kleinste Datenträgergröße 1 TB beträgt, beträgt der nutzbare Speicherplatz 2 TB.

RAID 5 nutzbarer Speicher

Es ist wichtig, zu versuchen, Festplatten gleicher Größe zu verwenden, da andernfalls die kleinste Festplatte einen Engpass verursachen würde, der zu viel unbrauchbarem Speicherplatz führt. Das folgende Beispiel zeigt das gleiche Szenario, in dem der 500-GB-Datenträger dazu geführt hat, dass 1,5 TB nicht verwendet werden können.

RAID 5 Ungenutzter Speicherplatzengpass

In einem RAID 6-Array wird der nutzbare Speicher mit (N – 2) x (kleinste Festplattengröße) berechnet. Auch hier ist es wichtig, Festplatten gleicher Größe zu verwenden, um sicherzustellen, dass im Array kein unbrauchbarer Speicherplatz vorhanden ist.

RAID 6 nutzbarer Speicher

Paritätsberechnung

In RAID 5 wird für jedes Datenbyte eine XOR-Operation ausgeführt, um Paritätsinformationen in RAID 5 zu berechnen. Nehmen wir zum Beispiel an, das erste Datenbyte in einem 4-Festplatten-Array sieht ungefähr so aus:

A1 – 11010101
A2 – 10001100
A3 – 10101100

Wenn wir eine XOR-Operation auf den ersten beiden Streifen (A1 und A2) durchführen und dann dasselbe mit dem Ausgang und dem dritten Streifen (A3) tun, ist die Ausgabe die Paritätsinformation (Ap). In diesem Fall ist sein Wert 11110101.

Wenn ein Datenträger (z. B. Datenträger 1) ausfällt, geschieht Folgendes. Erstens gibt uns A2 XOR A3 den Ausgang 00100000. Wenn wir diese Ausgabe in einer XOR-Operation mit Ap verwenden, erhalten wir 11010101 als Ergebnis, nämlich die verlorenen Daten.

00100000
11110101
11010101

Auf diese Weise werden Paritätsdaten berechnet und verwendet, um verlorene Daten in RAID 5 neu zu berechnen.

RAID 6 ist viel komplexer, da es die Parität zweimal berechnet. Je nach Setup wird dies auf verschiedene Arten implementiert, z. B. Dual-Check-Datenberechnung (Parität und Reed-Solomon), orthogonale Dual-Parity-Check-Daten, diagonale Parität usw.

RAID-Controller

RAID 5 kann sowohl mit Hardware- als auch mit Softwaremitteln implementiert werden. Ersteres beinhaltet offensichtlich die Verwendung eines dedizierten Hardware-RAID-Controllers. Da RAID 5 eine Paritätsberechnung erfordert, ist dies die empfohlene Route.

Dies ist besonders wichtig in bestimmten Fällen, wie bei einem NAS, wo der Prozessor nicht leistungsfähig genug ist, um die Berechnungen durchzuführen, ohne einen signifikanten Engpass zu verursachen.

RAID-Controller

Obwohl aus Performance-Gründen nicht ideal, kann RAID 5 auch mit Softwarelösungen eingerichtet werden. Windows ermöglicht es Ihnen beispielsweise, Ihre Datenträger mithilfe der Speicherplatzfunktion zusammenzufassen. Sie können ein RAID 5-Volume auch über die Datenträgerverwaltung erstellen.

RAID 6 hingegen erfordert einen Hardware-RAID-Controller. Dies liegt daran, dass die Polynomberechnungen, die zur Berechnung der zweiten Paritätsschicht durchgeführt werden, ziemlich prozessorintensiv sind.

Sind RAID 5 und RAID6 ähnlich?

Es sollte an dieser Stelle offensichtlich sein, dass RAID 5 und 6 zwar einige wichtige Unterschiede aufweisen, aber auch in vielerlei Hinsicht ähnlich sind. Zunächst einmal bieten RAID 5 und 6 im Gegensatz zu RAID 1 Fehlertoleranz durch Parität anstelle von Spiegelung.

Insbesondere verwenden sie verteilte Parität, die sich von den dedizierten Paritätsfestplatten unterscheidet, die von RAID 2, 3 und 4 verwendet werden. Mit verteilter Parität müssen Sie sich keine Sorgen um Engpässe machen wie bei einem einzelnen Paritätsdatenträger.

Sowohl RAID 5 als auch RAID 6 verfügen dank Daten-Striping über eine hervorragende Leseleistung. Aus dem gleichen Grund erleiden beide auch Strafen für die Schreibleistung, wenn auch in unterschiedlichem Maße.

Was ist gut an RAID 5?

RAID 5 bietet eine gute Mischung aus nutzbarem Speicher, Datenschutz und Leistung. Sie können es auch mit weniger Festplatten einrichten, was es zu einer budgeteffizienten Option macht.

Wenn Sie in Bezug auf die Leistung denken möchten, eignet sich RAID 5 am besten für Workloads mit umfangreichen Lesevorgängen wie E-Mail-Servern.

Was die Fehlertoleranz betrifft, haben wir bereits darüber berichtet, wie RAID 5 im Laufe der Jahre weniger zuverlässig geworden ist. Es ist immer noch in Ordnung für kleine Arrays, aber bei größeren Arrays, bei denen die Wahrscheinlichkeit fehlgeschlagener Wiederherstellungen höher ist, würden wir RAID 5 nicht empfehlen.

Wann ist RAID 6 besser?

Die Zuverlässigkeit von RAID 6 geht auf Kosten der Schreibleistung und des nutzbaren Speichers. Diese leichte Diskrepanz lohnt sich jedoch zweifellos, wenn die Daten auf den Festplatten wichtig sind.

RAID 6 eignet sich nicht optimal für kleinere Arrays (z. B. 4 Festplatten), da ein erheblicher Teil des Speichers durch Redundanz verloren geht. Wenn Redundanz in kleinen Arrays erforderlich ist, wäre RAID 5 oder etwas wie RAID 10 besser.

Stattdessen eignet sich RAID 6 am besten für größere Arrays, bei denen die Möglichkeit besteht, viel mehr Daten zu verlieren, wenn das Setup nicht zuverlässig ist.

Endgültiges Urteil – RAID 5 gegen RAID 6

RAID 5 ist nicht völlig unzuverlässig und kann immer noch für kleinere Arrays verwendet werden. Aber bei wirklich kritischen Daten sollten Sie den Schutz gegenüber geringfügigen Leistungsunterschieden priorisieren, und hier ist RAID 6 der Kuchen.

Unabhängig davon, für welches RAID-Level Sie sich entscheiden, ist es jedoch wichtig zu verstehen, dass RAID kein Backup ist. Die Redundanz von RAID schützt nur vor Festplattenfehlern. Selbst ein RAID 6-Array kann während der Wiederherstellung ausfallen.

Wenn die Daten auf den Festplatten wichtig genug sind, um RAID 6 oder andere „zuverlässige“ Versionen zu verwenden, dürfen Sie auch keine Backups und Patrouillen-Lesevorgänge auf die leichte Schulter nehmen. Zur Erinnerung, hier sind die wichtigsten Unterschiede zwischen RAID 5 und RAID 6:

RAID 5 RAID 6
Paritätsebenen Paritätsdaten werden einmal berechnet. Paritätsdaten werden doppelt berechnet.
Fehlertoleranz Kann einen Datenträgerausfall tolerieren. Kann zwei Festplattenfehler tolerieren.
Schreibleistung Die Schreibleistung erleidet eine Strafe. Die Schreibleistung leidet unter vergleichsweise höherem Overhead.
Minimale Datenträger Mindestens 3 Festplatten sind erforderlich. Mindestens 4 Festplatten sind erforderlich.
Nutzbarer Speicher Bietet mehr nutzbaren Speicherplatz. Der nutzbare Speicher ist vergleichsweise geringer.
Paritätsberechnung Die Parität wird durch eine einfache XOR-Operation berechnet. Die Parität wird mit XOR zusammen mit anderen komplexen Algorithmen berechnet.
Implementierung Kann mit Hard- oder Softwarelösungen realisiert werden. Erfordert einen dedizierten Hardware-RAID-Controller.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert