GlusterFS? Worum geht es?
GlusterFS ist ein skalierbares und verteiltes Dateisystem auf jeder Ebene, das die Speichereinheiten verschiedener Server in einem einzigen System zusammenfasst. Dateisysteme arbeiten versteckt, so dass fast niemand nach der Installation wieder an sie denkt. Man merkt sich diese jedoch schnell, wenn Daten verloren gehen oder Dateisystemgrenzen erreicht werden: Wenn beispielsweise die maximale Größe einer Partition nicht ausreicht oder der Speicherpfad Einschränkungen aufweist.
- Was und wer steht hinter GlusterFS?
- Wie GlusterFS funktioniert
- Vor- und Nachteile von GlusterFS
- Anwendungsbeispiele für GlusterFS
- Alternativen zu GlusterFS
Was und wer steht hinter GlusterFS?
Der Name Gluster ist ein Akronym, das sich aus dem Akronym GNU (wiederum ein rekursives Akronym für GNU? S nicht Unix ) und dem Begriff Cluster zusammensetzt . Das System steht unter der GNU-General Public License (GNU-GPLS) und kann daher kostenlos genutzt werden . Der Begriff Cluster, der so etwas wie Heap oder Gruppe bedeutet , beschreibt im Kontext von Datenträgern: die logische Synthese verschiedener physischer Speichermedien. Wenn wir also über Computer sprechen, bezieht sich Cluster auf eine Reihe mehrerer miteinander verbundener Systeme. GlusterFS kombiniert dieses Konzept mit dem von GNU und vereinheitlicht den Speicherplatz mehrerer Computer, um ihn später als eine einzige logische Einheit anzuzeigen.
Das Projekt wurde 2005 von der Firma Gluster Inc. vorgestellt, die 2011 von RedHat, Linux-Distributor, übernommen wurde. Seitdem entwickelt RedHat das Dateisystem weiter. Im Januar 2020 wurde die siebte Version von GlusterFS veröffentlicht, die in kompiliertem Format für die folgenden Linux-Distributionen verfügbar ist:
- CentOS
- Debian
- Fedora
- RedHat / RHEL
- SUSE
- Ubuntu
Der Grund, warum es nur auf Unix-basierten Systemen funktioniert, ist, dass der Speicher über das FUSE-Modul integriert wird, das für Windows mit der erforderlichen Stabilität noch nicht verfügbar ist.
FUSE ist die Abkürzung für Filesystem in Userspace . Betriebssysteme sind normalerweise in zwei Bereiche unterteilt: den Benutzer und den Kernel . Letzteres ist stark geschützt und unter anderem nur mit Administratorrechten zugänglich. Daher sind diese Rechte normalerweise zum Mounten oder Mounten und Verwalten von Festplatten erforderlich . Mit FUSE können Benutzer jedoch auch Dateisysteme verwalten.
Computer können als Server und als Clients fungieren. Der bloße Zugriff auf das Dateisystem ist jedoch auch von anderen Systemen aus möglich. NFS (Network File System) und SMB / CIFS (Server Message Block / Common Internet File System) werden unterstützt.
Wie GlusterFS funktioniert
Ein verteiltes Dateisystem ist nur dann praktisch, wenn mehrere Computer miteinander verbunden sind. Gemäß der offiziellen Beschreibung von GlusterFS sind mindestens drei Server erforderlich , dies sind jedoch keine Server im wörtlichen Sinne, sondern können praktisch jede Art von physischer oder emulierter Hardware sein . Sie können neben allen Arten von Computern auch virtuelle Maschinen verwenden, die viele Vorteile haben, insbesondere in Bezug auf die Flexibilität.
Integrierte Server arbeiten als Knoten (Knoten) und sind über das TCP / IP-Netzwerk verbunden. Die verbundenen Geräte bilden somit einen sogenannten vertrauenswürdigen Pool , dh eine Reihe vertrauenswürdiger Server. Diese Server stellen dem Benutzer ihre Speicher in Form von Bausteinen (Bausteinen) zur Verfügung , in denen schließlich Volumes (Volumeneinheiten) erstellt werden , die dann als normale Speichermedien integriert und verwendet werden können. Die Computer, die auf das System zugreifen, werden als Clients oder Clients bezeichnet, und es ist möglich, dass sie gleichzeitig auch als Server fungieren.
Eine Besonderheit von GlusterFS ist die hervorragende Skalierbarkeit , mit der beliebig viele Knoten und Bausteine nachträglich hinzugefügt werden können. Auf diese Weise kann der Speicherplatz kontinuierlich an die Anforderungen jedes Augenblicks angepasst werden. Die maximale Größe des Speicherplatzes, der verarbeitet werden kann, beträgt mehrere Petabyte .
Darüber hinaus stellt GlusterFS sicher, dass Daten im Falle eines Absturzes nicht verloren gehen, indem sie redundant gespeichert werden . Auf diese Weise wird das Risiko auf mehrere Systeme verteilt, die sich möglicherweise auf separaten physischen Medien befinden. Es ist auch möglich, RAID- Cluster zu erstellen , bei denen ein kopiertes Laufwerk ( repliziertes Volume ) anstelle eines verteilten ( verteiltes Volume ) hinzugefügt werden muss , wie dies normalerweise die Standardoption ist. Dieses kopierte Laufwerk speichert jede Datei doppelt und entspricht dem sogenannten Mirror-RAID .
Ein redundantes Array unabhängiger Festplatten (RAID) ist eine Reihe von Festplatten, die physisch unabhängig voneinander sind, aus denen jedoch eine einheitliche Speichereinheit erstellt wird. Abhängig vom Ziel der Suite kann mehr Aufwand betrieben werden, um sie schnell zu machen oder die Datensicherheit zu gewährleisten. Durch Auswahl der zweiten Priorität wird der Speicherplatz reduziert, indem wiederholt Daten oder zusätzliche Informationen gespeichert werden, die für die Wiederherstellung im Falle eines Verlusts erforderlich sind.
Für Aktionen auf Speicherplatz bietet GlusterFS zehn vordefinierte Übersetzer an , die sich darum kümmern Transformieren Sie Anforderungen mit Benutzerrechten, damit sie im Speicher ausgeführt werden können. Einige Beispiele für Übersetzer sind Speicher , der Daten im lokalen Dateisystem speichert und den Zugriff darauf regelt. und Verschlüsselung , die für die Verschlüsselung verantwortlich ist.
Vor nicht allzu langer Zeit gab es eine Georeplikationsfunktion , die die asynchrone Verteilung von Daten auf Servern an verschiedenen Standorten ermöglicht. Diese Aktion bietet auch Schutz vor möglichen physischen Schäden an den Servern, z. B. durch Feuer oder Diebstahl. In der Georeplikación übernimmt ein Computer die Rolle des Masters ( Master ) und der andere des Slaves ( Slaves ), und die Datenübertragung wird mithilfe von SSH (Secure Shell) gesichert.
Vor- und Nachteile von GlusterFS
In der folgenden Tabelle haben wir die wichtigsten Vor- und Nachteile eines verteilten Dateisystems im Vergleich zu einem herkömmlichen Netzwerkspeichersystem zusammengefasst:
Glanzvorteile | Gluster Nachteile |
---|---|
Gute Kapazitätsauslastung | Komplexe Netzwerkstruktur |
Mehr Sicherheit gegen Pannen | Größerer Verwaltungsaufwand für die Installation |
Netzwerklastverteilung | Erfordert eine schnelle Netzwerkinfrastruktur |
Sehr gute Skalierbarkeit | Technische Sicherheit erfordert zusätzliche Arbeit |
Anwendungsbeispiele für GlusterFS
Im Prinzip stellt GlusterFS eine Modellwolke dar : einen Speicherplatz, der auf einer Reihe von Computern basiert und verbundenen Clients zur Verfügung gestellt wird. Dieses System ist besonders nützlich in großen Netzwerken, die bereits über genügend Ressourcen verfügen, um einen Cluster zu erstellen, dh viele Computer, die miteinander verbunden werden können.
Da die Geräte über das Internetprotokoll miteinander verbunden sind, eignen sich Geschäftsstrukturen mit mehreren Zweigen besonders zur Implementierung eines verteilten Dateisystems. Kleinere geografische Netzwerkstrukturen können dieses System jedoch auch nutzen, um zu vermeiden, dass ein eigener Netzwerkspeicherplatz erforderlich ist, ohne die Redundanz im Speicher zu beeinträchtigen.
Möchten Sie selbst mit GlusterFS arbeiten? IONOS bietet einen ausführlichen Artikel in englischer Sprache mit schrittweisen Anweisungen zum Installieren und Konfigurieren des Dateisystems.
Alternativen zu GlusterFS
Die beliebteste Alternative zu GlusterFS ist Ceph , das ebenfalls kostenlos erhältlich ist und viele der oben beschriebenen Vorteile bietet, die nur für verteilte Dateisysteme gelten. Sowohl Ceph als auch Gluster haben jedoch unterschiedliche Vor- und Nachteile.
Für Hochleistungsrechnersysteme hat eines der Fraunhofer-Institute BeeGFS (ehemals FhGFS) entwickelt, das ebenfalls kostenlos angeboten wird und bei dem die Benutzerfreundlichkeit Priorität hat.
Im kommerziellen Bereich gibt es auch Systeme wie Microsoft Storage Spaces Direct (S2D), die hingegen nur mit Windows-Servern verwendet werden können, für die eine kostenpflichtige Lizenz erforderlich ist.