Global File System: Was bedeutet das und was kann man damit machen?
Dateisysteme in Netzwerken stehen vor besonderen Aufgaben. Zahlreiche PCs greifen auf Dokumente zu, speichern sie ab oder erstellen neue. Dennoch müssen alle Zugriffe reibungslos funktionieren. Ein Dateisystem, das speziell für diese Anforderungen konzipiert wurde, ist das Global File System. Was es kann, zeigt der Artikel.
/wedata%2F0030477%2F2011-07%2F1-Printing-in-networks--Source--Author-ThinPrint-A_3.jpg)
Hintergrundinfos
Global File System, kurz GFS ist ein so genanntes Cluster Filesystem. Dazu später mehr. Nicht verwechseln darf man GFS mit dem Google File System. Letztgenanntes ist eine Eigenentwicklung von Google, die es ausschließlich auf ihren Internetservern nutzt. Es wurde speziell für Suchmaschinenanfrage verbessert. Dennoch gibt es auch Parallelen zum GFS, denn beide Dateisysteme laufen ausschließlich unter Linux. GFS hingegen war Anfangs nur eine Machbarkeitsstudie an der Universität von Minnesota. Über einige Umwege gelangte die bekannte Linuxschmiede Red Hat an die Rechte für das Dateisystem und stellt seitdem passende Module für den Linux-Kernel zur Verfügung.
Besonderheiten des Cluster-Dateisystems
Doch was macht GFS so besonders? In Netzwerken werden üblicherweise Daten zentral über einen Server gehandelt. Dies setzt besondere Netzwerkdateisystem wie etwa NFS oder CIFS voraus. Der Nachteil eines derartigen Netzwerkzugriffes ist jedoch die Geschwindigkeit. Was bei 10 Client-Rechnern noch nicht ins Gewicht fällt, führt bei hunderten oder tausenden gleichzeitigen Zugriffen zu deutlichen Einbusen der Geschwindigkeit. Eine wesentlich bessere Performance erreicht man, wenn man einen direkten Lese- und Schreibzugriff auf den Speicherträger eines Storage Area Networks, kurz SAN, erlaubt. Doch auch dies birgt neue Herausforderungen. Wenn eine Datei auf dem SAN für hunderte Nutzer gleichzeitig verfügbar ist, stellt sich vor allem eine Frage: Wie regelt man einen koordinierten Zugriff mehrerer Benutzer auf eine einzige Datei? Öffnet ein Anwender das Dokument und verändert sie, zum Beispiel in dem er weitere Informationen ergänzt, während ein weiterer Nutzer ebenfalls Veränderungen an derselben Datei vornimmt, tritt ein in der EDV unbedingt zu vermeidendes Risiko auf: Inkonsistenz. Speichern beide Nutzer die Datei zurück auf das SAN, droht grundsätzlich Datenverlust. Doch das GFS ist genau auf diese Sonderfälle ausgelegt und bietet eine integrierte Steuerungsaufgabe, die den Verlust von Daten verhindert.
Häufige Irrtümer
Viele Menschen denken, dass man mit GFS Cluster keine weiteren Datensicherungen benötigt, schließlich sind Daten redundant gespeichert. Das bedeutet, die Informationen, aus denen eine Datei besteht, sind mehrfach auf dem Datenträger gesichert. Im Fall der Fälle könnte man also aus den verteilten Datei-Happen die ursprüngliche Datei wiederherstellen. Doch das ist definitiv falsch. Backups braucht es auch beim Linux Cluster Filesystem.