Original-URL des Artikels: https://www.golem.de/news/mariadb-maxscale-die-fehlende-komponente-fuer-verteilte-mysql-setups-1501-111953.html    Veröffentlicht: 29.01.2015 16:13    Kurz-URL: https://glm.io/111953

MariaDB Maxscale

Die fehlende Komponente für verteilte MySQL-Setups

MariaDB Maxscale kann den Betrieb von verteilten MySQL- und MariaDB-Setups erheblich vereinfachen. Wir haben uns die erste stabile Version der Software angesehen, die als Proxy, Binlog-Server und Loadbalancer in MySQL-Setups eingesetzt werden kann.

MariaDB hat mit Maxscale 1.0 GA einen flexiblen MySQL-Proxy veröffentlicht, der die Skalierung von MySQL-Installationen erheblich vereinfachen soll. Er soll zugleich als MySQL-Loadbalancer und Binlog-Server eingesetzt werden können. Die Software ermöglicht es, Datenbank-Querys anhand von Regeln auf unterschiedliche MySQL-Server und -Cluster zu verteilen, ohne dass die eigentliche Applikation angepasst werden muss.

MySQL lässt sich horizontal, also durch das Hinzufügen weiterer Server, skalieren. Das geht durch Replikation der Daten von einem auf einen oder mehrere Server, das Sharding genannte Aufteilen der Daten, wenn ein Server die Schreiblast nicht bewältigen kann, oder den Aufbau eines Clusters. Durch verteilte Setups werden die Datenbanken zudem sicherer vor Ausfällen. All diese Ansätze aber erhöhen die Komplexität, was im Betrieb zu höheren Kosten führt. Zudem muss in aller Regel die eingesetzte Software geeignet sein, ein verteiltes Datenbank-Setup effizient zu nutzen.

Datenbank-Proxys sollen helfen, die Komplexität zu reduzieren, denn der Proxy verteilt die Datenbankanfragen auf die verschiedenen Datenbankserver. Es ist also nicht mehr nötig, die Applikation anzupassen. Allerdings sind Lösungen wie MySQL Proxy oder HAProxy nicht überzeugend.

Maxscale versteht Querys dank MariaDB-Parser

Mit Maxscale bietet MariaDB nun eine weitere Option an, die seit kurzem in der ersten stabilen Version 1.0 GA zur Verfügung steht. Der Unterschied zu den zuvor genannten Datenbank-Proxys ist auf den ersten Blick groß: Maxscale weiß, dass es mit Datenbanken spricht und kennt, richtig konfiguriert, den Zustand der Backend-Server. So kann Maxscale reagieren, wenn ein Slave-Server nicht mit seinem Master synchron ist oder die Replikation nicht mehr funktioniert.

Darüber hinaus versteht Maxscale die Querys, denn es verwendet den gleichen Parser wie MariaDB. So kann die Software anhand von Filtern und Regeln unterschiedlich reagieren, um die Anfragen beispielsweise auf einen oder mehrere Datenbankserver zu verteilen und die Querys, wenn nötig, verändern. Auch erhält der Nutzer ein zentrales Performance-Log über alle Server und kann veraltete Applikationen an neue Datenbankversionen anbinden.

Mit Plugins flexibel erweiterbar

Maxscale lässt sich dabei mittels Plugins erweitern. So kann beispielsweise Sharding implementiert werden, ohne dass die Applikation davon etwas mitbekommt. Auch eine MySQL-Firewall kann umgesetzt werden, die SQL-Injection-Angriffe verhindert. Es ist so möglich, den Masterserver in einem Setup umzustellen, ohne dass die Applikation angepasst werden muss, oder einzelne Querys mit Hilfe eines regulären Ausdrucks auf einen bestimmten Server zu leiten.

Per Plugin kann Maxscale auch als Binlog-Server eingesetzt werden. Er fungiert dabei gegenüber dem MySQL-Master als Client, speichert die Binlogs zwischen und tritt gegenüber den Slave-Servern als Master auf. Da Maxscale darüber hinaus aber keine Daten speichert und keine Querys ausführt, ist ein Binlog-Server mit Maxscale schneller und kleiner als einer mit MySQL oder MariaDB.

Installation und Konfiguration

Die Installation von Maxscale selbst ist schnell erledigt. MariaDB stellt fertige Pakete für diverse Linux-Distributionen bereit. Da wir bei Syseleven Gentoo als primäre Distribution einsetzen, haben wir ein Ebuild für Maxscale geschrieben, das bei Github zum Download bereitsteht. Für einen ersten Test haben wir einen MariaDB Galera Cluster verwendet.

Die Konfiguration des Maxscale-Proxys besteht ganz grob aus zwei Teilen: den sogenannten Services und den dazugehörigen Listenern. Im Listener wird definiert, wie Maxscale Anfragen annimmt und an welchen Dienst (Service) diese weitergereicht werden. Im Service wird dann festgelegt, auf welche Backend-Server die Anfragen in welcher Art und Weise weitergereicht werden sollen.

Beispiel:



Der dazugehörige Listener sieht so aus:



Nach dem Start von Maxscale lauscht Maxscale nun also auf 192.0.0.1:3306 und reicht Querys an die Server srv1, srv2 und srv3 weiter. Auf der Kommandozeile (CLI) sieht das folgendermaßen aus:



Die Basisfunktionalität ist also hergestellt. Im Maxscale-CLI können wir nun Performance-Werte abrufen oder auch Backend-Server in den Maintenance-Modus versetzen:



Filter

Wie eingangs schon erwähnt, lassen sich Querys anhand von Filtern auf verschiedene Backend-Server verteilen, je nach Art der Query. So ist es beispielsweise möglich, MariaDB Galera Cluster und Standard-MySQL-Server miteinander zu mischen. Besonders interessant ist der sogenannte Readwrite-Splitrouter, da er auf den Einsatz mit einem Master-Slave-Setup abzielt. Er lässt sich wie folgt mit einem typischen Master-Slave-Setup einrichten:



In der Applikation gibt man nun nur 192.0.0.1 als Datenbank-Host an, den Rest erledigt Maxscale. Konkret bedeutet das: Querys, die nur lesend auf Daten zugreifen, werden auf den Slave-Server geleitet. Querys, die Daten schreiben oder verändern, landen auf dem Master-Server. Werden Daten sehr viel häufiger gelesen als geschrieben, wie es bei Webanwendungen üblicherweise der Fall ist, lässt sich das Setup leicht um weitere Slave-Server ergänzen.



Welche Querys Maxscale als schreibend oder lesend kategorisiert, ist im Read-Write-Splitting-Tutorial von MariaDB dokumentiert. Kurz zusammengefasst werden folgende Querys an den Master geschickt:



Folgende Querys werden an den Slave geschickt:



Daneben gibt es nur Querys, die an alle Session-Backends geleitet werden:



Auf den ersten Blick macht Maxscale einen hervorragenden Eindruck. Der Nutzer kann Anfragen auf Master und Slaves verteilen, ohne Änderungen an der Applikation vornehmen zu müssen.

Der Autor, Thomas Stein, arbeitet als Senior Systems Engineer beim Berliner Webhoster Syseleven.  (thst)


Verwandte Artikel:
Connect 2017: Microsoft setzt weiter auf Enterprise-Open-Source   
(15.11.2017, https://glm.io/131161 )
Neue Open-Source-Angebote von MySQL   
(13.09.2007, https://glm.io/54737 )
Azure: Microsoft betreut MySQL und PostgreSQL in der Cloud   
(11.05.2017, https://glm.io/127772 )
Stretch: Debian 9 erscheint in Erinnerung an Projektgründer   
(19.06.2017, https://glm.io/128440 )
IT-Sicherheit: Wie ich mein Passwort im Stack Trace fand   
(12.04.2017, https://glm.io/127258 )

© 1997–2019 Golem.de, https://www.golem.de/