Big Data: Microsoft legt Graph Engine offen

Microsoft hat mit der Graph Engine eines seiner langjährigen internen Forschungsprojekte als Open-Source-Software auf Github(öffnet im neuen Fenster) veröffentlicht. Bei der Graph Engine handelt es sich um eine Big-Data-Analyseplattform, die eine integrierte Abfragesprache enthält (Language Integrated Knowledge Query, LIKQ). Letztere nutzt Microsoft auch für seine Cloud-API der sogenannten Cognitive Services(öffnet im neuen Fenster) .
Wie zu erwarten, enthält die Graph Engine ein Modell zur Repräsentation der Graphen sowie Schnittstellen für Nutzer, um auf diese zuzugreifen. Der wohl wichtigste Teil der Graph Engine ist allerdings der Speicherpool(öffnet im neuen Fenster) , der den Arbeitsspeicher verschiedener Cluster von Maschinen zu einem global adressierbaren Adressraum zusammenfasst, um die eigentlichen Daten zu speichern.
Diese Speicher-Cloud genannte Verknüpfung der Server nutzt einen verteilten Key-Value-Store sowie ein eigens implementiertes Framework, um zwischen den beteiligten Servern kommunizieren zu können. Die Server selbst speichern aber nicht nur die Daten, sondern führen auch direkt Berechnungen auf diesen durch. Über Proxy- und Client-Systeme, die selbst keine Daten vorhalten, kann auf die Daten beziehungsweise Ergebnisse der Berechnungen zugegriffen werden.
Zur einfachen Verwendung der Graph Engine bietet Microsoft eine Erweiterung für Visual Studio(öffnet im neuen Fenster) an, die das Team als SDK zum Entwickeln von Anwendungen bezeichnet. Der Code für die Engine selbst ist in C# mit .Net geschrieben und folgerichtig als Nuget-Paket(öffnet im neuen Fenster) über die entsprechende Paketverwaltung zu beziehen. Da das neue .Net Core ebenfalls Open Source ist und eine Linux-Unterstützung bietet, könnte die Graph Engine künftig wohl auch auf Linux portiert werden. Noch gibt es hierzu aber keine konkreten Pläne.