Syntax und Programmierstil
Da sich Programmierer meistens an die Syntax und Semantik ihrer Lieblingssprache gewöhnen, hier ein paar Worte aus der Sicht eines C/C++-Programmierers. Auf den ersten Blick ähnelt die Syntax im Hello-World-Programm stark der Programmiersprache C. Wird allerdings ein größeres Projekt betrachtet, sind fast keine Ähnlichkeiten zu C mehr zu erkennen, sondern mehr zu Python und C++.
Eine Funktion, die vor allem Benutzern von Skriptsprachen bekannt vorkommen wird, ist die Unterstützung von Tupeln direkt in der Programmiersprache. Dies ermöglicht es, aus einer Funktion heraus mehrere Werte zurückzugeben.
Ebenfalls ähnlich wie bei vielen Skriptsprachen verhält sich der Operator "let", der Variablen deklariert und initialisiert. Er kann im Gegensatz zu C/C++ links und rechts des "="-Operators mehrere Elemente verarbeiten und benutzt Pattern Matching, um die jeweiligen Elemente zuzuweisen.
Anders als bei vielen verbreiteten Programmiersprachen müssen in Rust Variablen mit dem Schlüsselwort "mut" explizit als veränderbar markiert werden, während ansonsten meist Konstanten explizit als solche definiert werden müssen. Wird eine Variable ohne "mut" initialisiert und darauf geschrieben, lässt sich das Programm nicht kompilieren.
// Funktion, die ein Tupel zurückgibt fn get_tuple() -> (i8,i8) { let a = 4; let b = 2; // a und b zu Tupel zusammenfassen (a,b) } fn main() { // pattern matching, um das Tupel wieder zu trennen let (x1, x2) = get_tuple(); println!("x1: {}", x1); println!("x2: {}", x2); // Werte sind automatisch Konstanten let ro = 3; // Variable als veränderbar deklarieren let mut rw = 2; rw = 10; // zulässig // ro = 7; unzulässig, }
Sichere und effiziente Speicherverwaltung
Bei Rust muss sich der Programmierer wenig mit der Speicherverwaltung auseinandersetzen, alle primitiven Datentypen werden am Stack abgelegt, die restlichen auf dem Heap. Allerdings steht, um Daten explizit am Heap abzulegen, der Zeigertyp "Box" zur Verfügung.
Darüber hinaus ist Rust mit dem Ziel erstellt worden, eine sichere Sprache für parallel ablaufende Programme zu sein und dabei dennoch die Geschwindigkeit von C/C++ zu erreichen. Dazu werden viele unsichere Speicherzugriffe bereits zur Kompilierzeit erkannt, was der Sprache eine aufwendige Laufzeitumgebung erspart und sie so effizienter macht als andere High-Level-Programmiersprachen wie C# und Java. Rust verhindert außerdem sogenannte Data Races. Diese treten auf, wenn mehrere Threads dieselben Datenbereiche bearbeiten oder mehrere Zeiger auf einem Speicherbereich existieren, was zu unerwünschtem Verhalten des Programms führen kann.
Rust setzt für die sicheren Speicherzugriffe auf ein System von Zeigerbesitzrechten (Pointer Ownership) und Zeigerlebenszeiten (Pointer Lifetime). Durch Pointer Ownership wird garantiert, dass immer nur eine Referenz auf ein Objekt existiert. Durch Pointer Lifetime wird sichergestellt, dass, sobald die Referenz auf ein Objekt den Arbeitsbereich verlässt, dessen Speicher freigegeben wird.
Außerdem kann eine Funktion einen Zeiger ausborgen (Borrowing), dabei erhält die Funktion vorübergehend eine Referenz auf die Daten, die nach dem Verlassen der Funktion dann nicht freigegeben wird und somit weiter verwendet werden darf. Rust kann mit diesem System allerdings nur eine bestimmte Klasse von Fehlern in der Speicherverwaltung verhindern.
Dazu zählen Nullzeigerdereferenzierung, Zugriff auf bereits freigegebenen Speicher (Use after free), Lesen von nicht initialisiertem Speicher (liefert undefinierte Daten) sowie mehrfaches Freigegeben von Speicher (double free). Explizit nicht zu dieser Gruppe gehören Integer Overflows und das Lesen zum Beispiel über eine Array-Grenze hinaus (Out of Bounds Access). Letzteres ist im Gegensatz zu C/C++ aber definiertes Verhalten und führt zu einem "panic", einem sicheren Beenden des Programms.
Hier ein kurzes Beispiel zu Zeigern in Rust:
// verwendet eine Referenz auf die Variable fn borrow_var(a: &Vec<i8>) { // Hier wird a verwendet println!("a[0] in borrow: {}", a[0]); // a wird nicht freigegeben } // übernimmt die ganze Variable fn move_var(b: Vec<i8>) { println!("b[0] in move: {}", b[0]); // b wird freigegeben und ist somit in main() nicht mehr vorhanden } fn main() { let v1 = vec![1, 2, 3]; // Vektor mit 1,2,3 als Inhalt borrow_var(&v1); // Funktionsaufruf mit Borrowing-Verhalten move_var(v1); // Funktionsaufruf mit Move-Verhalten // Funktioniert nicht, da v1 schon an move_var() übergeben wurde //println!("v1[0] in main: {}", v1[0]); }
Im obigen Beispiel sind Pointer Ownership, Lifetime und Borrowing praktisch dargestellt. Zuerst wird ein Vektor auf dem Heap abgelegt und eine Referenz darauf in "v1" gespeichert, "v1" "gehört" nun der Funktion "main()". Der Funktion "borrow_var()" wird nun mit dem "&"-Operator eine Referenz geborgt, sie wird in der Funktion verwendet und kann anschließend wieder in "main()" benutzt werden.
Im zweiten Schritt wird nun "v1" ohne den "&"-Operator übergeben, dies bedeutet, "v1" gehört nun "move_var()". Endet der Arbeitsbereich der Funktion, endet auch die Lebenszeit von "v1" und der Speicher wird freigegeben. Rust verhindert auch, dass "v1" innerhalb von "main()" weiterverwendet wird. Da der Speicher ja bereits freigegeben wurde, führt ein Zugriff darauf zu einem Fehler beim Kompilieren.
In C wäre es ohne Fehler beim Kompilieren möglich, den Speicher einer Variablen freizugeben und anschließend darauf zuzugreifen. Prompt hätte man einen Absturz des Programms oder eine schwere Sicherheitslücke, da das Betriebssystem den Speicher vielleicht schon anderweitig verwendet hat.
Such dir deine Garantien aus!
In dem Beispiel wurden nur einfache Referenzen benutzt, die vom Rust-Compiler statisch geprüft werden können. In der Standardbibliothek finden sich allerdings auch viele Implementierungen intelligenter Referenzen, die jeweils bestimmte Eigenschaften garantieren und andere undefiniert lassen, um schneller zu sein.
So zum Beispiel "Rc", der einem Zeiger mit Referenzzählung entspricht. Dieser garantiert zur Laufzeit, dass der Speicher erst dann freigegeben wird, wenn die letzte Referenz darauf freigegeben wurde, aber nicht, dass keine zyklischen Referenzen entstehen, was zu Speicherlecks führt.
Dieses Verhalten funktioniert jedoch nur innerhalb eines Threads, für Anwendungen mit mehreren Threads oder andere Sonderfälle existieren wiederum verschiedene andere Referenztypen, die hier detailliert aufgelistet sind.
Dieses System ähnelt sehr stark den intelligenten Zeigern in C++, die eine feinkörnige Auswahl aus nötigen Garantien ermöglichen und somit die Ausführungsgeschwindigkeit hochhalten. Java und C# gehen hier den Weg über einen Garbage Collector, der zur Laufzeit immer wieder nicht mehr referenzierte Objekte aus dem Speicher entfernt; natürlich geht das Aufräumen dann auch auf Kosten der Verarbeitungsgeschwindigkeit.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Rust: Ist die neue Programmiersprache besser? | Die dunkle Seite von Rust |
Was soll die Negierung hinter println, und bez. Ausgaben war C++ mit Streams schon vor...
Au, das tut wirklich weh :-(
Ein weiteres mal, dass deutlich darauf hingewiesen werden muss, dass JavaScript und Java...
Ich erinnere mich an einen Artikel (Wired?), in dem die Dropbox-Macher ihre Entscheidung...