Trojan Source: Programmiersprachen lassen sich per Unicode trojanisieren

Ein Forschungsteam zeigt systematisch, wie sich mit Unicode-Tricks Code manipulieren lässt. Open-Source-Communitys und die IT-Industrie reagieren.

Ein Bericht von und veröffentlicht am
Wie dieser Sourcecode wohl für einen Compiler ausssieht?
Wie dieser Sourcecode wohl für einen Compiler ausssieht? (Bild: fancycrave1/Pixabay)

Praktisch alle großen Programmiersprachen lassen sich mit einem Trick trojanisieren. So lassen sich über Unicode-Befehle Sicherheitslücken in den Code einbringen, die von Menschen unter Umständen nur schwer erkannt werden, durch das Kompilieren jedoch zu Schadfunktionen werden können. Das beschreiben die Sicherheitsforscher Nicholas Boucher und Ross Anderson von der Cambridge Universität in einer aktuellen Untersuchung.

Inhalt:
  1. Trojan Source: Programmiersprachen lassen sich per Unicode trojanisieren
  2. Entwicklungswerkzeuge informieren über Unicode-Fehler

Hintergrund ist der digitale Textkodierungsstandard Unicode, der mehr als 143.000 Zeichen verschiedener Schriftsysteme enthält. Diese können wie etwa für Arabisch von rechts nach links oder wie für Deutsch und Englisch von links nach rechts gelesen werden. Die unterschiedliche Anzeigenreihenfolge von gemischten Texten kann mit dem bidirektionalen oder Bidi-Algorithmus gehandhabt werden.

"In einigen Szenarien kann die vom Bidi-Algorithmus vorgegebene Reihenfolge nicht ausreichend sein", schreiben Boucher und Anderson in dem Papier (PDF). "Für diese Fälle ermöglichen Bidi-Override-Steuerzeichen das Umschalten der Anzeigereihenfolge von Gruppen von Zeichen." Damit lassen sich einzelne Zeichen einer Zeichenkette in einer anderen Reihenfolge darstellen, etwa um ein Wort auf Arabisch im Original in einen Satz auf Deutsch einzufügen.

Zusammenfassung bestehender Ideen zu Unicode-Tricks

Das Problem ist, dass die meisten Programmiersprachen die Bidi-Overrides auch in Kommentaren oder Strings erlauben, die beim Kompilieren interpretiert werden und die Reihenfolge des programmierten Codes ändern. Dadurch lässt sich die Logik des Programmes syntaktisch korrekt ändern und Programm A wird in Programm B verwandelt. Entsprechend bezeichnen die Forscher die Sicherheitslücke (CVE-2021-42574, CVE-2021-42694) als Trojan Source.

Stellenmarkt
  1. Payroll Technology Solution Lead (m/f/x)
    Autodoc AG, Berlin, Szczecin (Polen), Cheb (Tschechien)
  2. UI Designer / Webentwickler (m/w/d) im Bereich Software Entwicklung
    ASCon Systems GmbH, Stuttgart, Mainz, München
Detailsuche

Das von den Forschern beschriebene Vorgehen wurde in der Vergangenheit bereits ausgenutzt, um Dateiendungen von per E-Mail verbreiteter Schadsoftware zu verschleiern. Auch für Programmiersprachen ist es nicht völlig unbekannt. So finden sich derartige Überlegungen seit Jahren in Diskussionen etwa bei Eclipse, Go, Ruby oder der für Ethereum genutzten Sprache Solidity. Die Forscher beschreiben auch Homoglyph-Angriffe, die es so ähnlich auch beim DNS seit Jahrzehnten gibt.

Die beiden Forscher haben nun aber diese theoretischen Angriffe zusammengefasst, als grundlegendes Problem für die Mehrheit der Programmiersprachen beschrieben und sich um ein möglichst weitgehendes sogenanntes Coordinated Disclosure bemüht, also zahlreiche betroffenen Stellen informiert. Auch sorgt die Vergabe von CVE-Nummern in der Software-Industrie mitunter erst dafür, dass derartige Probleme wahrgenommen und weitgehend bearbeitet werden.

Aus der IT-Sicherheitscommunity kam teilweise Kritik an der Art der Veröffentlichung. So stellten die Autoren Angriffe als neu dar, die in ähnlicher Weise bereits vorher öffentlich bekannt waren. Filippo Valsorda vom Go-Sicherheitsteam zweifelte auf Twitter an der Sinnhaftigkeit zu versuchen, solche Angriffe in Compilern zu blockieren. Das sei eher die Aufgabe von Reviewtools und Editoren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Entwicklungswerkzeuge informieren über Unicode-Fehler 
  1. 1
  2. 2
  3.  


Jakelandiar 09. Nov 2021

Ist für mich das gleiche :-) Und das verstehe ich nicht. Warum soll ich das in der...

Eheran 04. Nov 2021

Ist das jetzt ernst gemeint oder nicht?

Gamma Ray Burst 03. Nov 2021

Interessant Rust scheint das zu prüfen

Alex_M 02. Nov 2021

https://i.blackhat.com/USA-19/Thursday/us-19-Birch-HostSplit-Exploitable-Antipatterns-In...

Mel 02. Nov 2021

"Das ist doch gar kein Problem, da fällt doch keiner drauf rein..." "Wenn der Compiler...



Aktuell auf der Startseite von Golem.de
LaTeX
Schreibst du noch oder setzt du schon?

LaTeX lohnt sich nicht für jeden, für manche dafür umso mehr. Warum die Text-Programmiersprache nach 40 Jahren noch so treue Fans hat.
Eine Anleitung von Uwe Ziegenhagen

LaTeX: Schreibst du noch oder setzt du schon?
Artikel
  1. Bundesservice Telekommunikation: Schlecht getarnte Tarnorganisation praktisch enttarnt
    Bundesservice Telekommunikation
    Schlecht getarnte Tarnorganisation praktisch enttarnt

    Inzwischen ist offensichtlich, dass der Bundesservice Telekommunikation zum Bundesamt für Verfassungsschutz gehört.
    Von Friedhelm Greis

  2. Neuer Chromecast geplant: Google will es mit Amazon und Roku aufnehmen
    Neuer Chromecast geplant
    Google will es mit Amazon und Roku aufnehmen

    Mit einem neuen Chromecast-Modell will Google im umkämpften Einsteigermarkt für Streaminggeräte gegen den Fire TV Stick und den Roku-Stick bestehen.

  3. Elektro-Pick-up: Neuer Tesla-Cybertruck-Prototyp gefilmt
    Elektro-Pick-up
    Neuer Tesla-Cybertruck-Prototyp gefilmt

    In einem Video wird ein neuer Cybertruck-Prototyp von Tesla im Detail gezeigt. Es stammt vermutlich aus der Gigafactory in Texas.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gainward RTX 3080 12GB 1.499€ • AMD Ryzen 9 5950X 689€ • Acer Curved Gaming-Monitor 27" 259€ • RTX 3070 8GB 939€ • MindStar (u.a. 8GB DDR5-4800 89€) • 4 Blu-rays für 22€ • LG OLED (2021) 77 Zoll 120Hz 2.799€ [Werbung]
    •  /