• IT-Karriere:
  • Services:

Security: Forscher können Autoren von Programmiercode identifizieren

Wie normale Texte besitzt auch Programmiercode bestimmte stilistische Eigenschaften. Diese reichen aus, um auch aus anonymen Codefragmenten den Autor herauszulesen, wie zwei Wissenschaftler zeigen. Ihre Methode funktioniert sogar mit kompiliertem Code recht zuverlässig.

Artikel veröffentlicht am ,
Quellcode kann durch den Stil den Autor verraten.
Quellcode kann durch den Stil den Autor verraten. (Bild: Tobias Költzsch/Golem.de)

Zwei Wissenschaftler aus den USA haben eine Methode entwickelt, mit der anonym verfasster Programmiertext Autoren zugeordnet werden kann. Über die Forschungsergebnisse von Rachel Greenstadt von der Drexel University und Aylin Caliskan von der George Washington University berichtet Wired.

Stellenmarkt
  1. Hochschule Furtwangen, Furtwangen
  2. Deutsches Krebsforschungszentrum (DKFZ), Heidelberg

Mit Hilfe von Maschinenlernalgorithmen können die beiden Wissenschaftler aus dem Quellcode den Autor herausfinden, auch wenn dieser ihnen zuvor nicht bekannt ist. Der Algorithmus muss aber trainiert werden, sprich: Er muss zuvor bekanntes Codematerial verarbeiten. Hierfür genügen den Wissenschaftlern zufolge aber schon kurze Fragmente.

Programmierstil ist eindeutig zuzuordnen

Die Analyse basiert nicht auf einfachen äußerlichen Merkmalen wie dem Setzen von Absätzen, sondern erfolgt anhand des Programmierstils. Wie bei einem Schreibstil ermöglicht es dieser, Coder voneinander zu unterscheiden und wiederzuerkennen.

Die Identifizierung funktioniert den Angaben zufolge sogar mit kompiliertem Quellcode, da der Programmierstil auch die Kompilierung übersteht. Dabei wird der Quelltext zurück in C++ dekompiliert. Mit Code-Fragmenten von Googles Code-Jam-Veranstaltung konnten Greenstadt und Caliskan auf diese Weise eine Gruppe von 100 Programmierern mit einer Erfolgsquote von 96 Prozent korrekt identifizieren.

Nach Angaben der Wissenschaftler kann ihr Ansatz dazu verwendet werden, Plagiate aufzudecken. Sie weisen aber auch darauf hin, dass das Verfahren dazu verwendet werden kann, Programmierer zu benennen, die eigentlich anonym bleiben wollen. Es könnte beispielsweise von autoritären Regimes verwendet werden, um Programmierer eines die Zensur umgehenden Tools ausfindig zu machen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. (u. a. The Elder Scrolls: Skyrim VR für 26,99€, Wolfenstein 2: The New Colossus für 11€, Prey...
  2. (u. a. This War of Mine für 4,75€, Children of Morta für 11,99€, Frostpunk für 9,99€, Beat...
  3. 15,49€

Aluz 17. Aug 2018

Es ist tatsaechlich so, dass viel des originalen stiles noch im "optimierten" code...

Proctrap 17. Aug 2018

bitte, traurig dass es immer noch stimmt Edit merkt an dass damit die Ignorieren Funktion...

0110101111010001 14. Aug 2018

Nach mehr als 3 Jahren kommt die News auch mal bei Golem.de an? :D


Folgen Sie uns
       


    •  /