Abo
  • Services:

Security: Forscher können Autoren von Programmiercode identifizieren

Wie normale Texte besitzt auch Programmiercode bestimmte stilistische Eigenschaften. Diese reichen aus, um auch aus anonymen Codefragmenten den Autor herauszulesen, wie zwei Wissenschaftler zeigen. Ihre Methode funktioniert sogar mit kompiliertem Code recht zuverlässig.

Artikel veröffentlicht am ,
Quellcode kann durch den Stil den Autor verraten.
Quellcode kann durch den Stil den Autor verraten. (Bild: Tobias Költzsch/Golem.de)

Zwei Wissenschaftler aus den USA haben eine Methode entwickelt, mit der anonym verfasster Programmiertext Autoren zugeordnet werden kann. Über die Forschungsergebnisse von Rachel Greenstadt von der Drexel University und Aylin Caliskan von der George Washington University berichtet Wired.

Stellenmarkt
  1. ING-DiBa AG, Nürnberg
  2. i-SOLUTIONS Health GmbH, Bochum, Düsseldorf

Mit Hilfe von Maschinenlernalgorithmen können die beiden Wissenschaftler aus dem Quellcode den Autor herausfinden, auch wenn dieser ihnen zuvor nicht bekannt ist. Der Algorithmus muss aber trainiert werden, sprich: Er muss zuvor bekanntes Codematerial verarbeiten. Hierfür genügen den Wissenschaftlern zufolge aber schon kurze Fragmente.

Programmierstil ist eindeutig zuzuordnen

Die Analyse basiert nicht auf einfachen äußerlichen Merkmalen wie dem Setzen von Absätzen, sondern erfolgt anhand des Programmierstils. Wie bei einem Schreibstil ermöglicht es dieser, Coder voneinander zu unterscheiden und wiederzuerkennen.

Die Identifizierung funktioniert den Angaben zufolge sogar mit kompiliertem Quellcode, da der Programmierstil auch die Kompilierung übersteht. Dabei wird der Quelltext zurück in C++ dekompiliert. Mit Code-Fragmenten von Googles Code-Jam-Veranstaltung konnten Greenstadt und Caliskan auf diese Weise eine Gruppe von 100 Programmierern mit einer Erfolgsquote von 96 Prozent korrekt identifizieren.

Nach Angaben der Wissenschaftler kann ihr Ansatz dazu verwendet werden, Plagiate aufzudecken. Sie weisen aber auch darauf hin, dass das Verfahren dazu verwendet werden kann, Programmierer zu benennen, die eigentlich anonym bleiben wollen. Es könnte beispielsweise von autoritären Regimes verwendet werden, um Programmierer eines die Zensur umgehenden Tools ausfindig zu machen.



Anzeige
Top-Angebote
  1. 40,99€
  2. (u. a. Fernseher ab 127,90€)
  3. ab 23,99€
  4. ab 899,00€ (jetzt vorbestellbar!)

Aluz 17. Aug 2018

Es ist tatsaechlich so, dass viel des originalen stiles noch im "optimierten" code...

Proctrap 17. Aug 2018

bitte, traurig dass es immer noch stimmt Edit merkt an dass damit die Ignorieren Funktion...

0110101111010001 14. Aug 2018

Nach mehr als 3 Jahren kommt die News auch mal bei Golem.de an? :D


Folgen Sie uns
       


AMD Radeon VII - Test

Die Radeon VII ist die erste Consumer-Grafikkarte mit 7-nm-Chip. Sie rechnet ähnlich schnell wie Nvidias Geforce RTX 2080, benötigt aber viel mehr Energie und ist deutlich lauter. Mit einem Preis von 730 Euro kostet die AMD-Karte überdies etwas mehr, die 16 GByte Videospeicher helfen nur selten.

AMD Radeon VII - Test Video aufrufen
Raumfahrt: Aus Marzahn mit der Esa zum Mond
Raumfahrt
Aus Marzahn mit der Esa zum Mond

Die Esa versucht sich an einem neuen Ansatz: der Kooperation mit privaten Unternehmen in der Raumforschung. Die PT Scientists aus Berlin-Marzahn sollen dafür bis 2025 einen Mondlander liefern.
Von Frank Wunderlich-Pfeiffer

  1. Raumfahrt Die Nasa will schnell eine neue Mondlandefähre
  2. Chang'e 4 Chinesische Sonde landet auf der Rückseite des Mondes
  3. Raumfahrt 2019 - Die Rückkehr des Mondfiebers?

WD Black SN750 ausprobiert: Direkt hinter Samsungs SSDs
WD Black SN750 ausprobiert
Direkt hinter Samsungs SSDs

Mit den WD Black SN750 liefert Western Digital technisch wie preislich attraktive NVMe-SSDs. Es sind die kleinen Details, welche die SN750 zwar sehr gut, aber eben nicht besser als die Samsung-Konkurrenz machen.
Ein Bericht von Marc Sauter

  1. WD Black SN750 Leicht optimierte NVMe-SSD mit 2 TByte
  2. Ultrastar DC ME200 Western Digital baut PCIe-Arbeitsspeicher mit 4 TByte
  3. Western Digital My-Cloud-Lücke soll nach 1,5 Jahren geschlossen werden

Struktrurwandel: IT soll jetzt die Kohle nach Cottbus bringen
Struktrurwandel
IT soll jetzt die Kohle nach Cottbus bringen

In Cottbus wird bald der letzte große Braunkohle-Tagebau zum Badesee. Die ansässige Wirtschaft sucht nach neuen Geldquellen und will die Stadt zu einem wichtigen IT-Standort machen. Richten könnten das die Informatiker der Technischen Uni - die werden aber direkt nach ihrem Abschluss abgeworben.
Von Maja Hoock

  1. IT-Jobporträt Spieleprogrammierer "Ich habe mehr Code gelöscht als geschrieben"
  2. Recruiting Wenn die KI passende Mitarbeiter findet
  3. Softwareentwicklung Agiles Arbeiten - ein Fallbeispiel

    •  /