• IT-Karriere:
  • Services:

Code-Hoster: Github will Einstieg in Open-Source-Projekt vereinfachen

Mit Hilfe von Machine Learning will Github seinen Nutzern künftig einfache erste Beitragsmöglichkeiten zu Open-Source-Projekten vorschlagen. Das ist das erste Deep-Learning-Produkt von Github.

Artikel veröffentlicht am ,
Dank Machine Learning soll der Einstieg in Open Source einfacher für Neulinge werden.
Dank Machine Learning soll der Einstieg in Open Source einfacher für Neulinge werden. (Bild: Github)

Der Code-Hoster Github ist das wohl derzeit größte Angebot für viele unterschiedliche Open-Source-Projekte. Und das zu Microsoft gehörende Unternehmen möchte seinen Nutzern oder auch völligen Neulingen nun einfache Wege aufzeigen, wie diese zu eben jenen Open-Source-Projekten beitragen können. Zwar wird die Funktion, die Github "good first issues" nennt, so ähnlich bereits seit fast einem Jahr angeboten, Github hat dies nun aber grundsätzlich auf Basis von Machine Learning überarbeitet, wie es in der Ankündigung heißt.

Stellenmarkt
  1. Schwarz Dienstleistung KG, Raum Neckarsulm
  2. LeasePlan Deutschland GmbH, Düsseldorf, Neuss

Nutzer von Github können die Plattform bereits nach eigenen Interessen über Themen (Topics) durchsuchen. In bestimmten Repositories können Anwender darüber hinaus künftig über den Contribute-Pfad schnell einfache Einstiegsprobleme finden. Ebenso analysiert Github die Aktivität der Nutzer, vergangene Beiträge oder Ähnliches und der Dienst sollen darauf aufbauend persönliche Vorschläge für Beiträge anbieten. Bei jeder dieser drei Möglichkeiten werden die "good first issues" angezeigt, also einfache Probleme für Neulinge.

Die bisher genutzte Lösung basiert auf zuletzt rund 300 Labeln, mit denen Issues durch die Projektbetreuer selbst kategorisiert werden konnten. Über diese Methode konnte Github aber nur rund 40 Prozent aller Projekte auf der Plattform selbst auch für die Vorschlagsfunktion nutzen. Immerhin basiert diese Methode vor allem eben auch auf der manuellen Arbeit der Paketbetreuer.

Zusätzlich dazu nutzt Github einen Machine-Learning-Ansatz. Damit sei der Anbieter in der Lage, diese Einstiegsprobleme in rund 70 Prozent aller Repositories zu empfehlen. Der Code-Hoster weist darauf hin, dass das Angebot natürlich nicht mit falsch positiven Ergebnissen überschwemmt werden sollte.

Für das Training der Daten greift Github aber nicht nur auf die manuellen, gelabelten Issues zurück, sondern nutzt eigenen Angaben zufolge auch Informationen aus Pull Request, die von neuen Beitragenden stammen oder eben nur wenige Zeilen Code umfassen. Für die Model-Entwicklung setzt Github auf das freie Machine-Learning-Framework Tensorflow. Weitere Details dazu liefert ein Blogeintrag. Künftig will Github das Machine-Learning-Modell verbessern und die Funktion weiter ausbauen. Dazu soll auch gehören, dass Projektbetreuer die Vorschläge des Machine-Learning-Systems annehmen oder auch entfernen können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. 299€ (Vergleichspreis 334,99€ inkl. Versand)
  2. (u. a. Logitech G703 Hero Lightspeed für 59€ und Logitech G512 Lightsync + G502 Hero SE + G332...
  3. 169€ (Bestpreis mit Amazon. Vergleichspreis 194,99€)
  4. 169€ (Bestpreis mit Media Markt. Vergleichspreis 194,99€)

FreiGeistler 29. Jan 2020 / Themenstart

Analyse des Verhaltens natürlich obligatorisch. ;-( Gibt es noch keine Gemeinnützigen...

Kommentieren


Folgen Sie uns
       


Golem.de baut die ISS aus Lego zusammen

Mit 864 Einzelteilen und rund 90 Minuten Bauzeit ist die Lego-ISS bei Weitem nicht so komplex wie ihr Vorbild.

Golem.de baut die ISS aus Lego zusammen Video aufrufen
Frauen in der Technik: Von wegen keine Vorbilder!
Frauen in der Technik
Von wegen keine Vorbilder!

Technik, also auch Computertechnik, war schon immer ein männlich dominiertes Feld. Das heißt aber nicht, dass es in der Geschichte keine bedeutenden Programmiererinnen gab. Besonders das Militär zeigte reges Interesse an den Fähigkeiten von Frauen.
Von Valerie Lux

  1. Bewerber für IT-Jobs Unzureichend qualifiziert, zu wenig erfahren oder zu teuer
  2. Männer und Frauen in der IT Gibt es wirklich Chancengleichheit in Deutschland?
  3. HR-Analytics Weshalb Mitarbeiter kündigen

Leistungsschutzrecht: Drei Wörter sollen ...
Leistungsschutzrecht
Drei Wörter sollen ...

Der Vorschlag der Bundesregierung für das neue Leistungsschutzrecht stößt auf Widerstand bei den Verlegerverbänden. Überschriften mit mehr als drei Wörtern und Vorschaubilder sollen lizenzpfichtig sein. Dabei wenden die Verlage einen sehr auffälligen Argumentationstrick an.
Eine Analyse von Friedhelm Greis

  1. Leistungsschutzrecht Memes sollen nur noch 128 mal 128 Pixel groß sein
  2. Leistungsschutzrecht Französische Verlage reichen Beschwerde gegen Google ein
  3. Leistungsschutzrecht Französische Medien beschweren sich über Google

Alphakanal: Gimp verrät Geheimnisse in Bildern
Alphakanal
Gimp verrät Geheimnisse in Bildern

Wer in Gimp in einem Bild mit Transparenz Bildbereiche löscht, der macht sie nur durchsichtig. Dieses wenig intuitive Verhalten kann dazu führen, dass Nutzer ungewollt Geheimnisse preisgeben.


      •  /