Code-Hoster: Github will Einstieg in Open-Source-Projekt vereinfachen

Mit Hilfe von Machine Learning will Github seinen Nutzern künftig einfache erste Beitragsmöglichkeiten zu Open-Source-Projekten vorschlagen. Das ist das erste Deep-Learning-Produkt von Github.

Artikel veröffentlicht am ,
Dank Machine Learning soll der Einstieg in Open Source einfacher für Neulinge werden.
Dank Machine Learning soll der Einstieg in Open Source einfacher für Neulinge werden. (Bild: Github)

Der Code-Hoster Github ist das wohl derzeit größte Angebot für viele unterschiedliche Open-Source-Projekte. Und das zu Microsoft gehörende Unternehmen möchte seinen Nutzern oder auch völligen Neulingen nun einfache Wege aufzeigen, wie diese zu eben jenen Open-Source-Projekten beitragen können. Zwar wird die Funktion, die Github "good first issues" nennt, so ähnlich bereits seit fast einem Jahr angeboten, Github hat dies nun aber grundsätzlich auf Basis von Machine Learning überarbeitet, wie es in der Ankündigung heißt.

Stellenmarkt
  1. Leitung (m/w/d) des EDV-Amtes
    Landkreis Stade, Stade
  2. IT-Administrator (m/w/d)
    Klöckner Pentaplast Europe GmbH & Co. KG, Montabaur
Detailsuche

Nutzer von Github können die Plattform bereits nach eigenen Interessen über Themen (Topics) durchsuchen. In bestimmten Repositories können Anwender darüber hinaus künftig über den Contribute-Pfad schnell einfache Einstiegsprobleme finden. Ebenso analysiert Github die Aktivität der Nutzer, vergangene Beiträge oder Ähnliches und der Dienst sollen darauf aufbauend persönliche Vorschläge für Beiträge anbieten. Bei jeder dieser drei Möglichkeiten werden die "good first issues" angezeigt, also einfache Probleme für Neulinge.

Die bisher genutzte Lösung basiert auf zuletzt rund 300 Labeln, mit denen Issues durch die Projektbetreuer selbst kategorisiert werden konnten. Über diese Methode konnte Github aber nur rund 40 Prozent aller Projekte auf der Plattform selbst auch für die Vorschlagsfunktion nutzen. Immerhin basiert diese Methode vor allem eben auch auf der manuellen Arbeit der Paketbetreuer.

Zusätzlich dazu nutzt Github einen Machine-Learning-Ansatz. Damit sei der Anbieter in der Lage, diese Einstiegsprobleme in rund 70 Prozent aller Repositories zu empfehlen. Der Code-Hoster weist darauf hin, dass das Angebot natürlich nicht mit falsch positiven Ergebnissen überschwemmt werden sollte.

Golem Karrierewelt
  1. IT-Grundschutz-Praktiker mit Zertifikat: Drei-Tage-Workshop
    04.-06.07.2022, Virtuell
  2. Microsoft 365 Administration: virtueller Drei-Tage-Workshop
    01.-03.06.2022, Virtuell
Weitere IT-Trainings

Für das Training der Daten greift Github aber nicht nur auf die manuellen, gelabelten Issues zurück, sondern nutzt eigenen Angaben zufolge auch Informationen aus Pull Request, die von neuen Beitragenden stammen oder eben nur wenige Zeilen Code umfassen. Für die Model-Entwicklung setzt Github auf das freie Machine-Learning-Framework Tensorflow. Weitere Details dazu liefert ein Blogeintrag. Künftig will Github das Machine-Learning-Modell verbessern und die Funktion weiter ausbauen. Dazu soll auch gehören, dass Projektbetreuer die Vorschläge des Machine-Learning-Systems annehmen oder auch entfernen können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Optibike
E-Bike mit 480 km Reichweite kostet 17.000 Euro

Das E-Bike Optibike R22 Everest setzt mit seinen zwei Akkus auf Reichweite.

Optibike: E-Bike mit 480 km Reichweite kostet 17.000 Euro
Artikel
  1. Krypto-Kriminalität: Behörden fahnden nach Onecoin-Betrügerin
    Krypto-Kriminalität
    Behörden fahnden nach Onecoin-Betrügerin

    Deutsche und internationale Behörden suchen nach den Hintermännern und -frauen von Onecoin. Der Schaden durch Betrug mit der vermeintlichen Kryptowährung geht in die Milliarden.

  2. Hassrede: Bayern will soziale Netzwerke bestrafen
    Hassrede
    Bayern will soziale Netzwerke bestrafen

    Der bayrische Justizminister fordert, bei der Verbreitung von Hassrede auch die Betreiber von sozialen Medien stärker zur Verantwortung zu ziehen.

  3. Prehistoric Planet: Danke, Apple, für so grandiose Dinosaurier!
    Prehistoric Planet
    Danke, Apple, für so grandiose Dinosaurier!

    Musik von Hans Zimmer, dazu David Attenborough als Sprecher: Apples Prehistoric Planet hat einen Kindheitstraum zum Leben erweckt.
    Ein IMHO von Marc Sauter

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Samsung 870 QVO 1 TB 79€ • Prime Video: Filme leihen für 0,99€ • Alternate (u. a. Recaro Rae Essential 429€) • Gigabyte RTX 3080 12 GB ab 1.024€ • Mindstar (u. a. AMD Ryzen 5 5600 179€, Palit RTX 3070 GamingPro 669€) • SanDisk Ultra microSDXC 256 GB ab 14,99€ • Sackboy 19,99€ [Werbung]
    •  /