Nemo-Guardrails: Nvidia will Leitplanken für KI-Sprachmodelle

Ein Open-Source-Framework von Nvidia, das sich für alle Sprachmodelle inklusive ChatGPT eignen soll, soll diese sicherer machen.

Artikel veröffentlicht am ,
Nvidia will mit Leitplanken Sprachmodelle auf dem richtigen Weg halten.
Nvidia will mit Leitplanken Sprachmodelle auf dem richtigen Weg halten. (Bild: Pixabay)

Das KI-Team von Grafikkartenhersteller Nvidia hat mit Nemo-Guardrails (Leitplanken) ein Open-Source-Toolkit vorgestellt, das einige der Probleme von aktuellen großen Sprachmodellen (Large Language Models, LLMs) lösen soll. Mit Hilfe der Leitplanken sollen LLMs künftig sicherer werden und vor allem vertrauenswürdige Chatbots ermöglichen.

Aufgrund des spezifischen Training von LLMs und vor allem der dafür genutzten Trainingsdaten aus dem frei verfügbaren Internet reproduzieren diese oft toxische Inhalte, Rassismus, Beleidigungen oder auch sexuelle Gewalt.

Verhindert wird die Ausgabe derartiger Inhalte derzeit meist durch manuell erstellte Filter. Oft lassen sich diese Filter aber auch durch teils einfachste Tricks umgehen, was als Prompt Injection bezeichnet wird.

Nvidia sieht diese Probleme der LLMs als ein Phänomen, das die gesamte Industrie betrifft. Deshalb sei Nemo Guardrails so aufgebaut, dass es prinzipiell mit allen LLMs genutzt werden könne. Explizit erwähnt wird in der Ankündigung auch ChatGPT von OpenAI.

Zur Funktionsweise schreibt Nvidia: "Die Guardrails sind eine Reihe von programmierbaren Einschränkungen oder Regeln, die zwischen einem Benutzer und einem LLM stehen. Diese Leitplanken überwachen, beeinflussen und diktieren die Interaktionen eines Benutzers, vergleichbar Leitplanken auf einer Landstraße, die die Breite einer Straße festlegen und Fahrzeuge davon abhalten, in unerwünschtes Gebiet abzubiegen."

Konkret unterstützt werden dabei drei eher breite Kategorien. Eine Leitplanke für Inhalte soll etwa sicherstellen, dass Konversationen mit dem LLM beim Thema bleiben und nicht in eine unerwartete Richtung abschweifen. Weitere Leitplanken "können bei der Erkennung und Durchsetzung von Richtlinien helfen, um angemessene Reaktionen zu ermöglichen." Das soll vor allem faktisch korrekte Antworten forcieren. Eine dritte Kategorie soll das Ausführen von Malware oder sicherheitskritische Programmaufrufe verhindern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Wissenschaft
In Energydrinks enthaltenes Taurin könnte Leben verlängern

Wissenschaftler haben Anzeichen dafür entdeckt, dass Taurin die Gesundheit verbessern und das Leben verlängern könnte. Mehr Energydrinks sollte man aber nicht trinken.

Wissenschaft: In Energydrinks enthaltenes Taurin könnte Leben verlängern
Artikel
  1. Tesla Files: Cybertruck ist undicht, laut und bremst schlecht
    Tesla Files
    Cybertruck ist undicht, laut und bremst schlecht

    Internen Dokumenten zufolge steht Teslas Pick-up-Truck vor großen Problemen. Der Cybertruck befinde sich in der Alpha-Phase.

  2. VATM: Menschen nutzen weiter Call-by-Call und Preselection
    VATM
    Menschen nutzen weiter Call-by-Call und Preselection

    Die Telekom hat Call-by-Call und Preselection mehrfach verlängert. Obwohl viele Menschen sie weiterhin nutzen, enden diese Dienste bald.

  3. Einführung in Plotly: Damit die Daten Sinn ergeben
    Einführung in Plotly
    Damit die Daten Sinn ergeben

    Interaktive Plots mit Plotly zu erstellen, ist nicht schwer - und sehr nützlich. In einer zweiteiligen Reihe zeigen wir Schritt für Schritt, wie es funktioniert.
    Eine Anleitung von Antony Ghiroz

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • XXL-Sale bei Alternate (u. a. Samsung 970 EVO Plus 2 TB 84,90€) • MindStar: Palit RTX 4070 Ti GameRock OC 859€, be quiet! Pure Base 500 59€ • Thermaltake Toughliquid Ultra 240 145,89€ • PS5-Spiele & Zubehör bis -75% • Chromebooks bis -32% • NBB: Gaming-Produkte bis -50% [Werbung]
    •  /