ChatGPT: Hacker sollen großangelegte Jagd auf Sprachmodelle machen

Auf der US-Hackerkonferenz Def Con sind schon zahlreiche Fehler und Vorurteile in KI-Modellen gefunden worden. Jetzt soll generative KI folgen.

Artikel veröffentlicht am ,
Hacker auf der Def Con
Hacker auf der Def Con (Bild: REUTERS)

Nicht nur KI-Forscher wie die von Google entlassene Ethik-Forscherin Timnit Gebru oder der Pionier Geoffrey Hinton sehen gravierende Gefahren in der Nutzung der aktuellen generativen KI-Modelle. Auch die bekannte US-Hackerkonferenz Def Con hat sich nun dem Thema verschrieben und will auf der kommenden Veranstaltung Mitte August das erste öffentliche Red-Team-Event für generative KI durchführen.

Beim Red-Teaming werden echte, meist neu geschaffene oder neu gefundene Angriffswege genutzt, die oft nur sehr geringe oder auch gar keine Begrenzungen aufweisen. So sollen möglichst realistische Szenarien erforscht werden können, die auch echte Angreifer nutzen würden. Ausgegebenes Ziel der Def-Con-Organisatoren ist es dabei, "eingebettete und entstehende Risiken, die sich aus der Automatisierung dieser neuen Technologien in großem Maßstab ergeben", zu untersuchen.

Konkret benannt werden dabei "Halluzinationen, Jailbreaks, Vorurteile und der drastische Sprung in den Fähigkeiten". Das seien wichtige neue Themen "mit denen sich Sicherheitsexperten und die Öffentlichkeit auseinandersetzen müssen". Unterstützt wird dies unter anderem von der US-Regierungsbehörde für Wissenschaft und Technologie oder auch der National Science Foundation, die Grundlagenforschung fördert.

Bei der Ausgabe im Jahr 2021 konnten die Forscher bereits zahlreiche Vorurteile im Twitter-Algorithmus zeigen sowie im Bildzuschnitt des Dienstes. Untersucht werden sollen generative KI-Modelle von Anthropic, Google, Hugging Face, Nvidia, OpenAI sowie Stability und damit sämtliche großen Modelle, die den aktuellen KI-Hype vorantreiben und befeuern. Darunter fallen also auch ChatGPT, GPT-4 von OpenAI, Googles Bard und Palm oder auch Stable Diffusion.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Frigate
Intelligente Videoüberwachung ohne Cloudzwang

Mit der Open-Source-Software Frigate lässt sich eine moderne Videoüberwachung realisieren - ohne Hersteller-Cloud und unabhängig von der Hardware.
Von Dominik Haas

Frigate: Intelligente Videoüberwachung ohne Cloudzwang
Artikel
  1. Energieversorgung: Nachfrage nach Wärmepumpen kühlt ab - außer in Deutschland
    Energieversorgung
    Nachfrage nach Wärmepumpen kühlt ab - außer in Deutschland

    Der Europäische Wärmepumpenverband zeigt sich wegen sinkender Absatzzahlen besorgt, aber hierzulande bleibt das Interesse groß.

  2. 49-Euro-Ticket: Start-up testet flexibles Deutschlandticket
    49-Euro-Ticket
    Start-up testet flexibles Deutschlandticket

    24 Stunden Kündigungsfrist und bis zu drei Monate Pause: Ein Landkreis, ein Verkehrsbetrieb und ein Start-up probieren ein flexibles Deutschlandticket aus.

  3. Whistleblower: Ehemaliger US-Konteradmiral äußert sich zu Außerirdischen
    Whistleblower
    Ehemaliger US-Konteradmiral äußert sich zu Außerirdischen

    Wieder hat sich in den USA ein ehemals hochrangiger Militär und Beamter über Kontakte mit Aliens geäußert.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MSI XMAS-Sale • Crucial P5 Plus SSD 500GB 39,99€ • Nur noch kurz: 3 für 2 Games-Aktion (PS5, PS4, Xbox, PC) • Apple Week • AVM Fritz Box 7510 74,99€ • Last-Minute-Angebote bei Amazon • Avatar, AC: Mirage & The Crew Motorfest bis -50% • Xbox Series X 399€ [Werbung]
    •  /