ChatGPT: Hacker sollen großangelegte Jagd auf Sprachmodelle machen

Auf der US-Hackerkonferenz Def Con sind schon zahlreiche Fehler und Vorurteile in KI-Modellen gefunden worden. Jetzt soll generative KI folgen.

Artikel veröffentlicht am ,
Hacker auf der Def Con
Hacker auf der Def Con (Bild: REUTERS)

Nicht nur KI-Forscher wie die von Google entlassene Ethik-Forscherin Timnit Gebru oder der Pionier Geoffrey Hinton sehen gravierende Gefahren in der Nutzung der aktuellen generativen KI-Modelle. Auch die bekannte US-Hackerkonferenz Def Con hat sich nun dem Thema verschrieben und will auf der kommenden Veranstaltung Mitte August das erste öffentliche Red-Team-Event für generative KI durchführen.

Beim Red-Teaming werden echte, meist neu geschaffene oder neu gefundene Angriffswege genutzt, die oft nur sehr geringe oder auch gar keine Begrenzungen aufweisen. So sollen möglichst realistische Szenarien erforscht werden können, die auch echte Angreifer nutzen würden. Ausgegebenes Ziel der Def-Con-Organisatoren ist es dabei, "eingebettete und entstehende Risiken, die sich aus der Automatisierung dieser neuen Technologien in großem Maßstab ergeben", zu untersuchen.

Konkret benannt werden dabei "Halluzinationen, Jailbreaks, Vorurteile und der drastische Sprung in den Fähigkeiten". Das seien wichtige neue Themen "mit denen sich Sicherheitsexperten und die Öffentlichkeit auseinandersetzen müssen". Unterstützt wird dies unter anderem von der US-Regierungsbehörde für Wissenschaft und Technologie oder auch der National Science Foundation, die Grundlagenforschung fördert.

Bei der Ausgabe im Jahr 2021 konnten die Forscher bereits zahlreiche Vorurteile im Twitter-Algorithmus zeigen sowie im Bildzuschnitt des Dienstes. Untersucht werden sollen generative KI-Modelle von Anthropic, Google, Hugging Face, Nvidia, OpenAI sowie Stability und damit sämtliche großen Modelle, die den aktuellen KI-Hype vorantreiben und befeuern. Darunter fallen also auch ChatGPT, GPT-4 von OpenAI, Googles Bard und Palm oder auch Stable Diffusion.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Grace Hopper Superchip
Nvidia zeigt den DGX GH200 AI-Supercomputer

Computex 2023 Die Kombination aus Grace Hopper, Bluefield 3 und NVLink ergibt funktional eine riesige GPU mit der Rechenkapazität eines Supercomputers und 144 TByte Grafikspeicher.

Grace Hopper Superchip: Nvidia zeigt den DGX GH200 AI-Supercomputer
Artikel
  1. Cortex v9 & v5 GPU: Arm setzt für Mobile SOCs voll auf 64-Bit
    Cortex v9 & v5 GPU
    Arm setzt für Mobile SOCs voll auf 64-Bit

    Computex 2023 Handys sollten durch den Wegfall von 32-Bit schneller, sicherer und trotzdem deutlich sparsamer werden.

  2. Reiner Haseloff: Ministerpräsident fordert Nullrunde bei Rundfunkbeitrag
    Reiner Haseloff
    Ministerpräsident fordert Nullrunde bei Rundfunkbeitrag

    Zwei Jahre soll der Rundfunkbeitrag eingefroren werden, die Zukunftskommission derweil Reformideen vorlegen, schlägt Sachsen-Anhalts Ministerpräsident vor.

  3. System Shock Remake angespielt: Die Kult-KI Shodan kämpft frisch entfesselt
    System Shock Remake angespielt
    Die Kult-KI Shodan kämpft frisch entfesselt

    System Shock gilt als wegweisendes Shooter-Rollenspiel. Jetzt ist Golem.de im Remake wieder gegen die Super-KI Shodan angetreten (Windows-PC).
    Von Peter Steinlechner

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Microsoft Xbox Wireless Controller 40,70€ • Lexar Play 1 TB 99,60€ • DAMN!-Deals mit AMD-Bundle-Aktion • MindStar: AMD Ryzen 9 5950X 429€, MSI RTX 3060 Gaming Z Trio 12G 329€, GIGABYTE RTX 3060 Eagle OC 12G 299€, be quiet! Pure Base 500DX 89€ • Logitech bis -46% [Werbung]
    •  /