ChatGPT: Hacker sollen großangelegte Jagd auf Sprachmodelle machen
Auf der US-Hackerkonferenz Def Con sind schon zahlreiche Fehler und Vorurteile in KI-Modellen gefunden worden. Jetzt soll generative KI folgen.

Nicht nur KI-Forscher wie die von Google entlassene Ethik-Forscherin Timnit Gebru oder der Pionier Geoffrey Hinton sehen gravierende Gefahren in der Nutzung der aktuellen generativen KI-Modelle. Auch die bekannte US-Hackerkonferenz Def Con hat sich nun dem Thema verschrieben und will auf der kommenden Veranstaltung Mitte August das erste öffentliche Red-Team-Event für generative KI durchführen.
Beim Red-Teaming werden echte, meist neu geschaffene oder neu gefundene Angriffswege genutzt, die oft nur sehr geringe oder auch gar keine Begrenzungen aufweisen. So sollen möglichst realistische Szenarien erforscht werden können, die auch echte Angreifer nutzen würden. Ausgegebenes Ziel der Def-Con-Organisatoren ist es dabei, "eingebettete und entstehende Risiken, die sich aus der Automatisierung dieser neuen Technologien in großem Maßstab ergeben", zu untersuchen.
Konkret benannt werden dabei "Halluzinationen, Jailbreaks, Vorurteile und der drastische Sprung in den Fähigkeiten". Das seien wichtige neue Themen "mit denen sich Sicherheitsexperten und die Öffentlichkeit auseinandersetzen müssen". Unterstützt wird dies unter anderem von der US-Regierungsbehörde für Wissenschaft und Technologie oder auch der National Science Foundation, die Grundlagenforschung fördert.
Bei der Ausgabe im Jahr 2021 konnten die Forscher bereits zahlreiche Vorurteile im Twitter-Algorithmus zeigen sowie im Bildzuschnitt des Dienstes. Untersucht werden sollen generative KI-Modelle von Anthropic, Google, Hugging Face, Nvidia, OpenAI sowie Stability und damit sämtliche großen Modelle, die den aktuellen KI-Hype vorantreiben und befeuern. Darunter fallen also auch ChatGPT, GPT-4 von OpenAI, Googles Bard und Palm oder auch Stable Diffusion.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Es gibt so einen genialen Screenshot von jemandem, der gerne eine Liste von Torrentseiten...
Kommentieren