Unser Modell im Live-Einsatz
Unser trainiertes Modell können wir jetzt in einem Live-Einsatz verwenden. Das bedeutet, wir brauchen das Modell (die rund 30 MB) und eine Funktion, die den Text in Vektoren umwandelt und die Klassifizierung vornimmt.
Dann kann dieses Modell verwendet werden und es funktioniert sehr schnell.
Meistens können Daten, die nicht stimmen, von Usern in einem Tool geändert werden und diese Änderungen werden gespeichert.
Für einen neuen Trainingszyklus können dann genau diese Daten verwendet werden, die von Usern überprüft wurden.
Das Modell gibt zum Beispiel aus:
Der Text: "Nicht schlecht, da ist euch ein Meisterwerk gelungen!"
mit folgendem Ergebnis:
positiv: 92 %
neutral: 1 %
negativ: 7 %
Aus diesem Ergebnis lässt sich schließen, dass der Text positiv ist.
Welche Frameworks gibt es?
Für KI-Modelle wird vor allem die Programmiersprache Python verwendet. Es ist auch möglich, Modelle in Python zu trainieren und dann zum Beispiel in C++ zu verwenden. Der große Nachteil von Python ist die Geschwindigkeit.
Zur Datenverarbeitung eignet sich die Library Pandas ganz gut. Diese Library wird auch viel von Data Scientists verwendet.
Beim Trainieren von Modellen wird meistens auf Tensorflow oder PyTorch zurückgegriffen. Beide Frameworks decken alle Möglichkeiten ab. Ich persönlich verwende lieber PyTorch.
Wie oben erwähnt, ist Kaggle.com gut, um Daten zu finden. Es bietet auch Challenges, an denen man teilnehmen kann.
Ein Training, das nie endet
Man kann heute sagen, dass die KI-Modelle, die am häufigsten zum Einsatz kommen (in Apps oder auf Webseiten), Modelle mit einer spezifischen Aufgabe sind.
Ein Beispiel für diese Anwendungen ist HDR+ von Google, das in dem neuen Pixel 6 Pro Modell zum Einsatz kommt. Diese Modelle werden direkt auf dem Smartphone gespeichert, damit die Funktionen auch offline zur Verfügung stehen.
Der größte qualitative Unterschied bei Modellen sind die Daten. Daher werden immer neue Ideen umgesetzt, wie man User-Daten labeln lassen kann. Ein bekanntes Verfahren ist das Anklicken von Bildern mit Autos bei Logins, um zu zeigen, dass man kein Roboter ist.
Wurde ein Modell trainiert und abgespeichert, ist es wie eine Blackbox, da man nicht darauf zurückschließen kann, aus welchen Daten es trainiert wurde. Daher ist es auch schwierig, die Qualität eines Modells zu bewerten. Um stetig bessere Modelle zu bekommen, werden immer wieder Daten hinzugefügt und neue Modelle trainiert. Wenn Nutzer dann einen Datensatz verbessern, werden diese Daten für den nächsten Trainingszyklus bereitgestellt.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Testen des trainierten Modells |
Auch ich habe solche Erfahrungen. Habe damals im Bachelor-Studium ein Neuronales Netz in...
Preprocessing ist mit das wichtigste! Wenn du Social Media Daten hast, wie machst du es z...
In dem Artikel wollte ich bewusst diese Wörter weg lassen. Es gibt sehr viele Begriffe...
Zum Spielen vllt nett, um die Konzepte wirklich mal zu verstehen weniger eignet.
Kommentieren