Turi Create stellt Methoden für die Bilderkennung zur Verfügung. Es soll möglichst einfach und ohne Vorkenntnisse zu maschinellem Lernen bedienbar sein. Ungewöhnlich für Apple: Das Produkt ist quelloffen.
Rekognition Video ist die neue Ergänzung des Deep-Learning-Systems von AWS. In der Cloud können damit Gesichter, Objekte und Aktionen automatisch erkannt werden. Sogar Prominente sollen so zugeordnet werden können. Die Ergebnisse werden in einer Übersicht angezeigt.
Googles AutoML entwickelt sich. Jetzt kann das System komplexere Modelle selbstständig erschaffen - ohne menschliche Hilfe. Das neue Modell heist Nasnet und soll bei der Bild- und Objekterkennung sehr effizient sein.
Wird "Zoomen und Verbessern" bald Realität? EnhanceNet-PAT ist ein Lernalgorithmus, der durch Mustererkennung Bilder hochauflösender machen kann. Das Vorbild für das maschinelle Lernen ist der Mensch selbst.
Adobes Project Scribbler ist ein maschineller Lernalgorithmus, der selbstständig Skizzen und Fotos einfärben kann. Anhand von Referenzbildern errät er Ethnie, Alter und Geschlecht von Abgebildeten, sodass sogar Albert Einstein Farbe im Gesicht bekommt.
Maschinelles Lernen und Bilderkennung finden immer mehr Anwendung. Im Trend liegt das Animieren von Bildern und Emoticons. Facebook arbeitet gemeinsam mit Forschern an einer eigenen Lösung. Ein erstes Ergebnis: eine noch mehr lächelnde Mona Lisa und wütende Profilbilder.
Drei Klassen und eine Webcam: Teachable Machine ist ein kleines Programm von Google, mit dem Nutzer das Konzept von maschinellem Lernen verstehen sollen. Es nutzt dazu die quelloffene Bibliothek Deeplearn.js. Das Besondere: Es funktioniert lokal im Browser statt über die Cloud.
Apple hat das französische Startup Regaind übernommen. Das Unternehmen hat eine Technik zur Bildanalyse entwickelt.
PixelNN kann unscharfe oder unvollständige Bilder rekonstruieren. Der Algorithmus sei dabei präziser als ähnliche Projekte. Die Entwickler nutzen ein neuronales Netz, um bereits jetzt relativ genaue Ergebnisse zu liefern.
Pixelmator Pro integriert Apples Core-ML-Schnittstelle, um Funktionen wie Bilderkennung zu realisieren. Die Software soll im Vergleich zur Adobe Creative Cloud besonders preisgünstig und daher für "jedermann" sein - vorausgesetzt "jedermann" ist Mac-Nutzer.
In der aktuellen Beta-Version der Google-App für Android finden sich erste Code-Fragmente, die auf Lens hinweisen. Lens soll Dinge des Alltags erkennen und deuten und so Informationen bereitstellen. Anhand der Code-Funde konnte die neue Funktion bereits in Grundzügen aktiviert werden.
Mit Power 8 und jeder Menge Servern: IBM erklärt sich zum neuen Rekordhalter für schnelle Bilderkennung. Vorher sei Microsoft an erster Stelle gewesen. Möglich macht dies eine spezielle Software, die Hardware effizient synchronisiert.
Fotos in Onedrive sortieren: Die Windows-Photos-App soll bald eine KI erhalten, die Fotos analysieren und nach Suchkriterien sortieren kann. Auch thematisierte Alben werden dem Nutzer vorgeschlagen. Noch ist die Funktion nur für Windows Insider verfügbar - mit Redstone 3 für alle Windows-Nutzer.
Anwender von Googles freiem Machine-Learning-Framework Tensorflow können künftig auf eine API zur Objekterkennung in Bildern zugreifen. Google nutzt die Technik intern für Streetview oder auch für die Nest Cam.
Nach mehreren Monaten geschlossener Vorschau können nun alle Nutzer der Amazon-Cloud auf die Spracherkennung Lex zugreifen. Die Sprachsynthese Polly kann nun lippensynchron flüstern und die Bilderkennung filtert anstößige Inhalte.
Die Office-Produkte von Microsoft bieten einige Möglichkeiten, Dokumente barrierefrei zu gestalten. Damit die Verfasser es künftig noch einfacher haben, hilft Microsoft mit seiner eigenen KI einfach nach, wodurch Blinde auch Präsentationen verstehen können.
Mit dem eigenen Rechner oder Telefon sprechen, die Geräte geben ihre Antworten ebenso gesprochen aus: Diese Funktionen können Entwickler künftig mit Hilfe der KI in der Amazon-Cloud umsetzen. Eine Bilderkennung kann ebenfalls genutzt werden.
Build 2016 Mit den Cognitive Services von Microsoft sollen sich Sprach- und Bilderkennung sowie weitergehende Analysen in eigenen Anwendungen nutzen lassen. Und intelligente Chatbots könnten damit automatisch übersetzen.
Ein neuer Bilderkennungsalgorithmus ist unter freier Lizenz der Öffentlichkeit übergeben worden. Er macht für das menschliche Auge unsichtbare Strukturen sichtbar.
Apple hat mit Perceptio ein Startup übernommen, das künstliche Intelligenz und Maschinenlernen auf Smartphones und Tablets bringen will, ohne dass die Daten zur Analyse in die Cloud verschoben werden müssen. So soll die Privatsphäre gewahrt bleiben.
Flickr hat begonnen, mit einer Bilderkennung die Bilder der Benutzer automatisch mit zusätzlichen Schlagwörtern auszustatten. Das klappt eigentlich recht gut, doch manchmal macht die Bildanalyse Fehler, die unfreiwillig beleidigend oder gar rassistisch sind.
Die Programmiersprache Wolfram - auch Mathematica genannt - kann jetzt Bildinhalte erkennen: Über ein Web-Interface demonstriert Stephen Wolfram die Fähigkeiten des Algorithmus. Stellenweise sind die Ergebnisse noch recht ungenau - aber auf eine durchaus logische Art.
Der Küchentisch des Jahres 2025 zeigt mit einem Projektor die Rezepte an, kocht, identifiziert die Zutaten und wiegt diese auch. Reste erkennt die Küche automatisch und weiß, was daraus gekocht werden kann. Ikea hat das Konzept zusammen mit Designstudenten entwickelt.
Was ist auf einem Bild zu sehen? Zwei Entwicklerteams in den USA haben Verfahren entwickelt, um Bilder automatisch zu erkennen und zu beschreiben. Das ist nützlich für die Bildersuche, kann aber auch ganze andere Auswirkungen haben.
Jeden Tag posten Nutzer rund 130 Millionen Fotos auf Tumblr. Nun gibt es erste Versuche, die Datenmasse für kommerzielle Zwecke auszuwerten.
Japanische Wissenschaftler haben eine neue Möglichkeit ersonnen, wie sich Roboter in der Stadt orientieren können: Sie scannen Gullydeckel.
See-Fish hat mit See-View eine iPhone-Applikation im Programm, die eine optische Bildersuche ermöglichen soll. Die Anwendung zeigt Flickr-Fotos gruppiert nach Farben und Formen in einem dreidimensionalen Raum an.
Das Fraunhofer-Institut für Techno- und Wirtschaftsmathematik (ITWM) in Kaiserslautern hat zusammen mit dem italienischen Unternehmen Infracom eine Software entwickelt, die Brücken auf Schäden überprüft. Die Bildverarbeitungssoftware erkennt Veränderungen in den Bauwerken und markiert sie.
Gestohlene Bilder verschwinden nicht nur in geheimen Sammlungen, sondern werden manchmal auch im Handel angeboten. Für gestohlene Kunst gibt es internationale Datenbanken, doch können Fahnder auf Auktionen nur schlecht auf diese zugreifen, vor allem nicht in kurzer Zeit. Mit einer mobilen Kunstfahndungslösung samt Bilderkennung soll sich dies nun ändern.
Die Forscher des Xerox Research Centre Europe (XRCE) haben jetzt eine Software entwickelt, die in der Lage sein soll, Bilder zu verstehen und Motive zu erkennen und zuzuordnen. Die Technik soll so eine automatische Erkennung und Archivierung von Bildmotiven erlauben.
Intel-Forscher haben eine kostenlose Programmsammlung veröffentlicht, die Softwarenentwicklern helfen soll, stereoskopische Bilderkennung in ihre Produkte zu integrieren. Die Software erlaubt, Tiefeninformationen aus bewegten und stehenden Bildern herauszulesen, die von zwei Kameraaugen erfasst werden.
Den gefährlichen Hautkrebs kann ein Laie kaum erkennen, und auch Ärzte übersehen gelegentlich Frühindikatoren. Ein Computer-Diagnose-System soll Hautkrebs nun auch schon im Frühstadium erkennen können.