Zeigen zwei Bilder das gleiche Motiv? Algorithmen sollen das erkennen. Sie analysieren Bilder und suchen darin nach ähnlichen Mustern. Anwendungen für die Bilderkennung gibt es viele: die Bildersuche im Internet beispielsweise, die Gesichtserkennung oder die Qualitätssicherung in der Produktion.
Obwohl im US-Bundestaat Illinois stärkere Regeln gegen das ungefragte Sammeln von biometrischen Daten existieren, bleibt dieses Vorgehen für Google wohl weiterhin legal. Das Unternehmen erstellt Gesichtsprofile in Google Photos, um Bilder nach Personen zu durchsuchen. Das ist standardmäßig aktiviert.
Auf der Suche nach Stalkern haben die Veranstalter auf einem Taylor-Swift-Konzert Gesichtserkennung und eine Bilddatenbank eingesetzt. Besucher wurden unbemerkt gescannt, während sie auf ein Video schauten. Laut US-Hausrecht ist das wohl legal.
Der von Tumblr eingesetzte Bilderkennungsalgorithmus ist sehr ungenau: Statt Nacktheit markiert er Zeichnungen von Einhörnern und den US-Politiker Joe Biden. Das Unternehmen hat knapp zwei Wochen, bis die neue Nutzungsbedingung in Kraft tritt und die Software endgültig über Inhalte entscheidet.
Wer braucht schon Gesichtserkennung? In China wird ein Überwachungssystem entwickelt, das Bürger an ihren einzigartigen Gangarten erkennt. Die Software soll sich auch von absichtlich anderem Laufen nicht täuschen lassen. Ganz in Echtzeit funktioniert das aber noch nicht.
Um risikoreiche Filmprojekte sicherer finanzieren zu können, entwickeln Forscher von 20th Century Fox ein neuronales Netzwerk, das die Vorlieben von Kinogängern analysieren soll. Daraus errechnet das System Filmtrends des kommenden Jahres.
Kann Software Kunst erstellen? Eine erfolgreiche Auktion beweist, dass es zumindest Abnehmer dafür gibt. Allerdings hat sich das Entwicklerteam Obvious wohl stark bei anderen KI-Systemen bedient.
Google lehnt ein lukratives Geschäft mit der US-Regierung ab: Das Unternehmen beteiligt sich nicht an einem Cloud-Projekt des US-Verteidigungsministeriums. Eine KI-Kooperation mit dem US-Militär kam bei der Belegschaft nicht gut an.
Ein wenig nebulös wirkt Alibabas Ankündigung, in den Markt der KI-Chips einzusteigen. Das Unternehmen baut dazu sogar ein eigenes Forschungsteam auf. Nebenbei wollen sich die Chinesen auf dem Gebiet der Quantencomputer schnell etablieren.
Amazon Rekognition steht wieder in der Kritik: Aclu hat die US-Kongressabgeordneten von der Bilderkennung analysieren lassen und kritisiert Voreingenommenheit. Das System erkennt unverhältnismäßig viele dunkelhäutige Personen falsch. Amazon rechtfertigt sich.
Move Mirror ist eine Demo für maschinelles Lernen mit Posenet, bei der sich Nutzer vor der Webcam bewegen und Bilder anderer Personen mit ähnlicher Pose angezeigt bekommen - darunter Tänzer und Kung-Fu-Kämpfer. Daraus können Nutzer auch animierte GIFs erstellen.
1984 und Minority Report sind mittlerweile fast reale Szenarien. Dieser Meinung ist Microsoft-Präsident Brad Smith. Er stellt Fragen, wie Gesichtserkennung sinnvoll und ohne Rechtsverletzungen genutzt werden kann - und zeigt mit dem Finger auf Amazon und Google.
Dank Deep Learning kann Microsoft die Umrisse von Gebäuden aus Satellitenbildern extrahieren. Microsofts Kartenanbieter Bing-Maps spendet die so gewonnenen Daten an die Openstreetmap-Community. Das ist nicht die erste Kooperation dieser Art.
Dutzende von Google-Mitarbeitern sollen aus Protest gegen die Zusammenarbeit von Google und dem US-Militär gekündigt haben. Mehrere Tausend haben eine Petition dagegen unterzeichnet. Nun soll die 2019 auslaufende Kooperation nicht verlängert werden.
Mit Hilfe der bereits bekannten KI-Software Fakeapp und Adobe After Effects wurde ein Videoclip erstellt, der den ehemaligen US-Präsidenten Obama beleidigende Sätze sprechen lässt. Die Fälschung ist bereits sehr gelungen, aber nicht ohne Fehler. Das Potenzial solcher Techniken ist schon groß.
Googles AIY Vision und Voice erinnern an Nintendo Labo. Es handelt sich um Bastelkästen aus Pappkarton und Raspberry Pi Zero WH. Doch erst der Google Assistant und Tensorflow sollen die Würfel zum Bilderkennungssystem oder zum Mini-Google-Home machen.
Mehr als 3.100 Mitarbeiter von Google sind gegen die militärische Nutzung ihrer KI. Ein offener Brief an den CEO Sundar Pichai wurde als Protest gegen Projekt Maven verfasst. Auch alteingesessene Mitarbeiter haben das Dokument unterschrieben.
Mit sehr schnellen Motoren, Playstation Eyes und Open-Source-Bilderkennung konnten zwei Entwickler den bisherigen Weltrekord im Lösen eines Rubik's Cubes, im Deutschen auch als Zauberwürfel bekannt, brechen - in 380 Millisekunden. Der Prozess wurde mit einer Hochgeschwindigkeitskamera aufgenommen.
Aus der Luft Feinde und Stellungen erkennen und automatisch auswerten: Das US-Militär steckt viel Geld in die Nutzung von KI für militärische Zwecke. Google stellt einem Bericht zufolge einen Teil der dafür notwendigen Technik. Unter Mitarbeitern soll es heftige Diskussionen darüber geben.
Immer mehr Nutzer können auf Facebook eine erweiterte Gesichtserkennung verwenden. In der EU und in Kanada wird das Verfahren nicht angeboten - wohl aus Datenschutzgründen. Dabei könnte es mehr Sicherheit gegen den Missbrauch von Fotos bieten.
Mit genug Referenzmaterial kann ein Deep-Learning-Algorithmus von Googles Tochter Verily verschiedene Eigenschaften von Patienten bestimmten, etwa das Alter, das Geschlecht oder das Risiko einer Herz-Kreislauf-Erkrankung. Die Genauigkeit ist schon jetzt mit traditionellen Methoden vergleichbar.
Nima soll möglichst genau die ästhetische und handwerkliche Qualität eines Fotos einschätzen können, ohne dass das direkte Referenzbild zur Verfügung steht. Die Ergebnisse sind laut Google schon nah an der menschlichen Einschätzung, die Forschung aber noch recht fern von der produktiven Anwendung.
Turi Create stellt Methoden für die Bilderkennung zur Verfügung. Es soll möglichst einfach und ohne Vorkenntnisse zu maschinellem Lernen bedienbar sein. Ungewöhnlich für Apple: Das Produkt ist quelloffen.
Rekognition Video ist die neue Ergänzung des Deep-Learning-Systems von AWS. In der Cloud können damit Gesichter, Objekte und Aktionen automatisch erkannt werden. Sogar Prominente sollen so zugeordnet werden können. Die Ergebnisse werden in einer Übersicht angezeigt.
Googles AutoML entwickelt sich. Jetzt kann das System komplexere Modelle selbstständig erschaffen - ohne menschliche Hilfe. Das neue Modell heist Nasnet und soll bei der Bild- und Objekterkennung sehr effizient sein.
Wird "Zoomen und Verbessern" bald Realität? EnhanceNet-PAT ist ein Lernalgorithmus, der durch Mustererkennung Bilder hochauflösender machen kann. Das Vorbild für das maschinelle Lernen ist der Mensch selbst.
Adobes Project Scribbler ist ein maschineller Lernalgorithmus, der selbstständig Skizzen und Fotos einfärben kann. Anhand von Referenzbildern errät er Ethnie, Alter und Geschlecht von Abgebildeten, sodass sogar Albert Einstein Farbe im Gesicht bekommt.
Maschinelles Lernen und Bilderkennung finden immer mehr Anwendung. Im Trend liegt das Animieren von Bildern und Emoticons. Facebook arbeitet gemeinsam mit Forschern an einer eigenen Lösung. Ein erstes Ergebnis: eine noch mehr lächelnde Mona Lisa und wütende Profilbilder.
Drei Klassen und eine Webcam: Teachable Machine ist ein kleines Programm von Google, mit dem Nutzer das Konzept von maschinellem Lernen verstehen sollen. Es nutzt dazu die quelloffene Bibliothek Deeplearn.js. Das Besondere: Es funktioniert lokal im Browser statt über die Cloud.
Apple hat das französische Startup Regaind übernommen. Das Unternehmen hat eine Technik zur Bildanalyse entwickelt.
PixelNN kann unscharfe oder unvollständige Bilder rekonstruieren. Der Algorithmus sei dabei präziser als ähnliche Projekte. Die Entwickler nutzen ein neuronales Netz, um bereits jetzt relativ genaue Ergebnisse zu liefern.
Pixelmator Pro integriert Apples Core-ML-Schnittstelle, um Funktionen wie Bilderkennung zu realisieren. Die Software soll im Vergleich zur Adobe Creative Cloud besonders preisgünstig und daher für "jedermann" sein - vorausgesetzt "jedermann" ist Mac-Nutzer.
In der aktuellen Beta-Version der Google-App für Android finden sich erste Code-Fragmente, die auf Lens hinweisen. Lens soll Dinge des Alltags erkennen und deuten und so Informationen bereitstellen. Anhand der Code-Funde konnte die neue Funktion bereits in Grundzügen aktiviert werden.
Mit Power 8 und jeder Menge Servern: IBM erklärt sich zum neuen Rekordhalter für schnelle Bilderkennung. Vorher sei Microsoft an erster Stelle gewesen. Möglich macht dies eine spezielle Software, die Hardware effizient synchronisiert.
Fotos in Onedrive sortieren: Die Windows-Photos-App soll bald eine KI erhalten, die Fotos analysieren und nach Suchkriterien sortieren kann. Auch thematisierte Alben werden dem Nutzer vorgeschlagen. Noch ist die Funktion nur für Windows Insider verfügbar - mit Redstone 3 für alle Windows-Nutzer.
Anwender von Googles freiem Machine-Learning-Framework Tensorflow können künftig auf eine API zur Objekterkennung in Bildern zugreifen. Google nutzt die Technik intern für Streetview oder auch für die Nest Cam.
Nach mehreren Monaten geschlossener Vorschau können nun alle Nutzer der Amazon-Cloud auf die Spracherkennung Lex zugreifen. Die Sprachsynthese Polly kann nun lippensynchron flüstern und die Bilderkennung filtert anstößige Inhalte.
Die Office-Produkte von Microsoft bieten einige Möglichkeiten, Dokumente barrierefrei zu gestalten. Damit die Verfasser es künftig noch einfacher haben, hilft Microsoft mit seiner eigenen KI einfach nach, wodurch Blinde auch Präsentationen verstehen können.
Mit dem eigenen Rechner oder Telefon sprechen, die Geräte geben ihre Antworten ebenso gesprochen aus: Diese Funktionen können Entwickler künftig mit Hilfe der KI in der Amazon-Cloud umsetzen. Eine Bilderkennung kann ebenfalls genutzt werden.
Build 2016 Mit den Cognitive Services von Microsoft sollen sich Sprach- und Bilderkennung sowie weitergehende Analysen in eigenen Anwendungen nutzen lassen. Und intelligente Chatbots könnten damit automatisch übersetzen.
Ein neuer Bilderkennungsalgorithmus ist unter freier Lizenz der Öffentlichkeit übergeben worden. Er macht für das menschliche Auge unsichtbare Strukturen sichtbar.
Apple hat mit Perceptio ein Startup übernommen, das künstliche Intelligenz und Maschinenlernen auf Smartphones und Tablets bringen will, ohne dass die Daten zur Analyse in die Cloud verschoben werden müssen. So soll die Privatsphäre gewahrt bleiben.
Flickr hat begonnen, mit einer Bilderkennung die Bilder der Benutzer automatisch mit zusätzlichen Schlagwörtern auszustatten. Das klappt eigentlich recht gut, doch manchmal macht die Bildanalyse Fehler, die unfreiwillig beleidigend oder gar rassistisch sind.
Die Programmiersprache Wolfram - auch Mathematica genannt - kann jetzt Bildinhalte erkennen: Über ein Web-Interface demonstriert Stephen Wolfram die Fähigkeiten des Algorithmus. Stellenweise sind die Ergebnisse noch recht ungenau - aber auf eine durchaus logische Art.
Der Küchentisch des Jahres 2025 zeigt mit einem Projektor die Rezepte an, kocht, identifiziert die Zutaten und wiegt diese auch. Reste erkennt die Küche automatisch und weiß, was daraus gekocht werden kann. Ikea hat das Konzept zusammen mit Designstudenten entwickelt.
Was ist auf einem Bild zu sehen? Zwei Entwicklerteams in den USA haben Verfahren entwickelt, um Bilder automatisch zu erkennen und zu beschreiben. Das ist nützlich für die Bildersuche, kann aber auch ganze andere Auswirkungen haben.
Jeden Tag posten Nutzer rund 130 Millionen Fotos auf Tumblr. Nun gibt es erste Versuche, die Datenmasse für kommerzielle Zwecke auszuwerten.
Japanische Wissenschaftler haben eine neue Möglichkeit ersonnen, wie sich Roboter in der Stadt orientieren können: Sie scannen Gullydeckel.
See-Fish hat mit See-View eine iPhone-Applikation im Programm, die eine optische Bildersuche ermöglichen soll. Die Anwendung zeigt Flickr-Fotos gruppiert nach Farben und Formen in einem dreidimensionalen Raum an.
Das Fraunhofer-Institut für Techno- und Wirtschaftsmathematik (ITWM) in Kaiserslautern hat zusammen mit dem italienischen Unternehmen Infracom eine Software entwickelt, die Brücken auf Schäden überprüft. Die Bildverarbeitungssoftware erkennt Veränderungen in den Bauwerken und markiert sie.
Gestohlene Bilder verschwinden nicht nur in geheimen Sammlungen, sondern werden manchmal auch im Handel angeboten. Für gestohlene Kunst gibt es internationale Datenbanken, doch können Fahnder auf Auktionen nur schlecht auf diese zugreifen, vor allem nicht in kurzer Zeit. Mit einer mobilen Kunstfahndungslösung samt Bilderkennung soll sich dies nun ändern.
Was ist auf einem Bild zu sehen? Zwei Entwicklerteams in den USA haben Verfahren entwickelt, um Bilder automatisch zu erkennen und zu beschreiben. Das ist nützlich für die Bildersuche, kann aber auch ganze andere Auswirkungen haben.
Google hat seine Bildersuche erweitert: Nutzer können ab sofort in den Ergebnissen der Bildersuche nach ähnlichen Motiven suchen. Similar Images war im April als Betaversion vorgestellt worden.
Ein neuer Bilderkennungsalgorithmus ist unter freier Lizenz der Öffentlichkeit übergeben worden. Er macht für das menschliche Auge unsichtbare Strukturen sichtbar.
Ubisoft hat die offene Beta für The Division eröffnet: Besitzer einer Xbox One können ab sofort, PS4- und PC-Spieler ab 19. Februar 2016 in New York antreten. Nvidia hat bereits einen Game-Ready-Grafiktreiber mit Optimierungen für den Actiontitel veröffentlicht.
(The Division Beta)
Das Honor 5X ist ein weiteres günstiges Smartphone mit interessanten Ausstattungsmerkmalen von Huawei - Metallgehäuse, Fingerabdrucksensor und 13-Megapixel-Kamera klingen nicht nach nur 230 Euro. Ob das Gerät dem ersten guten Eindruck gerecht wird, hat sich Golem.de im Test angeschaut.
(Honor 5x)
Der Patch auf Version 1.3 von Fallout 4 enthält neben Fehlerkorrekturen auch ein paar neue Funktionen, etwa ein Statusmenü in Siedlungen. Die PC-Version ist ab sofort verfügbar, Konsolenspieler sollen das Update bis Ende der Woche erhalten.
(Fallout 4)
Es ist kein richtiges Spiel, was Nintendo als erste App für Mobilegames vorgestellt hat: Mit Miitomo sollen Spieler kommunizieren können. Außerdem wurde Nintendo Account für den plattformübergreifenden Austausch etwa von Speicherständen angekündigt.
(Miitomo)
Microsoft bringt die Continuum-Funktion von Windows 10 für Smartphones: Mit einem externen Bildschirm verbunden, entsteht ein Desktop-PC, auf dem Universal-Apps wie Outlook oder Powerpoint laufen. Für Continuum sind aber neue Smartphones nötig.
(Continuum)
E-Mail an news@golem.de