Machine Learning: Google spendiert Wikipedia Millionen und Gratis-Übersetzung
Das Software-Unternehmen Google erweitert seine finanzielle Unterstützung für Wikipedia und ermöglicht dem Projekt zudem kostenlosen Zugriff auf verschiedene Cloud- und Machine-Learning-APIs. Dazu gehören die automatisierte Übersetzung, eine eigene Suche oder die Digitalisierung von Büchern.

Wikipedia und ihre Schwesterprojekte sind zwar mittlerweile für viele Menschen ein integraler Bestandteil des Webs. Vor allem die Repräsentation und Verteilung der sprachlichen Inhalte entspricht aber nicht den Zielen, die sich die Wikimedia Foundation wohl selbst gesetzt hat. So umfassen die Artikel in Arabisch nur rund 3 Prozent der Wikipedia-Inhalte, dabei ist die arabische Sprache eine der am meisten gesprochenen Sprachen überhaupt. Um dieses und einige weitere derartige Probleme zu lösen, erweitert Google sein finanzielles Engagement für Wikipedia um 2 Millionen US-Dollar und bietet dem Projekt zusätzlich dazu kostenfreien Zugriff auf einige seiner Cloud- und Machine-Learning-Werkzeuge.
Laut der Ankündigung von Google sei es entscheidend, dass die Milliarden Nutzer Webinhalte finden, die der Diversität der Nutzer entsprechen. Um also mehr Inhalte in lokalen und auch weniger gesprochenen Sprachen zur Verfügung zu stellen, will Google eng mit Wikipedia und ihren Autoren zusammenarbeiten. Der erste wichtige Schritt dieser Kooperation ist eine Integration der Google-API zur Übersetzung in das Wikipedia-Werkzeug zum Übersetzen von Inhalten.
Das ermöglicht Wikipedia, automatisierte Übersetzungen in 15 Sprachen anzubieten, die in dem eigenen Werkzeug bisher nicht verfügbar waren. Dazu zählen etwa Hausa, Yoruba, Kurdisch (Kurmanji) oder auch Zulu, die zusammen mehr als 100 Millionen Sprecher haben. Darüber hinaus will Google an das erfolgreiche Projekt Tiger anknüpfen, das mit Wikipedia durchgeführt wurde, um mehr lokalsprachliche Inhalte in Indien bereitzustellen. Künftig heißt dieses Initiative Glow (Growing Local Language Content) und wird auf Sprachen in "Indien, Indonesien, Mexiko, Nigeria, dem nahen und mittleren Osten sowie Nordafrika" ausgeweitet.
Um hier die Qualität der Inhalte zu erhalten, will Google darüber hinaus Wikipedia die Cloud Custom Search API bereitstellen, um passende Quellen zu finden. Mit Hilfe der Cloud Vision API sollen ebenso gemeinfreie Bücher in indoarischen Sprachen digitalisiert werden. Das soll insbesondere dabei helfen, vielfältige und angesehene Quellen für Zitate und Einzelnachweise bereitzustellen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Die Maschine kann eine Übersetzung versprechen. Aber brauchbar sind Google-Übersetzungen...
Das Kann ja nur gut enden