• IT-Karriere:
  • Services:

Smart Semantics - intelligente Suchtechnik

Fraunhofer IAIS setzt auf IBMs UIMA auf

Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS stellt mit "Smart Semantics" eine intelligente Suchtechnologie vor. Sie basiert auf UIMA, der von IBM initiierten und entwickelten Architektur zur Analyse unstrukturierter Daten, und soll die maschinelle Klassifizierung von Dokumenten sowie die automatische Schlagwortgenerierung und Namenserkennung ermöglichen.

Artikel veröffentlicht am ,

Smart Semantics ist auf die Verarbeitung unstrukturierter Daten wie beispielsweise Webseiten oder Dokumenten ausgelegt. Im Gegensatz zu stichwort- oder regelbasierten Verfahren, wie sie die bekannten Suchmaschinen im Internet nutzen, verwenden Smart Semantics lernende und mustererkennende Verfahren. Sie sollen Nutzern aufwendiges Filtern der eigenen Suchergebnisse ersparen.

Stellenmarkt
  1. Information und Technik Nordrhein-Westfalen (IT.NRW), Aachen
  2. IT-Servicezentrum der bayerischen Justiz, Schwabmünchen, Bamberg

Die Smart-Semantic-Komponenten können als Plug-ins auf UIMA-basierenden Technologien wie der IBM-Suchlösung IBM Omnifind eingebunden werden, denn das Fraunhofer IAIS will die große Verbreitung von UIMA im Unternehmensumfeld nutzen, um seine Bausteine zur intelligenten Informationserschließung auch kleinen und mittelständischen Unternehmen verfügbar zu machen, die bisher die hohen Investitionskosten für semantische Technologien scheuten.

UIMA steht für "Unstructured Information Management Architecture" und bezeichnet ein maßgeblich im deutschen IBM Forschungs- und Entwicklungszentrum Böblingen entwickeltes Framework. UIMA ist ein offener OASIS-Standard und zudem als Open-Source-Implementierung von Apache verfügbar. Damit können beispielsweise Anwendungen zur Verarbeitung unstrukturierter Informationen erstellt werden, insbesondere natürlicher Sprache (Natural Language Processing, NLP).

Derzeit sind drei Smart-Semantic-Komponenten verfügbar: Site-Classifier, Named-Entity-Recognizer sowie der Keyword-Extractor. Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie Webseiten. Nach einer Trainingsphase sind auf diese Weise Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar ("Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden"). Gegenüber konventionellen Verfahren sollen die lernenden Verfahren den Vorteil haben, dass auch unbekannte Dokumente mit alternativen Begrifflichkeiten aufgrund ihrer Ähnlichkeit zu einem gelernten Modell klassifizierbar sind. Da auf diese Weise die Pflege von Stichwortlisten oder Heuristiken zur statischen Klassifikation entfällt, sollen Unternehmen umfangreichen Wartungsaufwand sparen.

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten nach bestimmten Entitäten (zum Beispiel "Zeige alle Seiten, die X und zusätzlich Personennamen enthalten"). Im Gegensatz zu herkömmlichen Verfahren erkennt die Smart-Semantic-Komponente Bedeutungsunterschiede gleichlautender Begriffe, wie etwa den Unterschied zwischen "Vogel" als Tier und "Vogel" als Personenname, indem der inhaltliche Kontext des Begriffs berücksichtigt wird.

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese beispielsweise für Tagclouds, Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Unternehmen können die Smart Semantics ab Herbst 2009 über IBM erwerben, weitere Komponenten sind bereits in Planung.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (u. a. Asus Rog Strix X570-F + Ryzen 7 3700X für 555,00€, Asus Tuf B450-Plus + Ryzen 7 2700 für...
  2. täglich neue Deals bei Alternate.de

Folgen Sie uns
       


Golem-Akademie - Trainer Stefan stellt sich vor

Rund 20 Jahre Erfahrung als Manager und Mitglied der Geschäftsleitung im internationalen Kontext sowie als Berater sind die Basis seiner Trainings. Der Diplom-Ingenieur Stefan Bayer hat als Mitarbeiter der ersten Stunde bei Amazon.de den Servicegedanken in der kompletten Supply Chain in Deutschland entscheidend mitgeprägt und bis zu 4.500 Menschen geführt. Er ist als Trainer und Coach spezialisiert auf die Begleitung von Führungskräften und Management-Teams sowie auf prozessorientierte Trainings.

Golem-Akademie - Trainer Stefan stellt sich vor Video aufrufen
Amazon Echo Studio im Test: Homepod-Bezwinger begeistert auch als Fire-TV-Lautsprecher
Amazon Echo Studio im Test
Homepod-Bezwinger begeistert auch als Fire-TV-Lautsprecher

Mit dem Echo Studio bringt Amazon seinen teuersten Alexa-Lautsprecher auf den Markt. Dennoch ist er deutlich günstiger als Apples Homepod, liefert aber einen besseren Klang. Und das ist längst nicht alles.
Ein Test von Ingo Pakalski

  1. Amazons Heimkino-Funktion Echo-Lautsprecher drahtlos mit Fire-TV-Geräten verbinden
  2. Echo Flex Amazons preiswertester Alexa-Lautsprecher
  3. Amazons Alexa-Lautsprecher Echo Dot hat ein LED-Display - Echo soll besser klingen

Red Dead Redemption 2 für PC angespielt: Schusswechsel mit Startschwierigkeiten
Red Dead Redemption 2 für PC angespielt
Schusswechsel mit Startschwierigkeiten

Die PC-Version von Red Dead Redemption 2 bietet schönere Grafik als die Konsolenfassung - aber nach der Installation dauert es ganz schön lange bis zum ersten Feuergefecht in den Weiten des Wilden Westens.

  1. Rockstar Games Red Dead Redemption 2 belegt 150 GByte auf PC-Festplatte
  2. Rockstar Games Red Dead Redemption 2 erscheint für Windows-PC und Stadia
  3. Rockstar Games Red Dead Online wird zum Rollenspiel

Mi Note 10 im Hands on: Fünf Kameras, die sich lohnen
Mi Note 10 im Hands on
Fünf Kameras, die sich lohnen

Mit dem Mi Note 10 versucht Xiaomi, der Variabilität von Huaweis Vierfachkameras noch eins draufzusetzen - mit Erfolg: Die Fünffachkamera bietet in fast jeder Situation ein passendes Objektiv, auch die Bildqualität kann sich sehen lassen. Der Preis dafür ist ein recht hohes Gewicht.
Ein Hands on von Tobias Költzsch

  1. Xiaomi Neues Redmi Note 8T mit Vierfachkamera kostet 200 Euro
  2. Mi Note 10 Xiaomis neues Smartphone mit 108 Megapixeln kostet 550 Euro
  3. Mi Watch Xiaomi bringt Smartwatch mit Apfelgeschmack

    •  /