Abo
  • Services:

Smart Semantics - intelligente Suchtechnik

Fraunhofer IAIS setzt auf IBMs UIMA auf

Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS stellt mit "Smart Semantics" eine intelligente Suchtechnologie vor. Sie basiert auf UIMA, der von IBM initiierten und entwickelten Architektur zur Analyse unstrukturierter Daten, und soll die maschinelle Klassifizierung von Dokumenten sowie die automatische Schlagwortgenerierung und Namenserkennung ermöglichen.

Artikel veröffentlicht am ,

Smart Semantics ist auf die Verarbeitung unstrukturierter Daten wie beispielsweise Webseiten oder Dokumenten ausgelegt. Im Gegensatz zu stichwort- oder regelbasierten Verfahren, wie sie die bekannten Suchmaschinen im Internet nutzen, verwenden Smart Semantics lernende und mustererkennende Verfahren. Sie sollen Nutzern aufwendiges Filtern der eigenen Suchergebnisse ersparen.

Stellenmarkt
  1. über duerenhoff GmbH, Neuruppin
  2. Robert Bosch GmbH, Abstatt

Die Smart-Semantic-Komponenten können als Plug-ins auf UIMA-basierenden Technologien wie der IBM-Suchlösung IBM Omnifind eingebunden werden, denn das Fraunhofer IAIS will die große Verbreitung von UIMA im Unternehmensumfeld nutzen, um seine Bausteine zur intelligenten Informationserschließung auch kleinen und mittelständischen Unternehmen verfügbar zu machen, die bisher die hohen Investitionskosten für semantische Technologien scheuten.

UIMA steht für "Unstructured Information Management Architecture" und bezeichnet ein maßgeblich im deutschen IBM Forschungs- und Entwicklungszentrum Böblingen entwickeltes Framework. UIMA ist ein offener OASIS-Standard und zudem als Open-Source-Implementierung von Apache verfügbar. Damit können beispielsweise Anwendungen zur Verarbeitung unstrukturierter Informationen erstellt werden, insbesondere natürlicher Sprache (Natural Language Processing, NLP).

Derzeit sind drei Smart-Semantic-Komponenten verfügbar: Site-Classifier, Named-Entity-Recognizer sowie der Keyword-Extractor. Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie Webseiten. Nach einer Trainingsphase sind auf diese Weise Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar ("Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden"). Gegenüber konventionellen Verfahren sollen die lernenden Verfahren den Vorteil haben, dass auch unbekannte Dokumente mit alternativen Begrifflichkeiten aufgrund ihrer Ähnlichkeit zu einem gelernten Modell klassifizierbar sind. Da auf diese Weise die Pflege von Stichwortlisten oder Heuristiken zur statischen Klassifikation entfällt, sollen Unternehmen umfangreichen Wartungsaufwand sparen.

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten nach bestimmten Entitäten (zum Beispiel "Zeige alle Seiten, die X und zusätzlich Personennamen enthalten"). Im Gegensatz zu herkömmlichen Verfahren erkennt die Smart-Semantic-Komponente Bedeutungsunterschiede gleichlautender Begriffe, wie etwa den Unterschied zwischen "Vogel" als Tier und "Vogel" als Personenname, indem der inhaltliche Kontext des Begriffs berücksichtigt wird.

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese beispielsweise für Tagclouds, Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Unternehmen können die Smart Semantics ab Herbst 2009 über IBM erwerben, weitere Komponenten sind bereits in Planung.



Anzeige
Top-Angebote
  1. 111€ (Bestpreis!)
  2. (u. a. Logitech G Pro Gaming-Maus für 37€)
  3. (u. a. Samsung Galaxy S8 für 469€ und S8+ für 569€)

Folgen Sie uns
       


Wir fahren den Jaguar I-Pace - Bericht (Genf 2018)

Wir sind den Jaguar I-Pace in Genf probegefahren und konnten ihn trotz nassem Wetter nicht aus der Spur bringen.

Wir fahren den Jaguar I-Pace - Bericht (Genf 2018) Video aufrufen
Razer Nommo Chroma im Test: Blinkt viel, klingt weniger
Razer Nommo Chroma im Test
Blinkt viel, klingt weniger

Wenn die Razer Nommo Chroma eines sind, dann auffällig. Dafür sorgen die ungewöhnliche Form und die LED-Ringe, die sich beliebig konfigurieren lassen. Die Lautsprecher sind aber eher ein Hingucker als ein Hinhörer.
Ein Test von Oliver Nickel

  1. Razer Kiyo und Seiren X im Test Nicht professionell, aber schnell im Einsatz
  2. Stereolautsprecher Razer Nommo "Sind das Haartrockner?"
  3. Nextbit Cloud-Speicher für Robin-Smartphone wird abgeschaltet

Xperia XZ2 Compact im Test: Sonys kompaktes Top-Smartphone bleibt konkurrenzlos
Xperia XZ2 Compact im Test
Sonys kompaktes Top-Smartphone bleibt konkurrenzlos

Sony konzentriert sich beim Xperia XZ2 Compact erneut auf die alte Stärke der Serie und steckt ein technisch hervorragendes Smartphone in ein kompaktes Gehäuse. Heraus kommt ein kleines Gerät, das kaum Wünsche offenlässt und in dieser Größenordnung im Grunde ohne Konkurrenz ist.
Ein Test von Tobias Költzsch

  1. Xperia XZ2 Premium Sony stellt Smartphone mit lichtempfindlicher Dualkamera vor
  2. Sony Grundrauschen an Gerüchten über die Playstation 5 nimmt zu
  3. Playstation Sony-Chef Kaz Hirai verabschiedet sich mit starken Zahlen

Datenschutz: Der Nutzer ist willig, doch die AGB sind schwach
Datenschutz
Der Nutzer ist willig, doch die AGB sind schwach

Verbraucher verstehen die Texte oft nicht wirklich, in denen Unternehmen erklären, wie ihre Daten verarbeitet werden. Datenschutzexperten und -forscher suchen daher nach praktikablen Lösungen.
Ein Bericht von Christiane Schulzki-Haddouti

  1. Soziales Netzwerk Facebook will in Deutschland Vertrauen wiedergewinnen
  2. Denial of Service Facebook löscht Cybercrime-Gruppen mit 300.000 Mitgliedern
  3. Vor Anhörungen Zuckerberg nimmt alle Schuld auf sich

    •  /