Abo
  • Services:

Smart Semantics - intelligente Suchtechnik

Fraunhofer IAIS setzt auf IBMs UIMA auf

Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS stellt mit "Smart Semantics" eine intelligente Suchtechnologie vor. Sie basiert auf UIMA, der von IBM initiierten und entwickelten Architektur zur Analyse unstrukturierter Daten, und soll die maschinelle Klassifizierung von Dokumenten sowie die automatische Schlagwortgenerierung und Namenserkennung ermöglichen.

Artikel veröffentlicht am ,

Smart Semantics ist auf die Verarbeitung unstrukturierter Daten wie beispielsweise Webseiten oder Dokumenten ausgelegt. Im Gegensatz zu stichwort- oder regelbasierten Verfahren, wie sie die bekannten Suchmaschinen im Internet nutzen, verwenden Smart Semantics lernende und mustererkennende Verfahren. Sie sollen Nutzern aufwendiges Filtern der eigenen Suchergebnisse ersparen.

Stellenmarkt
  1. Bosch Gruppe, Berlin
  2. OKI EUROPE LIMITED, Branch Office Düsseldorf, Düsseldorf

Die Smart-Semantic-Komponenten können als Plug-ins auf UIMA-basierenden Technologien wie der IBM-Suchlösung IBM Omnifind eingebunden werden, denn das Fraunhofer IAIS will die große Verbreitung von UIMA im Unternehmensumfeld nutzen, um seine Bausteine zur intelligenten Informationserschließung auch kleinen und mittelständischen Unternehmen verfügbar zu machen, die bisher die hohen Investitionskosten für semantische Technologien scheuten.

UIMA steht für "Unstructured Information Management Architecture" und bezeichnet ein maßgeblich im deutschen IBM Forschungs- und Entwicklungszentrum Böblingen entwickeltes Framework. UIMA ist ein offener OASIS-Standard und zudem als Open-Source-Implementierung von Apache verfügbar. Damit können beispielsweise Anwendungen zur Verarbeitung unstrukturierter Informationen erstellt werden, insbesondere natürlicher Sprache (Natural Language Processing, NLP).

Derzeit sind drei Smart-Semantic-Komponenten verfügbar: Site-Classifier, Named-Entity-Recognizer sowie der Keyword-Extractor. Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie Webseiten. Nach einer Trainingsphase sind auf diese Weise Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar ("Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden"). Gegenüber konventionellen Verfahren sollen die lernenden Verfahren den Vorteil haben, dass auch unbekannte Dokumente mit alternativen Begrifflichkeiten aufgrund ihrer Ähnlichkeit zu einem gelernten Modell klassifizierbar sind. Da auf diese Weise die Pflege von Stichwortlisten oder Heuristiken zur statischen Klassifikation entfällt, sollen Unternehmen umfangreichen Wartungsaufwand sparen.

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten nach bestimmten Entitäten (zum Beispiel "Zeige alle Seiten, die X und zusätzlich Personennamen enthalten"). Im Gegensatz zu herkömmlichen Verfahren erkennt die Smart-Semantic-Komponente Bedeutungsunterschiede gleichlautender Begriffe, wie etwa den Unterschied zwischen "Vogel" als Tier und "Vogel" als Personenname, indem der inhaltliche Kontext des Begriffs berücksichtigt wird.

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese beispielsweise für Tagclouds, Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Unternehmen können die Smart Semantics ab Herbst 2009 über IBM erwerben, weitere Komponenten sind bereits in Planung.



Anzeige
Top-Angebote
  1. (u. a. Acer XB271 WQHD 144 Hz für 499€ und Kingston HyperX Cloud II für 65€)
  2. 38,90€ + Versand (Bestpreis!)
  3. (u. a. Sharkoon Skiller SGK4 für 19,99€ + Versand und Sharkoon SilentStorm Icewind Black 750 W...

Folgen Sie uns
       


Apple Mac Mini (Late 2018) - Test

Apple Mac Mini (Late 2018) ist ein kompaktes System mit Quadcore- oder Hexacore-Chip. Uns gefällt die Anschlussvielfalt mit klassischem USB und Thunderbolt 3, zudem arbeitet der Rechner sparsam und sehr leise. Die Zielgruppe erscheint uns aber klein, da der Mac Mini mindestens 900 Euro, aber nur eine integrierter Grafikeinheit aufweist.

Apple Mac Mini (Late 2018) - Test Video aufrufen
Apple Mac Mini (Late 2018) im Test: Tolles teures Teil - aber für wen?
Apple Mac Mini (Late 2018) im Test
Tolles teures Teil - aber für wen?

Der Mac Mini ist ein gutes Gerät, wenngleich der Preis für die Einstiegsvariante von Apple arg hoch angesetzt wurde und mehr Speicher(platz) viel Geld kostet. Für 4K-Videoschnitt eignet sich der Mac Mini nur selten und generell fragen wir uns, wer ihn kaufen soll.
Ein Test von Marc Sauter

  1. Apple Mac Mini wird grau und schnell
  2. Neue Produkte Apple will Mac Mini und Macbook Air neu auflegen

Sony-Kopfhörer WH-1000XM3 im Test: Eine Oase der Stille oder des puren Musikgenusses
Sony-Kopfhörer WH-1000XM3 im Test
Eine Oase der Stille oder des puren Musikgenusses

Wir haben die dritte Generation von Sonys Top-ANC-Kopfhörer getestet - vor allem bei der Geräuschreduktion hat sich einiges getan. Wer in lautem Getümmel seine Ruhe haben will, greift zum WH-1000XM3. Alle Nachteile der Vorgängermodelle hat Sony aber nicht behoben.
Ein Test von Ingo Pakalski


    IMHO: Valves Ka-Ching mit der Brechstange
    IMHO
    Valves "Ka-Ching" mit der Brechstange

    Es klingelt seit Jahren in den Kassen des Unternehmens von Gabe Newell. Dabei ist die Firma tief verschuldet - und zwar in den Herzen der Gamer.
    Ein IMHO von Michael Wieczorek

    1. Artifact im Test Zusammengewürfelt und potenziell teuer
    2. Artifact Erste Kritik an Kosten von Valves Sammelkartenspiel
    3. Virtual Reality Valve arbeitet an VR-Headset und Half-Life-Titel

      •  /