UIMA: Open Source von IBM soll Texte verstehen
Framework zur Analyse unstrukturierter Daten
Mit der "Unstructured Information Management Architecture" (UIMA) bietet IBM eine Open-Source-Technik an, die Entwicklern helfen soll, Applikationen zu entwickeln, die verstehen, welche Passagen in einem Text wichtig und relevant sind und was mit ihnen gemeint ist. So sollen sich unstrukturierte Daten besser erfassen lassen.
UIMA stellt dazu ein offenes Software-Framework mit einer Standardschnittstelle bereit, über die sich Applikationen um die Analyse unstrukturierter Informationen erweitern lassen. So soll sich UIMA leicht in bestehende Systeme integrieren lassen. Zugleich soll UIMA aber auch die Basis darstellen, um neue, wiederverwendbare Analyse-Komponenten für unstrukturierte Daten zu erstellen.
Entwickelt wurde UIMA in den letzten vier Jahren von IBM Research mit Unterstützung der "Defense Advanced Research Projects Agency" (DARPA), der zentralen Forschungseinreichtung des US-Verteidigungsministerium und den Universitäten Carnegie Mellon, Columbia, Stanford und Massachusetts Amherst. Aber auch einige weitere Unternehmen waren an der Entwicklung beteiligt.
IBM setzt UIMA bereits im "WebSphere Information Integrator OmniFind Edition" ein, aber auch der WebSphere Portal Server und Lotus Work Place nutzen UIMA. Ende des Jahres will IBM die Software nun auf SourceForge.net als Open Source veröffentlichen. Derzeit steht UIMA über IBMs Entwicklerseite AlphaWorks zum Download bereit.






Im Rahmen meiner Studie "Daten-, Projekt- und Prozessmanagement, Status quo" beschäftige...
Kommentieren