Suchmaschinen: Lucene Core und Solr 3.3 veröffentlicht

Die unter der Ägide der Apache-Foundation stehenden Projekte Lucene Core und das darauf basierende Solr sind zeitgleich in der Versionsnummer 3.3 veröffentlicht worden. Der in Java geschriebene Kern der freien Suchmaschine Lucene erhält eine Autovervollständigung samt Vorschlagsfunktion für seine Rechtschreibprüfung.
Dafür wurden drei Techniken integriert: Jaspell(öffnet im neuen Fenster) , Ternary Trie(öffnet im neuen Fenster) und Finit State(öffnet im neuen Fenster) . Mit dem künftig verwendeten Kstem soll die Grundformenreduktion für englische Wörter verfeinert worden sein. Aus fragmentierten Suchergebnissen (Shards) können Resultate künftig sowohl in Topdocs.merge als normale Suchergebnisse sowie in den Gruppierungen Searchgroup.merge und Topgroups.merge zusammengefasst werden.
Weitere Verbesserungen hat die Funktion Mmapdirectory erhalten, die künftig auch auf 64-Bit-Linux-Systemen von Fsdirectory.open statt wie bisher Niofsdirectory verwendet wird. Die Echtzeitsuche mit dem Nrtmanager wird durch die Verwendung von mehreren Threads vereinfacht. Damit kann eine Anwendung kontrollieren, welche Änderungen bei der Indexierung in welchen Suchergebnissen sichtbar sein sollen.
Solr erhält die gleiche Versionsnummer wie Lucene Core, denn die Suchplattform enthält das aktuelle Lucene Core. Deren Autovervollständigung wurde so optimiert, dass sie weniger Speicher verbraucht. Der Speicherverbrauch der Rechtschreibprüfung wurde ebenfalls reduziert. Solr verwendet auch die Indexierung per TieredMergePolicy , die auch nicht benachbarte Segmente zusammenfassen kann(öffnet im neuen Fenster) .
Weitere Details zu den Änderungen und Bugfixes in Lucene 3.3 haben die Entwickler in einer Changelog-Datei(öffnet im neuen Fenster) zusammengefasst. Die Änderungen in Solr 3.3 haben die Entwickler ebenfalls in einer Readme-Datei zusammengestellt. Der Download von Lucene Core(öffnet im neuen Fenster) und Solr(öffnet im neuen Fenster) erfolgt über die Server des Apache-Projekts.



