Original-URL des Artikels: https://www.golem.de/news/snapsearch-seo-fuers-dynamische-web-dank-firefox-backend-1405-106569.html    Veröffentlicht: 19.05.2014 16:37    Kurz-URL: https://glm.io/106569

Snapsearch

SEO fürs dynamische Web dank Firefox-Backend

Da die meisten Suchmaschinen keine dynamischen Inhalte indizieren, welche etwa mit Javascript erzeugt werden, liefert Snapsearch optimierte Inhalte, um diese dennoch finden zu können.

Mit modernen Webtechniken wie HTML5 oder auch Javascript lassen sich sehr komplexe dynamische Inhalte für Webseiten erstellen. Nur können die meisten derzeit aktuellen Web-Crawler wie jener der Google-Suche oder die Bild-Extraktion für Facebook nicht damit umgehen. Dieses Problem will Snapsearch lösen, indem den Crawlern ein Schnappschuss der Seite samt dynamischer Inhalte angeboten wird.

So sollen denjenigen Clients, die auf die Webseite zugreifen, sämtliche Inhalte dargestellt werden können, auch wenn diese selbst kein Javascript ausführen können. Dazu müssen die Webseiten oder Web-Anwendungen eine derartige Nachfrage erkennen und an die von Snapsearch bereitgestellte Middleware weiterleiten.

Firefox-Engine als Unterbau

Jene Middleware nutzt intern Nightly-Builds von Firefox, um ständig aktuelle HTML5-Techniken benutzen zu können. Durch die Verwendung der Browser-Engine wird erreicht, dass der an den Crawler weitergeleitete Schnappschuss dem entspricht, was ein Nutzer sähe. Zudem ist Snapsearch dadurch unabhängig von dem Javascript-Frameworks, mit denen die Anwendung erstellt worden ist.

Der Dienst von Snapsearch arbeitet mit Lastverteilung und ist so in der Lage, auch sehr große Seiten zu bearbeiten. Die Schnappschüsse selbst werden in der Amazon-Cloud gespeichert und über Prüfsummen unterschieden. Die Caches werden zwischen einer und 200 Stunden vorgehalten.

Das Unternehmen rechnet pro erstelltem Schnappschuss, die ersten 1000 sind gratis. Weitere 1000 Zugriffe kosten je zwei Australische-Dollar, etwa 1,50 Euro. Die Snapsearch-Clients sind samt Demo-Code auf Github in PHP, Ruby, Python und als Node.js-Paket verfügbar.  (sg)


Verwandte Artikel:
Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren   
(24.04.2017, https://glm.io/127446 )
Große Koalition: Evaluierungsverweigerer Maas wird Außenminister   
(09.03.2018, https://glm.io/133249 )
Meta-Suchmaschine Webcrawler startet in Deutschland   
(06.06.2003, https://glm.io/25834 )
LLVM 6.0: Clang bekommt Maßnahme gegen Spectre-Angriff   
(09.03.2018, https://glm.io/133241 )
Streit mit Google: Amazon löscht Chromecast-Eintrag wieder   
(09.03.2018, https://glm.io/133237 )

© 1997–2018 Golem.de, https://www.golem.de/