Wir haben eine Suchmaschine entwickelt, die sämtliche Daten zu den Firmen selbstständig erhebt, pflegt und miteinander vernetzt. Letzte Woche wurde der wichtige Meilenstein von 250.000 Firmenprofilen überschritten, die die Suchmaschine eigenständig profiliert. Eine Grafik und kurzer Rückblick, um diesen Zwischenstand einzuordnen:

Datenbestand

Im März 2013 ging der erste Server von Implisense in den Dauerbetrieb, um eigenständig aus einer Liste von mehreren tausend URLs zu entdecken, welche davon von wirtschaftsaktiven Firmen aus Deutschland betrieben werden. Diese Firmen profiliert anschließend das Analyse-Backend von Implisense bei jedem wiederkehrenden Prüfvorgang.

Im Sommer 2013 wurden erstmals ein Cluster mit vier Multikern-Servern installiert, um das Crawling und die Analyse zu verteilen und den Datenbestand auf ca. 65.000 Firmenprofile auszubauen.

Im September 2013 begann der weitere Ausbau des Clusters und die Erhöhung der Arbeitslast der Suchmaschine. Wenig später wurden 160.000 Firmenprofile automatisch erzeugt und gepflegt.

Im Januar 2014 wurden weitere Server dem Cluster hinzugefügt und mit einer Rate von anfänglich 1.000, später 5.000 neuen Firmen pro Tag erweitert. Anfang Februar 2014 kannte die Suchmaschine ca. 220.000 Firmen.

Mitte Februar wurden erstmals 250.000 Firmenprofile im Index erreicht und die Rate der Erkennung neuer Firmen daraufhin reduziert. Jetzt liegt der Fokus auf der Optimierung der Such-Performance sowie der Analyse der unstrukturierten Textdaten. Ein besonderer Schwerpunkt liegt dabei auf der Erkennung von Firmennetzwerken, also der Frage, wer mit wem in welcher Rolle zusammen arbeitet. Dieses Feature wird erstmals auf der CeBIT 2014 präsentiert.

Facebooktwittergoogle_plus