10.4.3 Indizierung
Nach der Installation der ADVOKAT Volltextsuche müssen die Dokumente per Crawler indiziert werden, damit diese per Volltextsuche gefunden werden können.
Die Indizierung findet vollautomatisch statt, der Fortschritt kann im Modul selbst erkannt werden.
( x/y Total a/b )
x = Alle bereits per OCR verarbeiteten Dokumente
y = Gesamtanzahl aller Dokumente, welche durch OCR verarbeitet werden können
a = Alle bereits indizierten Dokumente
b = Gesamtanzahl aller Dokumente
Die Geschwindigkeit der Indizierung hängt von mehreren Faktoren ab:
Anzahl der Dokumente
Dateigröße und Dateityp pro Dokument
OCR-Funktionalität aktiviert oder deaktiviert
Auslastung des AdvoAll-Geräts
verfügbarer (konfigurierbar) Arbeitsspeicher, siehe Kapitel Häufige Konfigurationsaufgaben.
Wird die Volltextsuche auf ein anderes AdvoAll-Gerät wie im Kapitel ADVOKAT Volltextsuche (Migration) beschrieben migriert, dann sollte der Index auch migriert werden.
Wird der Index nicht migriert, dann wird am neuen AdvoAll-Gerät der Index automatisch neu aufgebaut. Es gibt zwei Gründe, weshalb der Index nicht migriert werden kann:
Der Index muss die passende Version (Schema) zur Installation von SOLR bzw. Tesseract aufweisen, es wäre unter Umständen ein Versionsupgrade erforderlich.
Der existierende Index kann Beschädigungen aufweisen, durch eine Migration würde man diese Beschädigungen übernehmen.
Eine Reparatur des Index ist im Kapitel Index der Volltextsuche beschädigt beschrieben, würde aber mehr Aufwand bedeuten, als den Index neu aufbauen zu lassen.