10.4.3 Indizierung

10.4.3 Indizierung

Nach der Installation der ADVOKAT Volltextsuche müssen die Dokumente per Crawler indiziert werden, damit diese per Volltextsuche gefunden werden können.
Die Indizierung findet vollautomatisch statt, der Fortschritt kann im Modul selbst erkannt werden.



( x/y Total a/b )
x = Alle bereits per OCR verarbeiteten Dokumente
y = Gesamtanzahl aller Dokumente, welche durch OCR verarbeitet werden können
a = Alle bereits indizierten Dokumente
b = Gesamtanzahl aller Dokumente

Die Geschwindigkeit der Indizierung hängt von mehreren Faktoren ab:

  • Anzahl der Dokumente

  • Dateigröße und Dateityp pro Dokument

  • OCR-Funktionalität aktiviert oder deaktiviert

  • Auslastung des AdvoAll-Geräts

  • verfügbarer (konfigurierbar) Arbeitsspeicher, siehe Kapitel Häufige Konfigurationsaufgaben.


Wird die Volltextsuche auf ein anderes AdvoAll-Gerät wie im Kapitel ADVOKAT Volltextsuche (Migration) beschrieben migriert, dann sollte der Index auch migriert werden.
Wird der Index nicht migriert, dann wird am neuen AdvoAll-Gerät der Index automatisch neu aufgebaut. Es gibt zwei Gründe, weshalb der Index nicht migriert werden kann:

  • Der Index muss die passende Version (Schema) zur Installation von SOLR bzw. Tesseract aufweisen, es wäre unter Umständen ein Versionsupgrade erforderlich.

  • Der existierende Index kann Beschädigungen aufweisen, durch eine Migration würde man diese Beschädigungen übernehmen.