Große Datenbestände

Wir bekommen immer wieder Anfragen, wie viele Datensätze im GENprofi5 verwaltet werden können. Hier können wir leider nur sagen: Wir haben keine Ahnung.

Das klingt ziemlich ernüchternd, aber es ist wirklich schwierig, hier eine klare Aussage zu treffen. Natürlich können wir die theoretischen Grenzen herunterbeten - aber wem hilft das?

Also haben wir uns hingesetzt und einen Testbestand erzeugt, der sehr wahrscheinlich größer ist, als der umfangreichste Bestand bei einem Anwender. Der größte uns bekannte Bestand in einem Forschungsbereich umfasst 450.000 Personen (Sie haben einen größeren Bestand, dann reicht eine kurze Info und wir korrigieren das hier umgehend). Dieses Volumen galt es zu schlagen.

Nach dem Aufbau der Daten haben wir in dem Bestand gesucht, neue Datensätze eingetragen und die Optimierung laufen lassen. Alles lief ohne Probleme - ok, wir hatten zwischendurch schon das Gefühl, dass etwas nicht in Ordnung war, weil die Wartezeiten bei der Standardsuche länger dauerte, als man es normalerweise erwarten würde.

Das lag aber daran, dass wir bei unserem Testdatenbestand natürlich viele Doubletten hatten und wir so in der Regel Suchergebnisse erhielten, die gut und gerne 80.000 bis 120.000 Treffer erzielten. Danach konnte man sich die Suchzeit von 7 Sekunden erklären.

Auch dauerte die Optimierung etwas länger …

Screenshot GP5_OPT

Details kann man den nachfolgenden Tabellen entnehmen.

Datei Größe
ORT__Z0.DBF 2.740.927
ORT__Z0.FPT 75.178
REG__Z0.DBF 15.225.865
REG__Z0.FPT 168.034
DAT__Z0.DBF 7.399.698.263
DAT__Z0.FPT 164.134.093
ABK__Z0.DBF 81.011
DDEF_Z0.DBF 29.657
FAM__Z0.DBF 142.572.180
PER__Z0.DBF 455.840.575
TAB1_Z0.DBF 498.097.873
TAB2_Z0.DBF 172.520.479
Gesamt 8.851.184.135
Tabelle Anzahl Datensätze
Ortsdatei 10.622
Registerdatei 68.894
Sachgebietsdatei 19.945.276
Kennzeichen 392
Sachgebietsdefinitionen 62
Familiendatei 1.261.697
Personendatei 4.144.002
Personen-/Familientabelle 5.750.674
Namentabelle 11.859.467

Kurz zusammengefasst ist der Testdatenbestand gute 8 GB groß, es sind etwas mehr als 4 Millionen Personen enthalten und die Optimierung für diesen Bestand dauerte knapp 35 Minuten.