Unsere Hauptaufgabe bestand darin, Karten aus verschiedenen Jahrzehnten, die vom HIL bereitgestellt wurden, in die Struktur des MapReader-Tools zu integrieren, um automatisch verschiedene Flächen zu erkennen. Zunächst hatten wir uns das Ziel gesetzt, Waldgebiete zu identifizieren, mit der Option, bei ausreichender Zeit auch Siedlungsgebiete zu erfassen. Aufgrund von Zeitmangel war Letzteres jedoch nicht mehr möglich.
Am Ende des Projekts entwickelten wir zwei Jupyter-Notebooks (Pipelines), die das MapReader-Python-Paket verwenden und auf Karten des HIL aus dem LAGIS (Landesgeschichtliches Informationssystem) anwendbar sind.
- erste Pipeline ruft Metadaten für ein bestimmtes Jahr aus dem LAGIS ab, passt sie für MapReader an und lädt zwei Karten herunter. Diese werden in Patches aufgeteilt und manuell annotiert, um die Trainingsdaten für das KI-Modell zu bilden. Das Modell wird optimiert und schließlich gespeichert.
- Die zweite Pipeline lädt das trainierte Modell und klassifiziert Karten-Patches für ein angegebenes Jahr. Dabei wird eine GeoJson-Datei generiert, die die Koordinaten, Labels (z. B. „Wald“ oder „keins“) und die Confidence enthält.
Die resultierende GeoJson-Datei kann zusammen mit den Originalkarten in Programmen wie QGIS visualisiert werden.