Texterkennung (OCR) in Plänen

Das Ziel dieses KI-Services ist die Erfassung von Metadaten und semantischen Informationen, die in Plänen erhalten sind.

Neben der Geometrie des Bauwerks und seiner Komponenten enthalten Pläne auch semantische Informationen, die in Textform festgehalten sind (z.B. Raumstempel, Maße). Für die automatische Analyse eingescannter Pläne müssen diese Textelemente zunächst lokalisiert, dann erkannt und folglich verarbeitet werden.

Mit dem KI-Service „Textlokalisation in Plänen“ wurde demonstriert, wie KI genutzt wird, um Textelemente zu lokalisieren, welches die Grundlage für diesen Dienst liefert. Nun kann dieser KI-Service die Textelemente in maschinenlesbare Strings zurückgeben. Dazu werden hochperformante Optical Character Recognition (OCR)- Modelle verwendet.




3. Daten

  • Qualität: Die Textfelder sollten den zu erkennenden Text, aber möglichst wenige umgebende Pixelreihen beinhalten.

  • Eingangsdaten:
    • Bildschnipsel mit Textelementen (etwa aus BIMKIT-Dienst Textlokalisierung)
      • JSON-Datei
        • Liste aller erkannten Bounding Boxes (je Bounding Box: Koordianten für 2 Punkte in 2D)
      • PNG-Dateien
        • Original-Datei zur Weiterverarbeitung
        • Visualisierung des Ergebnisses
  • Ausgangsdaten:
    • Liste mit Textelementen



Ansprechpater:in:
Phillip Schönfelder, M. Sc., Lehrstuhl für Informatik im Bauwesen, Ruhr-Universität Bochum
Björn Buck, A+S Consult GmbH (A+S)
Mike Nicke, A+S Consult GmbH (A+S)
Felix Kretschmann, elevait GmbH & Co. KG
Bianca Preißler, elevait GmbH & Co. KG