Textlokalisierung in Plänen

Das Ziel dieses KI-Services ist die Erfassung von Metadaten und semantischen Informationen, die in Plänen erhalten sind.

Neben der Geometrie des Bauwerks und seiner Komponenten enthalten Pläne auch semantische Informationen, die in Textform festgehalten sind (z.B. Raumstempel, Maße). Für die automatische Analyse eingescannter Pläne müssen diese Textelemente zunächst lokalisiert, dann erkannt und folglich verarbeitet werden.

Dieser KI-Service dient zur Lokalisierung dieser Textelemente. Eine herkömmliche Software zur Dokumentenanalyse oder Textdetektoren aus anderen Domänen (z.B. Straßenverkehr) liefern auf eingescannten Plänen keine zufriedenstellenden Ergebnisse. Daher ist dieser Dienst speziell für diesen Anwendungsfall trainiert und kann auch Pläne mit geringer Qualität verarbeiten.



Daten

  • Qualität: Im besten Fall haben die eingescannten Pläne bereits eine gute Qualität. Das heißt sie sind insbesondere kontrastreich und weisen keine Altersartefakte wie Knicklinien, Verfärbungen und Verblassung auf. Jedoch ermöglicht dieser Dienst auch die Verarbeitung von Plänen schlechterer Qualität, was jedoch tendenziell zu schlechteren Ergebnissen führt.

  • Eingabedatenformat:
    • PNG-Datei eines Grundrisses (oder eines anderen Zeichnungstyps)

  • Ausgabedatenformat:
    • Bildschnipsel mit Textelementen
    • Dateiformate
      • JSON-Datei
        • Liste aller erkannten Bounding Boxes (je Bounding Box: Koordinaten für 2 Punkte in 2D)
      • PNG-Dateien
        • Original-Datei zur Weiterverarbeitung
        • Visualisierung des Ergebnisses

Ansprechpater:in:
Phillip Schönfelder, M. Sc., Lehrstuhl für Informatik im Bauwesen, Ruhr-Universität Bochum
Felix Kretschmann, elevait GmbH & Co. KG
Bianca Preißler, elevait GmbH & Co. KG