Erschließung von Dark Data von CAD zur Erstellung digitaler Zwillinge
Wie ein Unternehmen, das Software für das Ingenieurwesen entwickelt, eine der größten Herausforderungen bei der Umwandlung von CAD in GIS bewältigt hat.
Teilen
KATEGORIE: Enterprise Engineering
Dieser Artikel, verfasst von Autor Gavin Schrock, wurde ursprünglich in GoGeomatics veröffentlicht.
10. November 2023
Theoretisch sollte das Sammeln von Elementen aus technischen Zeichnungen zum Auffüllen und Erweitern von GIS ein recht einfaches Unterfangen sein. In der Praxis stellt sich die Umsetzung jedoch nur selten als einfach heraus. Sollten sich die Linien und Symbole in den CAD-Zeichnungen, die durch Ebenen (oder Schichten) und Zellen (oder Blöcke) unterschieden werden, nicht nahtlos in ein GIS-Schema übertragen lassen, wenn sie in einem relationalen räumlichen Bezugsrahmen dargestellt werden? Es wird oft gesagt, dass der Teufel im Detail steckt, aber im Fall von veraltetem CAD kann der Teufel in der Unfähigkeit liegen, die Details zu erkennen.
„Die Sache mit CAD-Standards ist, dass sie nicht immer strikt eingehalten werden und sich weiterentwickeln“, sagte Mark Stefanchuk, Chief Technology Officer bei Phocaz Inc. „Zum Beispiel wurden die Ebenen vor dem Jahr 2000 nummeriert und später wurden sie mit Ebenennamen versehen. Die Planer neigen dazu, insbesondere wenn sie in Eile sind, keine CAD-Standards zu verwenden. Wir sind auf Situationen gestoßen, in denen Zellen auf ihre Basiselemente wie Linien, Kreise, Feldtext usw. reduziert werden, oder sie werden gruppiert und wir verlieren die Zuordnung, die wir gerne beibehalten würden.“
Es kann zu Diskrepanzen mit beauftragten Entwurfs- und Planungsfirmen, finanzierten Projekten, die andere Standards erfordern, und sich entwickelnden konventionellen Erkenntnissen bei Schemata zur Benennung von Ebenen/Zellen kommen. So haben beispielsweise einige Ingenieurbüros die Standards erweitert, um zwischen reinen Entwurfsmerkmalen und Merkmalen im Ist-Zustand (oder Zeichnungsunterlagen) zu unterscheiden. „Wenn wir also CAD-Standards verbessern wollen, müssen wir eine Methode entwickeln, um von dem, was vor Jahren existierte, zu dem, was heute existiert, zu dem, was wir in der Zukunft wollen, überzugehen“, sagte Stefanchuk. „Das passiert in so ziemlich jeder Organisation – einige haben ihre Standards besser im Griff als andere. Sicherlich sehen wir zum Beispiel bei Kunden vom Verkehrsministerium von Projekt zu Projekt Anomalien, Menschen, die sich auflösen oder Zellen, die auseinandergezogen werden.“
Dark Data
„Bei Diskussionen über die CAD-GIS-Migration wird oft die Frage aufgeworfen, warum man mit Altdaten arbeiten sollte“, sagte Mary A. Ramsey, Gründungspartnerin und CEO von Phocaz Inc.
„Unser Gedanke und der unserer Kunden ist, dass jeder, der über Altdaten verfügt, erheblich, ja sogar Millionen von Dollar, in die Beschaffung dieser Daten investiert hat.“ Die jahrzehntelange Erstellung von CAD-Datensätzen kann eine enorme Investition sein; es ist sinnvoll, zumindest zu versuchen, so viel wie möglich aus diesen Datensätzen herauszuholen.
„Im Fall der Verkehrsministerien (DOTs) sind das Steuergelder, die dafür aufgewendet wurden. Es wurde eine erhebliche Investition in diese digitalen Anlagen getätigt, und jetzt muss mehr Nutzen daraus gezogen werden. Beginnen Sie also unbedingt mit der Analyse der Daten, die dort vorhanden sind. Was nicht automatisch extrahiert werden kann, z. B. anhand der Ebene und des Zellnamens, das sind ‚Dark Data‘. Und trotzdem ist es die Zeichnung, als Geometrie – stellen Sie sich den Wert vor, der darin steckt, wenn er vollständig extrahiert werden könnte.“ Dark Data in der Infrastruktur ist ein hochaktuelles Thema. Im Kontext der Infrastruktur beziehen sich Dark Data auf ansonsten wertvolle Daten, die aufgrund sich entwickelnder Datenkonventionen, mangelnder Einhaltung von Standards, übermäßiger Abhängigkeit von institutionellem Wissen und schlechtem Datenmanagement nicht ohne Weiteres zugänglich sind. KI ermöglicht neue Wege, diese Daten zu extrahieren. Und genau diesen Ansatz verfolgte Phocaz, um Dark Data aus dem CAD-Archiv von Kunden aus dem Verkehrswesen zu gewinnen.
Eine andere Frage ist: „Warum nicht mobile Kartierung und Drohnen?“ Die mobile Kartierung und Datenerfassung mit Drohnen haben sich in den letzten Jahren hervorragend entwickelt. Es wurden Fortschritte bei Präzision, Positionsgenauigkeit, Automatisierung der Merkmalserkennung und Vereinfachung des Betriebs vor Ort erzielt. Die Realität sieht jedoch so aus, dass die Erfassung von Zehntausenden von Kilometern von Autobahnkorridoren viele Millionen kosten würde, und selbst dann könnten diese Technologien nicht jedes Merkmal erfassen. Die versunkenen Kosten jahrzehntelanger CAD-Entwürfe und Zeichnungen in den Datensätzen sind eine potenziell kosteneffiziente Ressource, die es zu erschließen gilt, um ein Unternehmens-GIS (das sich zu digitalen Zwillingen entwickelt) erheblich aufzufüllen/auszubauen.
Steigerung der Produktivität
„Wir haben Phocaz gegründet, um Softwareentwicklungsdienste vor allem für den Bereich des computerunterstützten Entwerfens anzubieten“, so Ramsey. „Insbesondere für Anwender im Bereich Bauingenieurwesen – Civil 3D, Bentley MicroStation und OpenRoads (damals wäre es natürlich InRoads gewesen) usw. Wir haben im Wesentlichen Add-ins für unsere Kunden entwickelt und gewartet, die auf diesen Plattformen und grundlegenden Produkten laufen. Wir erledigen diese Art von Arbeit auch heute noch, eine Menge Arbeit für DOTs in diesem Bereich und auch für andere Infrastrukturkunden.“
Phocaz stellte seine Lösung für die Umwandlung von CAD zu GIS vor, als das Verkehrsministerium von Georgia (GDOT), ein langjähriger Kunde, mit dieser Anfrage an sie herantrat: Ist es möglich, Daten aus einer CAD-Datei zu sammeln, die Extraktion zu automatisieren und sie in unser Unternehmens-GIS zu übertragen? Dies war die Geburtsstunde von CLIP, dem „CAD Level Integration Process“ (Integrationsprozess auf CAD-Ebene), wie das GDOT es nannte. Phocaz identifizierte zunächst vorhandene Werkzeuge, teilweise sogar innerhalb der CAD-Umgebung, die für diesen Zweck entwickelt wurden. „Wir stellten ziemlich schnell fest, dass diese Prozesse etwas langsam waren und angesichts der enormen Größe des CAD-Archivs, das das Verkehrsministerium auswerten wollte, nicht praktikabel gewesen wären. Ganz zu schweigen von der Verwaltung der Produktion und der riesigen Datenmenge, die bei einem solchen Unterfangen anfallen würde.“
Die Lösung musste skalierbar sein, um die Anforderungen des GDOT und anderen großen Infrastrukturkunden zu erfüllen. „Das GDOT verwaltet zum Beispiel 80.000 Meilen an Fahrspuren und bundesstaatliche Hilfsrouten“, so Stefanchuk. „Das entspricht etwa einem Drittel der Schnellstraßen im Bundesstaat – es sind wahrscheinlich eher 250.000 Meilen an Fahrbahnen im Bundesstaat.“ Georgia ist nicht der einzige Bundesstaat, der vor der Chance (und Herausforderung) steht, so viele Kilometer an Autobahn-CAD-Dateien zu extrahieren – ein Blick auf die Gesamtzahl der Fahrbahnkilometer für jeden der 50 US-Bundesstaaten genügt für diese Erkenntnis. Phocaz begann mit der Entwicklung von KI-gestützten Algorithmen, wählte den Ansatz eines digitalen Zwillings und nutzte ProjectWise von Bentley Systems für die Produktion und das Datenmanagement.
Das virtuelle Roboterauto
Zunächst bestand der Plan darin, die CAD-Zeichnungen einfach nach den am leichtesten zu findenden Merkmalen zu durchsuchen, die anhand von Ebenen- und Zellnamen erkennbar sind. Es stellte sich jedoch heraus, dass es besser war, einfach einmal „die digitalen Fahrspuren zu befahren“ und Merkmale umfassend zu extrahieren.
Das Konzept bestand darin, die künstliche Intelligenz die Zeichnung prüfen zu lassen, wobei sie sich entlang der Fahrspuren bewegt und dabei Merkmale erfasst. Das ist fast so, als würde man jede Strecke mit einem Fahrzeug befahren, das mit einem mobilen Kartierungssystem mit LiDAR/Imaging ausgestattet ist (allerdings zu einem Bruchteil der Kosten). Doch bevor das KI-Auto seine Fahrten antreten kann, muss eine konsistente räumliche Umgebung vorhanden sein. Glücklicherweise, so Stefanchuk, bestand der Entwurfsansatz im CAD darin, mit einem Modell zu arbeiten, die Referenzen heranzuziehen und daraus Blätter zu schneiden. In fast allen Fällen ist die Zeichnung also „fahrbereit“. Im Fall der Kunden vom Verkehrsministerium, die in einer DGN-Umgebung (MicroStation) arbeiten, erwies sich ProjectWise von Bentley als besonders gut geeignet für die Verwaltung der Zeichnungen, des Extraktionsfortschritts und der resultierenden Daten.
Zukünftige Anwendungen
Wenn wir also CAD-Standards verbessern wollen, müssen wir eine Methode entwickeln, um von dem, was vor Jahren existierte, zu dem, was heute existiert, zu dem, was wir in der Zukunft wollen, überzugehen.
– Mark Stefanchuk
ProjectWise ist eine Projektmanagement-Suite von Bentley Systems, die als Drehscheibe für Daten über mehrere Fachbereiche und Formate hinweg sowie für den gesamten Projektlebenszyklus dienen kann und die Arbeit in einer Umgebung für digitale Zwillinge ermöglicht. Da viele der Kunden von Phocaz aus dem Verkehrssektor hauptsächlich in einer Bentley-Umgebung arbeiten (z. B. DGN und MicroStation sowie verwandte Entwurfssoftwarepakete), war es sinnvoll, CLIP-Projekte in dieser Suite zu verwalten.
„Das CLIP-Auto oder Roboterauto, wie wir es genannt haben, ist für uns in Wirklichkeit ein Werkzeug zur Visualisierung in Sitzungen, um zu verstehen, was mit unseren Algorithmen passiert.“ sagte Stefanchuk. „Der Endnutzer wird das nie sehen.“ Allerdings muss ich sagen, dass es Spaß gemacht hat, das Roboterauto in einer Demonstration zu sehen. „Was sie letztendlich wollen, sind die Mittelliniengrafiken der Merkmale innerhalb der GIS-Umgebung und die ihnen zugewiesenen Eigenschaften.“
Um herauszufinden, wie diese Merkmale an einem bestimmten Punkt entlang der Autobahn aussehen, hat Phocaz ein Tool entwickelt, das diese Merkmale suchen und finden kann. Die KI wird auf die verschiedenen räumlichen Aspekte von Merkmalen trainiert wie Markierungen für Radwege (die sogar von Bezirk zu Bezirk sehr unterschiedlich sein können), und wendet andere Regeln an, z. B. den Abstand, der eingehalten werden muss, um die Standardbreiten der Fahrbahn abzudecken. „Wir mussten ein Konzept entwerfen und visualisieren, was die Algorithmen bewirken sollten“, so Stefanchuk. „Wir haben uns eine kurvenreiche Straße vorgestellt, die sich durch eine ländliche Gegend schlängelt, wie wir sie in der realen Welt befahren würden und was wir durch die Front- und Seitenfenster sehen könnten. Dann haben wir überlegt, wie wir der KI beibringen können, auf den gebündelten CAD-Fahrbahnen zu ‚reisen' und anhand dessen zu lernen, was sie wahrscheinlich sehen würde.“
„Es gibt einige Bereiche, in denen das CLIP-/Roboterauto tatsächlich Vorteile bietet“, so Stefanchuk. „Einer davon ist, dass wir nicht alle Daten auf einmal sammeln müssen; wir müssen nur das sammeln, was wir in diesem Moment sehen, Entscheidungen darüber treffen, es so lange aufbewahren, bis wir bereit sind, einen Bericht zu verfassen, und dann die Autobahn weiter abfahren. Wenn wir auf etwas wie eine Fahrbahnmarkierung stoßen, können wir mithilfe einiger visueller KI-Modelle herausfinden, was diese Fahrbahnmarkierung bedeutet.“
„Was wir vom CLIP-Projekt gelernt haben, war, dass wir mit einem Symbol beginnen können, z. B. einem Rechtsabbiegepfeil oder einem Linksabbiegepfeil, und einer KI beibringen können, dies zu erkennen“, so Stefanchuk. „Aber wir können auch andere Entscheidungen treffen, basierend auf dem, was wir daraus ableiten können, beispielsweise auf welcher Art von Fahrspur ich mich befinde. Fahren wir auf einer Rechtsabbiegespur, einer Durchgangsspur, einer Linksabbiegespur, einer U-Turn-Spur und so weiter.“
Phocaz hat sich nicht nur auf Fahrbahnmarkierungen konzentriert. Mit dem gleichen Ansatz wie bei den Fahrbahnmarkierungen kann das Unternehmen ein maschinelles Lernmodell für jede Zelle in einer beliebigen Zellbibliothek erstellen. „Unser KI-Gehirn ist ein maschinelles Lernmodell (MLM)“, so Stefanchuk. „Unsere Software, eine separate Anwendung von CLIP (namens Phorz AI), führt den Benutzer durch die Erstellung seines eigenen MLM, indem sie mit einer oder mehreren Zellen (Symbolen) wie einem Abbiegepfeil, einem Radweg, einer Zufahrt, einem Durchlass, usw. beginnt. Das vom Benutzer erstellte MLM kann dann angewendet werden, um diese Objekte in einem beliebigen Modell für einen iTwin (digitalen Zwilling) zu erkennen. Die Idee war, dass wir es jedem so einfach wie möglich machen sollten, ein MLM zu erstellen, das Merkmale in einem CAD-Projekt erkennen kann. Im Fall von CLIP für das GDOT gibt es ein MLM, das wir trainiert haben, sodass sie diesen Schritt nicht durchführen müssen.“ Für andere Kundenprojekte wird ein Mastermodell erstellt, aber es steht jedem Benutzer offen, die KI zu erweitern und zu trainieren, da Zellen und Symbole von Stadt zu Stadt, von Bezirk zu Bezirk usw. variieren können.
Phocaz wurde kürzlich als Finalist in der Kategorie Enterprise Engineering bei der jährlichen Veranstaltung Year in Infrastructure und Going Digital Awards gewürdigt, die vom 11. bis 12. Oktober 2023 in Singapur stattfand. Auf dieser Veranstaltung demonstrierte Julien Moutte, Chief Technology Officer von Bentley Systems, in seiner Keynote-Ansprache, wie CLIP Linksabbiegepfeile aus CAD-Zeichnungen für Autobahnen extrahiert. „GDOT hat immer geglaubt, dass seine CAD-Zeichnungen eine ergiebige Quelle für Bestandsdaten sein könnten“, sagte Moutte. „Der Zugriff auf diese Daten erforderte jedoch das manuelle Sammeln von Entwürfen und Zeichnungen – Tausende von ihnen – und die anschließende visuelle Inspektion jeder Anlage, was unzählige Stunden an Arbeit in Anspruch nehmen würde. Um Licht in die Dark Data zu bringen, nutzte Phocaz ProjectWise, powered by iTwin, zur Erstellung von digitalen Zwillingen, die mithilfe von KI mit Merkmalserkennung und räumlicher Referenzierung effizienter analysiert werden können. Phocaz ging sogar noch weiter und nutzte eine neuartige KI-Technik, um Lücken zwischen den Modellen zu schließen. Es wurde ein KI-Agent entwickelt, der virtuell über die Fahrspuren des digitalen Zwillings fahren und die Mittellinien erkennen kann. Dank der KI-Automatisierung ist der Prozess der Datenextraktion für die Kunden nicht mehr zeit- oder kostenaufwendig.
Zukünftige Anwendungen
„CLIP ist ein einzigartiger Arbeitsablauf, den wir entwickelt haben, um dieses Problem für unsere Kunden im Verkehrsbereich zu lösen“, so Ramsey. „Wir sind in der Lage, mit dem Kontext der jeweiligen Anforderung zu beginnen, mit der wir arbeiten – Straßen. Deshalb können wir sie nicht unbedingt ohne Weiteres beispielsweise auf die Architektur anwenden. Sobald wir jedoch den Kontext verstanden haben, können wir darüber nachdenken, wie wir Daten aus solchen Entwürfen sammeln.“
Auf welche Anwendungen für Infrastrukturen könnte dieser Ansatz übertragen werden? Da fällt einem natürlich sofort die Versorgungswirtschaft ein. Es gibt Übertragungs- und Verteilungsnetze und im Falle von Telefon- und Kommunikationsnetzen gibt es regelbasierte Verbindungselemente, die dazu beitragen könnten, die Analyse sowohl von linearen Merkmalen als auch von Anlagentypen weiter zu verfeinern. Bei unterirdischen Versorgungsleitungen könnte die Automatisierung der Extraktion von CAD-Merkmalen von unschätzbarem Wert sein, wenn man bedenkt, wie unpraktisch es ist, alle Merkmale physisch zu lokalisieren. Es steht nicht außer Frage, dass mit dieser Art von Lösung gewisse Erfolge bei der Extraktion von Merkmalen aus gescannten technischen Zeichnungen erzielt werden können. Allerdings gibt es Herausforderungen in Bezug auf die räumliche Referenz (Maßstab und Positionsbestimmung) sowie die Qualität/Vollständigkeit der Konvertierung von Raster- in Vektordaten (obwohl es auch hier große Fortschritte durch den Einsatz von KI gegeben hat).
Während für Kommunen, Versorgungsunternehmen und Campusstandorte die Erstellung digitaler Zwillinge angestrebt wird, stehen die Kosten für eine vollständige physische Datenerfassung und Bestandsaufnahmen einer breiteren Einführung im Wege. Die wenigsten Objekte wurden jedoch ohne jegliche Art von Entwurfszeichnungen gebaut, und zumindest für die Objekte der letzten vier Jahrzehnte gibt es wahrscheinlich CAD-Zeichnungen, die auf diese Weise ausgewertet werden könnten. In den Millionen von CAD-Dateien, die es gibt, schlummert ein riesiger Schatz an Dark Data. Es ist an der Zeit, sie besser zu nutzen.