Skalierbare KI-Lösung zur automatisierten Metadatenanreicherung technischer Unterlagen des Baubestandswerks (MetaBBW)
Was wird ausgeschrieben
Vollständige Beschreibung anzeigen
Gegenstand der Ausschreibung ist die Konzeption, (Weiter-) Entwicklung und Bereitstellung einer KI-gestützten Verarbeitungslösung zur automatisierten Verarbeitung und Metadatenanreicherung von technischen Unterlagen (im Folgenden: KI-Pipeline) der WSV des Bundes sowie die Umsetzung der technischen Erschließung von technischen Unterlagen (TUs) Die Wasserstraßen-und Schifffahrtsverwaltung des Bundes (WSV) verfügt über einen umfangreichen Bestand technischer Unterlagen (TU), der bisher größtenteils unstrukturiert vorliegt und nur eingeschränkt in der Organisation nutzbar ist. Die TUs sind grundsätzlich in einem Dokumentenmanagementsystem DVtU (Digitale Verwaltung technischer Unterlagen) zu führen und dort mit Metadaten zu versehen. Die manuelle Metadatenvergabe führt jedoch dazu, dass bereits überführte Bestände häufig unvollständige oder inkonsistente Metadaten aufweisen, was die Auffindbarkeit erheblich einschränkt. Ein erheblicher Teil der Unterlagen ist bislang noch nicht in das System überführt worden, da die manuelle Erfassung mit hohem Aufwand verbunden ist. Die TU sind zudem inhaltlich und strukturell stark heterogen und umfassen unterschiedliche Bauwerksarten (z. B. Schleusen, Wehre, Brücken, Kanäle), Dokumenttypen (z. B. Konstruktionspläne, Gutachten), Formate (PDF, DGN, TIFF), Layouts (z. B. Tabellen, Fließtexte, gescannte Pläne), Umfänge (z. B. Anzahl der Seiten und Dateigröße) sowie unterschiedliche Qualitätsstufen der Digitalisierung. Diese Heterogenität erschwert eine einheitliche strukturierte Verarbeitung und Erschließung (d. h. Metadatenanreicherung) sowie die Auffindbarkeit der Dokumente erheblich und stellt eine wesentliche fachliche und organisatorische Herausforderung dar. In Verbindung mit dem überwiegend manuellen Metadatenprozess führt dies zu hohen operativen Aufwänden, Kapazitätsengpässen und einer eingeschränkten Wiederverwendbarkeit der Informationen. Vor diesem Hintergrund möchte der Auftraggeber in diesem Vergabeverfahren die Konzeption, (Weiter-)Entwicklung und Bereitstellung einer KI-gestützten Lösung zur automatisierten Metadatenanreicherung ausschreiben. Gegenstand der Ausschreibung: Beschreibung: Gegenstand der Ausschreibung ist die Konzeption, (Weiter-) Entwicklung und Bereitstellung einer KI-gestützten Verarbeitungslösung zur automatisierten Verarbeitung und Metadatenanreicherung von technischen Unterlagen (im Folgenden: KI-Pipeline) der WSV des Bundes sowie die Umsetzung der technischen Erschließung von technischen Unterlagen (TUs). Der Auftragnehmer konzipiert eine technische Lösung/KI-Pipeline zur KI-gestützten Verarbeitung einschließlich der erforderlichen Infrastruktur und muss für diese im Anschluss Bereitstellungs-, Betriebs-, Support-, und Wartungsleistungen sowie bei Bedarf Weiterentwicklungsleistungen erbringen. Die KI-Pipeline umfasst eine webbasierte Benutzeroberfläche für Endanwender. Über diese Benutzeroberfläche müssen dieErschließung der TUs sowie die Einsicht, Prüfung, Korrektur und Freigabe der erzeugten Ergebnisse und Metadaten möglich sein. Die KI-Pipeline muss für große Datenmengen skalierbar sein. Ein Teil der TUs ist bereits mit Metadaten versehen und in das Dokumentmanagementsystem der WSV (Digitale Verwaltung technischer Unterlagen, kurz DVtU) integriert, weist allerdings eine unzureichende oder fehlerhafte Metadatenqualität auf. Ein anderer Teil der TUs ist noch nicht im DVtU integriert und noch nicht mit Metadaten versehen. Deshalb muss die KI-Pipeline die folgenden zwei Anwendungsfälle unterstützen: a. Erschließung neuer TUs - Automatisierte Metadatenanreicherung (höhere Priorität) -mindestens 200.000, maximal 1.200.000 TUs (Leistungsteil A) Für TUs, die noch nicht in der DVtU vorhanden sind, müssen automatisiert Metadaten erzeugt werden. Die KlPipeline muss dabei insbesondere: - die Unterlagen automatisiert verarbeiten und mit Metadaten anreichern, - definierte Metadaten extrahieren und die Ergebnisse strukturiert ausgeben Forsetzung unter Ziffer 5.1.
Zeitplan
- 19. Juni 2026Bekanntmachung veröffentlichtAuf TED publiziert
- 20. Juli 2026EinreichungsfristElektronische Einreichung