Studierende des Bachelor Informatik vor Monitor mit Machine Diagram

News

Informatik-Bachelorarbeit mit Open Data Student Award 2021 ausgezeichnet

02.11.2021

Marco Crisafulli und Dominic Monzón entwickelten einen innovativen Lösungsansatz zur Abschätzung der Datenqualität in OpenStreetMap, dem grössten Crowdsourcing-Projekt von frei nutzbaren Kartendaten. Der Verein Opendata.ch verlieh den mit CHF 1'000 dotierten Preis Ende Oktober an der DINAcon 2021, der Open-Source-Konferenz für digitale Nachhaltigkeit.

Schlösser und Burgen in der Schweiz: OpenStreetMap bei myswitzerland.com
Schlösser und Burgen in der Schweiz: OpenStreetMap bei myswitzerland.com

Bild: Schlösser und Burgen in der Schweiz: OpenStreetMap bei myswitzerland.com

OpenStreetMap ist das grösste Crowdsourcing-Projekt im Bereich frei nutzbarer «Vektor-Geodaten». Das Prinzip ist einfach: Eine Karte, ähnlich wie Google Maps, verwaltet Strassen, Wege und weitere nützliche Informationen, wie zum Beispiel Shops in der Umgebung. Anders als bei Google Maps werden die Kartendaten von Freiwilligen laufend erweitert und verbessert – ohne die Nutzerinnen und Nutzer zu «tracken». Aus der Perspektive des Datenschutzes und der digitalen Selbststimmung ein enormer Vorteil.

Dadurch, dass sich Freiwillige beteiligen, stellt sich aber unweigerlich die Frage nach der Qualität, insbesondere wie vollständig die Abdeckung der Daten ist. «Dass die Datenqualität bei OpenStreetMap nicht bekannt sei, ist ein oft gehörter Kritikpunkt», sagt Prof. Stefan Keller, der die ausgezeichnete Bachelorarbeit betreute. «In ihrer Bachelorarbeit zeigten die OST-Studierenden Crisafulli und Monzón erstmals einen Ansatz, der die Vollständigkeit der Daten schätzt und visualisiert», so Keller. «Durch den Einsatz von modernem Software Engineering sowie Machine Learning realisierten sie einen Algorithmus, bei dem OpenStreetMap-Daten mit sich selber trainiert und klassiert werden. Damit können erstmals schweizweit Aussagen gemacht werden wie Diese Gegend ist wahrscheinlich komplett bzw. unvollständig mit Shops erfasst», erklärt der Informatik-Professor und Leiter des IFS Institut für Software an der OST.

Zukünftig «Goldene Datensätze» hinzuziehen

«Die Frage nach der Qualität von Daten wurde bisher durch Vergleiche mit sogenannten ‹goldenen› Datensätzen beantwortet», erklärt Keller. Goldene Daten sind «offizielle» Daten von hoher Qualität. «Das hat den Nachteil, dass es kaum solche gibt», erklärt Keller. Zukünftig müsse der in der Bachelorarbeit entwickelte Algorithmus dahingehend verbessert werden «dass Qualitätsangaben nicht nur für Shops sondern für weitere Kartenobjekte gemacht werden und dass auch weitere goldene Datensätze mitverwendet werden können, dort wo sie vorhanden sind», so Stefan Keller.

Die Resultate der Bachelorarbeit wurden als Open-Source und Open-Data zur Verfügung gestellt. Zudem wurde eine Demo-Web-Applikation zur Visualisierung der Datenqualität erstellt.

Zum Abstract der Bachelorarbeit

Der Award

Seit 2017 verleiht CH Open auf der DINAcon die gleichnamigen Awards. Bis dahin wurden die wichtigsten Auszeichnungen für freie Software in der Schweiz unter dem Namen «CH Open Source Awards» vergeben. Die DINAcon 2021 fand am 29. Oktober 2021 hybrid in Basel statt.