MensaMining

Mensa Daten des Hamburger Studierendenwerks
2 Min Lesezeit CC BY-ND 4.0 open-source calendarbot haw-hamburg

Die HAW Hamburg hat als eine von vielen Hamburger Unis und Hochschulen eine Mensa des Studierendenwerks. Mein Kalenderbot enthält bereits seit Jahren den aktuellen Speiseplan und hat dafür die Webseite geparst. Diese Daten habe ich gesammelt und mal einen Blick darauf geworfen.

Hintergrundgeschichte

Durch den Mangel an brauchbar abonnierbaren Veranstaltungsplänen habe ich vor Jahren ein kleines Tool geschrieben, welches die Veranstaltungspläne parst und als ICS Datei auf einem Webhost bereitstellt. Im Laufe der Zeit wurde daraus ein Telegram Bot, den mittlerweile hunderte von Studierenden benutzen und benutzt haben.

Ein Feature dieses Telegram Bots wurde das Anzeigen der Gerichte in der Mensa. Um diese im Bot anzuzeigen, müssen diese Daten von dem Studierendenwerk geholt werden. Leider gibt es dafür keine offene API, daher habe ich ein Programm zum Web Scraping der Webseite geschrieben. Dieses Programm sammelt mir aktuell alle Mensen und Cafés des Studierendenwerk Hamburgs und läuft seit dem Wintersemester 2017.

Anfangs habe ich das Programm in C# entwickelt, habe es jedoch vor kurzem in TypeScript überführt. Den Quellcode findet ihr auf GitHub (mensa-crawler), die gesammelten Daten findet ihr ebenfalls auf GitHub (mensa-data).

Datenanalyse

Mit den Daten kann man einige Dinge betrachten. Beispielsweise enthalten die Daten Informationen über Dinge wie vegan, vegetarisch, mit Rindfleisch, Fisch, … oder auch Preise, Zusatzstoffe/Allergene.

Ich will hier allerdings nicht alles zeigen, was ich mir so angesehen habe. Die Daten sind verfügbar und ihr dürft selbst euren Ideen freien Lauf lassen.

Ein paar Inspirationen auf diesen Daten folgen unten, alle jeweils von der Mensa Berliner-Tor. Um noch mehr Ideen zu bekommen, was alles möglich ist, kann ich beispielsweise den BahnMining Talk vom 36c3 empfehlen.

Average meal price per week Pommes vs Twister

Auch mal einen Blick wert: Die Commits im Data Repo. Preisänderungen, Anpassungen von Zutaten, Allergene verschwinden oder kommen hinzu, …