Es gibt in den letzten Jahren eine große Initiative in Richtung Open Data. Das bedeutet, dass der Wunsch besteht, Daten öffentlich bereitzustellen, sodass diese nicht nur von einem Unternehmen oder einer begrenzten Nutzerschicht ausgewertet werden können, sondern von jedem Bürger. Open Data verfolgt zwei Kernziele:
- Transparenz: Das veröffentlichen von öffentlichen Daten, wie Ergebnisse von Wahlen ermöglicht das überprüfen von Wahlergebnissen.
- Forschung: Der Zugriff auf Daten von sozialen Netzwerken ermöglicht es soziale Fragen zu beantworten und Forschung in dieser Richtung zu betreiben.
Dagegen gibt es wiederum Gegenbewegungen, die Open Data verhindern versuchen. Unternehmen verdienen beispielsweise Geld mit den Daten und ihre Geschäftsmodelle bauen darauf auf. Es ist also verständlich, dass kein Interesse von diesen besteht, diese Daten zu veröffentlichen.
Als Data-Scientist möchte ich meine Werkzeuge und Möglichkeiten nutzen, vorhandene öffentliche Datensätze auszuwerten und diese in meinem Blog bereit zu stellen. Wenn nicht ich als Data-Scientist das mache, wer soll es dann machen? Mein erstes Projekt hierbei wird sein, die Bevölkerungszahl in Mannheim und der einzelnen Stadtteile zu analysieren.