Antworten (besonders zu Kampagnen) nach WikiData füttern?

Hat eigentlich schon mal irgendwer darüber nachgedacht, ob bzw. wie man die ganzen Informationen, die man mit dem IFG befreit auch irgendwie nachhaltig nutzbar machen kann?

Besonders bei Kampagnen werden ja oftmals große Datenmengen angefragt, ich hätte mir zum Beispiel vorstellen können, dass so was wie die Hygienekontrollen am Ende nach WikiData bzw. OpenStreetMap geworfen werden könnten, wo sie dann strukturiert weiter genutzt werden können.

3 „Gefällt mir“

Ich denke einer der Gründe warum sich Antworten auf Anfragen sehr leicht veröffentlichen lassen ist der, dass die Informationen weiterverwendet werden sollen/können/dürfen.

Ja, wenn wir mal beim Beispiel mit den Hygienekontrollen von Topf Secret bleiben dann bin ich mir nicht sicher, wer bzw. wie aus den nicht maschinenlesbaren Antworten der Lebensmittelkontrollbehörden die Daten extrahiert werden sollen. Die Daten die für uns, oder für die von dir genannten Projekte sinnvoll sind liegen teilweise versteckt in den PDFs oder in den E-Mails von den Behörden.

Das ist gefühlt eines dieser großen Probleme die mit der “Open-Data-Strategie” einhergehen. Die “offenen” Daten sind nicht sinnvoll weiternutzbar, so lange die sich nicht in einem standardisierten Format befinden welches maschinenlesbar ist.

Die Deutsche Umwelthilfe hat die Daten von der Kampagne “Klima-Gebäude-Check” gesammelt und ausgewertet, ich vermute das ist händisch passiert.

Wenn du Spaß daran hast und motiviert bist kannst du bestimmt gerne die Topf Secret Daten sammeln und in WikiData oder OSM einpflegen. :slight_smile:

2 „Gefällt mir“

Naja, semi-automatisch. Das ist mittels eines Formulars passiert, was du, wenn du da angefragt hast, auch selbst ausfüllen solltest/durftest/konntest.

Das ist ein Beispiel, wie man so etwas maschinenlesbar machen kann und das ist wohl die größte Hürde/Schwierigkeit.

2 „Gefällt mir“

Man beachte auch dass Wikimedia Deutschland Gebühren und co für IFG-Anfragen die für Wikipedia und co nüztlich sind, evt. erstattet. Wikidata zählt da explizit mit dazu:

Voraussetzung ist lediglich, dass die dabei gewonnenen Informationen den Wikimedia-Projekten zugute kommen. Dies bezieht sich in erster Linie auf Daten und Informationen zur Ergänzung entsprechender Wikipedia-Artikel oder Wikidata-Datenobjekte.

Deswegen am besten die Daten von Behörden auch gleich immer maschinenlesbar anfragen, als CSV oder ähnliches, wenn dies in dem Einzelfall möglich ist.
Das lässt sich dann sicher – je nach Daten – zu Wikidata transferieren o.ä.

Hallo zusammen,
ich würde mir mal ein Modell wünschen, nach dem katalogisiert bekommt. Ich denke vom Inhalt auszugehen ist ein erster Schritt. Aber darauf aufbauend bräuchte es ein Modell, dass dann die Basis für Suchen sein kann. Semantisch natürlich. Wenn das steht und durch den Menschen ein wenig gepflegt wird, kann es eine gute Trainingsbasis für ML sein.
LG