Freies Wissen für alle: Wikipedia bekommt neue Datenbasis
Stand: 30.03.2012
Bildquelle: ©Adobe Stock / Text: dpa
Berlin - Das Wissen der Welt frei zugänglich für alle: Das soll nach den Vorstellungen der Wikipedia-Macher die sogenannte Wikidata ermöglichen. Die offene Datenbank ist eine maschinenlesbare Datenquelle für Informationen aller Art. Jeder einzelne kann mitmachen und selbst Daten eingeben oder die Ergebnisse für eigene Internet-Projekte nutzen.
Wikidata soll eine freie Wissensdatenbank werden, deren Informationen direkt einsehbar, aber auch maschinenlesbar sind. Wikipedia-Artikel enthalten dann Daten wie die Bevölkerungsgröße einer Stadt künftig nicht mehr als Text, sondern als Verweis zur entsprechenden Stelle der Datenbank. Die Informationen werden dann nicht mehr in den einzelnen Artikeln des Lexikons aktualisiert, sondern zentral bei Wikidata.
Zentrale Verwaltung der Daten
"Bisher mussten Zahlen wie die Einwohnerzahl von Berlin regelmäßig angepasst werden", sagte Pavel Richter, Vorstand von Wikimedia Deutschland, der Nachrichtenagentur dpa. In Zukunft werde diese Information für alle 280 Sprachausgaben der Wikipedia zentral gewartet. Damit falle auch eine mögliche Fehlerquelle weg.
Die Wikidata-Inhalte stehen unter einer Creative-Commons-Lizenz - dieses Gegenmodell zum klassischen Copyright wurde speziell für die freie Verwendung im Internet entwickelt. Auch private Webseiten wie Blogs können somit die Wikidata-Inhalte einbinden. Wikidata werde es auch der Forschung ermöglichen, "ständig wachsende und komplexe wissenschaftliche Datenmengen zu verwalten und daraus wertvolle Schlüsse zu ziehen", erklärte Chris Mentzel vom wissenschaftlichen Programm der Gordon and Betty Moore Foundation, die sich an der Spendenfinanzierung des Wikidata-Projekts beteiligt.
Komplizierte Abfragen werden möglich
Um die Entwicklung der Datenbank kümmert sich ab Montag ein Team von zwölf internationalen Software-Experten, die dazu für ein Jahr nach Berlin kommen. Wikidata soll in mehreren Phasen nach und nach freigeschaltet werden. Im Endausbau sollen auch strukturierte Abfragen möglich sein: Dann zeigt Wikidata etwa die zehn größten Städte der Welt an, die eine Frau als Bürgermeisterin haben, die nach 1960 geboren wurde.
"Wie alle Inhalte von Wikipedia wird auch Wikidata frei zugänglich sein", sagte Richter. "Alles wird transparent und nachvollziehbar sein." So könne jeder verfügbare Daten eingeben, die dann der üblichen Qualitätskontrolle von Wikipedia unterworfen seien. Bei strittigen Angaben, etwa zur Frage der Arbeitslosenstatistik, sei es dann die editorische Aufgabe der ehrenamtlichen Wikipedianer zu entscheiden, welche Zahl aus Wikidata verwendet werde.
Der Projektleiter von Wikidata, Denny Vrandecic, erklärte, für die Datenbank werde voraussichtlich die Open-Source-Technik MySQL genutzt. Um komplexere Abfragen zu ermöglichen, sollen aber auch andere Techniken geprüft werden. Als Datenformat werden JSON (JavaScript Object Notation) oder Formate der Metadaten-Technik RDF (Resource Description Framework) verwendet.