Dies ist eine Beta-Version der Leitlinien. Sie tritt erst mit der neuen Metadatenverwaltung v2, die für Sommer/Herbst 2025 geplant ist, in Kraft.
1 Dienste 🔗
Die Fach- und Koordinationsstelle OGD im Statistischen Amt bietet folgende Dienste für den Zugang und die Verwaltung von Behördendaten des Kantons Zürich.
Datenkatalog: Öffentlicher Katalog für Behördendaten 👉 https://zh.ch/daten
Metadatenverwaltung: Der für die Öffentlichkeit nicht sichtbare Teil des Datenkatalogs für die Verwaltung der Daten und Metadaten 👉 https://www.web.statistik.zh.ch/ogd/datenkatalog-verwaltung/app
2 Grundlagen 📌
2.1 Sinn und Zweck
Der Regierungsrat des Kantons Zürich hat mit dem Regierungsratsbeschluss 1362/2021 beschlossen, dass
“der Kanton alle vorhandenen nicht schützenswerten Daten der Öffentlichkeit maschinenlesbar zur freien Nutzung zur Verfügung [stellt]”.
Damit die interessiete Öffentlichkeit alle offen verfügbaren Behördendaten einfach findet, werden deren Metadaten laufend aktualisiert im kantonalen Metadatenkatalog der offenen Behördendaten und im nationalen Portal für offene Behördendaten veröffentlicht.
Die Metadaten-Verwaltung ermöglicht es den Verwaltungseinheiten und Organen (auch Gemeinden) des Kantons Zürich, die Metadaten ihrer offenen Datensätze weitgehend selbständig zu erfassen und zu aktualisieren sowie die entsprechenden Daten-Ressourcen bereitzustellen.
2.2 Definition
Offene Behördendaten (‘Open Government Data’, OGD) sind gemäss Definition der Fachstelle OGD Kanton Basel-Stadt
“Daten (Rohdaten, Datensätze, Datenbestände, Datensammlungen, Digital Content, Statistikdaten, Geodaten, Inventare …), die strukturiert und maschinenlesbar bereitgestellt werden, so dass sie gesichtet, durchsucht, gefiltert, aufbereitet, nachgeführt und weiterverarbeitet werden können”.
Verwaltungseinheiten und Organe des Kantons Zürich dürfen auf der Grundlage des Gesetzes über die Information und den Datenschutz (IDG) dürfen Verwaltungseinheiten und Organe des Kantons Zürich ‘nicht schützenswerte’ Daten, die unter ihrer Hoheit stehen, zur ‘freien Nutzung’ als offene Behördendaten publizieren.
‘Nicht schützenswert’ bedeutet, dass die bereitgestellten Daten
- nicht die Privatsphäre verletzen,
- nicht sicherheitskritisch sind und
- keinen Drittrechten (wie zum Beispiel Copyrights) unterliegen.
‘Freie Nutzung’ bedeutet, dass alle Interessierten die Daten
- vervielfältigen, verbreiten und weiter zugänglich machen,
- anreichern und bearbeiten,
- kommerziell nutzen dürfen.
Dementsprechend stellt der Kanton Zürich offene Behördendaten unter zwei offenen Nutzungsbedingungen bzw. Lizenzen zur Verfügung.
3 Rollen 👥
Im Publikationsprozess für Open Government Data (OGD) im Kanton Zürich gibt es verschiedene Rollen mit spezifischen Rechten und Aufgaben.
Data Custodian
Erhebt und bereinigt Daten für eine Verwaltungseinheit oder Organisation.
Guest
Kann die Metadateneinträge der eigenen Organisation einsehen, jedoch keine Änderungen vornehmen.
Data Steward
Erfasst, ändert und aktualisiert Datensätze sowie Distributionen der eigenen Organisation.
Stellt sicher, dass die Metadaten vollständig und aktuell sind.
Data Guide
Unterstützt Data Stewards und Guests bei Fragen zum Publikationsprozess und erstellt deren Accounts.
Publiziert Datensätze erstmalig und verwaltet Normwortschätze sowie Organisationsangaben.
4 Leitlinien für Daten 📂
Im Publikationsprozess für Open Government Data (OGD) im Kanton Zürich gibt es klare Leitlinien für Datenformate und -strukturen. Diese gewährleisten eine konsistente und maschinenlesbare Veröffentlichung von Daten.
4.1 Datenformate
Tabellarische Daten:
Verwenden das CSV-Format (nicht XLS) mit UTF-8-Codierung. Spalten werden mit Kommas (,) getrennt, nicht mit Semikolons (;). Sie folgen dem Tidy Data-Prinzip.
Strukturierte Daten: JSON ist besonders gut für komplexe Datenstrukturen geeignet, XML ist ebenfalls möglich.
Falls eine Konvertierung von Excel nach CSV nötig ist, hilft diese Anleitung 👉 XLS zu CSV konvertieren
- Pro Variable eine Spalte
- Pro Beobachtung eine Zeile
- Pro Wert eine Zelle
Mehr dazu 👉 Warum ‘Tidy Data’?
4.2 Tidy Data: Pro Variable eine Spalte
Keine Spalten-Hierarchien:
Ober- und Unterkategorien werden nicht durch zusammengeführte Zellen dargestellt, sondern jeweils in separaten Spalten.
Anforderungen an Spaltenüberschriften (Variablen):
- Keine alleinstehenden Jahreszahlen oder Datumsangaben
- Kein Beginn mit einer Zahl
- Keine Leerzeichen (stattdessenunterstriche_verwenden
)
- Keine Umlaute (ä
→ae
,ü
→ue
)
- Keine Sonderzeichen (%
→prozent
)
Beispiel für eine korrekte CSV-Datei:
jahr,organisationseinheit,gesuche_haengig_jan,gesuche_total,zugang_uneingeschraenkt_gewaehrt
2013,Direktion der Justiz und des Innern,1,52,45 2014,Direktion der Justiz und des Innern,11,31,19
Für eine bessere Interoperabilität und Nutzung der Daten empfehlen wir, oft wiederkehrende Variablen standardisiert zu benennen.
Mehr dazu 👉 Empfehlung für wiederkehrende Merkmale
4.3 Tidy Data: Pro Beobachtung eine Zeile
Keine Leerzeilen:
Jede Zeile enthält eine vollständige Beobachtung und darf nicht leer bleiben.
Keine Fussnoten oder Verweise innerhalb der Tabelle:
Hinweise werden stattdessen folgendermassen vermittelt:
- In einer eigenen Spalte, falls die Information datenbezogen ist.
- In der Metadaten-Beschreibung, falls es sich um eine kurze Erläuterung handelt.
- Als separate Distribution (HTML-, TXT- oder PDF-Datei), falls die Erklärung ausführlicher ist.
4.4 Tidy Data: Pro Wert eine Zelle
Alle Zellen innerhalb einer Spalte haben dasselbe Datenformat. Einheitsangaben dürfen nicht mit Werten in derselben Zelle stehen. Die häufigsten Daten-Formate sind:
Text
Enthält ein Wert Kommas, wird dieser in Anführungszeichen gesetzt. Dadurch bleibt der Text-Inhalt als eine Einheit interpretiert. Beispiel:"Französisch, Deutsch"
Zahl
Zahlen werden ohne Hochkommas, Leerzeichen oder 1000er-Trennzeichen gespeichert.
Als Dezimaltrennzeichen wird ein Punkt (.
) verwendet.
Falls Werte gerundet werden, muss dies in den Metadaten deklariert werden.
Datum
Das ISO 8601-Format wird für Datumsangaben verwendet.
Beispiel:YYYY-MM-DD
→2021-12-24
Uhrzeit
Das ISO 8601-Format wird auch für Zeitangaben verwendet.
Beispiel:hh:mm:ss
→19:20:30
Falls eine Zeitzone benötigt wird, folgt das Format:
Beispiel:YYYY-MM-DDThh:mm:ssTZD
→2021-12-24T19:20:30+01:00
URL
URLs werden standardmässig in vollständiger, aufrufbarer Form angegeben.
Beispiel:https://example.com
Geokoordinaten
Geokoordinaten werden bevorzugt im globalen geodätischen Referenzsystem WGS 84 angegeben. Beispiel:latitude_WGS84,longitude_WGS84
47.3786314,8.54110776
Alternativ kann der Bezugsrahmen LV95 (CH1903+) verwendet werden. Beispiel:
north_coordinate_lv95,east_coordinate_lv95
1248117.48,2683256.46
Werte, die ausdrücklich unbekannt sind, werden als NA
gekennzeichnet. Zellen ohne Werte bleiben leer.
5 Leitlinien für Metadaten 🏷️
5.1 Grundlagen
Metadaten sind Daten zu Daten und essenziell, um Datensätze auffindbar, verständlich und sinnvoll nutzbar zu machen. Sie liefern strukturierte Informationen über den Inhalt, die Struktur und den Kontext eines Datensatzes. Der Kanton Zürich orientiert sich für die Beschreibung von Open Government Data an den DCAT-AP CH-Standard, ergänzt durch zusätzlich spezifische Erweiterungen für den Kanton Zürich.
Gewisse Attribute sind für eine konsistente und standardisierte Erfassung zwingend auszufüllen. Diese sind im Handbuch als (🔴 Pflichtfeld) markiert. Die anderen Attribute sind erwünscht.
5.2 Metadaten-Handbuch
Attribut | Beschreibung |
---|---|
Titel 🔴 | Der Titel des Datensatzes sollte präzise und aussagekräftig sein, um eine einfache Auffindbarkeit zu gewährleisten. Er kann Buchstaben, Zahlen, Sonderzeichen und ein Datum enthalten. Maximal 160 Zeichen. |
Beschreibung 🔴 | Präzise Zusammenfassung des Datensatzes mit relevanten Suchbegriffen. Maximal 4000 Zeichen. Umbrüche sind erlaubt und werden angezeigt. |
Publisher 🔴 | Die Organisation, die für die Verwaltung und Bereitstellung des Datensatzes zuständig ist. |
Kontaktstelle 🔴 | Eine regelmässig genutzte E-Mail-Adresse für Anfragen zum Datensatz. Es können mehrere Kontaktstellen angegeben werden, solange sie zur Organisation gehören, die als Publisher des Datensatzes eingetragen ist. |
Periodizität 🔴 | Gibt an, wie oft der Datensatz aktualisiert wird. Das Intervall muss aus einer normierten Liste ausgewählt werden. |
Rechtsgrundlage 🔴 | Verweis auf die rechtliche Grundlage für die Datenhaltung in Form einer URL. Dazu zählen Regierungsratsbeschlüsse, Gesetze, Erlasse oder Verordnungen |
Startdatum 🔴 | Beginn der Zeitspanne, die der Datensatz abdeckt. Muss im Format YYYY-MM-DD angegeben werden (z. B. 2024-12-19 ). |
Vertraulichkeit 🔴 | Gibt den Vertraulichkeitsgrad (Öffentlich, Intern, Vertraulich) der Distribution gemäss der Klassifikationsstufe des Kantons Zürich an. |
Datenkollektion | Eine Datenkollektion umfasst mehrere thematisch zusammenhängende Datensätze und dient als Filter für entsprechende ZHweb-Seiten. Die Auswahl erfolgt aus einem normierten Vokabular. |
Dokumentation | Link zu einer Seite oder einem Dokument mit weiterführenden Informationen zum Datensatz. |
Enddatum | Gibt das Ende der Zeitspanne an, die der Datensatz abdeckt, falls bekannt. Muss im Format YYYY-MM-DD angegeben werden (z. B. 2025-03-01 ). |
Anwendungen | Links zu Anwendungen oder Praxisbeispielen, die die Nutzung des Datensatzes veranschaulichen. |
Interne Notiz | Freitextfeld für interne Kommentare, sichtbar nur für Personen derselben Organisation sowie für Super User und Data Guides. |
Konform mit | Verlinkt den angewandten Datenstandard, das Modell, das Schema, die Ontologie oder eine ähnliche Spezifikation. Ergänzt in der Regel Angaben zum Medientyp oder Format. |
Landing Page | Verweist auf die Webseite der Organisation, die den Zugriff auf die Originaldaten ermöglicht. |
Nächste Aktualisierung | Datum der geplanten nächsten Aktualisierung des Datensatzes. Muss im Format YYYY-MM-DD angegeben werden (z. B. 2024-12-21 ). |
Verwandte Datensätze | Verlinkt verwandte Datensätze und beschreibt ihre Beziehung. |
Räumliche Abdeckung | Beschreibt mit einem kontrollierten Vokabular, welche geografischen Gebiete die betreffenden Daten abdecken: Kanton Zürich (falls die Daten für den gesamten Kanton aggregiert sind), Gemeinden des Kantons Zürich (falls alle Gemeinden des Kantons einzeln erfasst sind) oder eine oder mehrere spezifische Gemeinden. |
Schlagwörter | Ein oder mehrere Schlagwörter aus einer vorgegebenen Liste zur Beschreibung des Datensatzes. |
Themen | Eine oder mehrere Thematiken aus einer vorgegebenen Liste, denen der Datensatz zugeordnet ist. Diese dienen als Grundlage für Filtermöglichkeiten. |
Version | Gibt den Entwicklungsstand des Datensatzes an und besteht aus maximal drei Ebenen: Major (grundlegende Änderungen), Minor (Erweiterungen) und Patch (kleinere Korrekturen oder Fehlerbehebungen). Die Versionsnummer darf nur Zahlen und Punkte enthalten und folgende Formate haben: X (z. B. 2), X.X (z. B. 2.1) oder X.X.X (z. B. 2.11.8). |
Versionshinweis | Enthält Hinweise und zusätzliche Informationen zu Änderungen gegenüber der vorherigen Version. |
Attribut | Beschreibung |
---|---|
Titel 🔴 | Der Titel der Distribution sollte präzise und aussagekräftig sein, um eine einfache Auffindbarkeit zu gewährleisten. Er kann Buchstaben, Zahlen, Sonderzeichen und ein Datum enthalten. Maximal 160 Zeichen. Beinhaltet ein Datensatz nur eine Distribution, kann der gleiche Titel gewählt werden. |
Beschreibung 🔴 | Präzise Zusammenfassung der Distribution mit relevanten Suchbegriffen. Maximal 4000 Zeichen. Umbrüche sind erlaubt und werden angezeigt. |
Lizenz 🔴 | Gibt an, unter welcher Creative Commons Lizenz die Open Data bereitgestellt werden. Standardmässig gilt CC Zero (CC0), es sei denn, eine gesetzliche Grundlage verlangt eine andere Lizenz, welche nur von berechtigten Personen gesetzt werden kann. |
Personendaten-Status 🔴 | Gibt an, ob die Distribution keine Personendaten, Personendaten oder besonders schützenswerte Personendaten enthält. |
URL 🔴 | Die Internetadresse, über die die Distribution bezogen werden kann. Obligatorisch, falls es sich um Open Government Data (OGD) handelt. |
Vertraulichkeit 🔴 | Gibt den Vertraulichkeitsgrad (Öffentlich, Intern, Vertraulich) der Distribution gemäss der Klassifikationsstufe des Kantons Zürich an. Der Wert wird standardmässig von der Datensatzebene übernommen, kann jedoch für Distributionen weiter eingeschränkt, aber nicht gelockert werden. |
Dokumentation | Verlinkt die Dokumentation der Attribute dieser Distribution. |
Format | Gibt das Dateiformat der Distribution an. Wird beim Hochladen der Datei automatisch erkannt oder kann bei extern gehosteten Distributionen manuell eingetragen werden. |
Verfügbarkeit | Gibt an, ob die Daten dauerhaft stabil sind oder sich noch in einer experimentellen Phase befinden. |
Zeitliche Auflösung | Gibt die kleinste Zeiteinheit an, die in der Distribution enthalten ist. |
6 R-Package 💻
7 Neuigkeiten 🚀
Der erste Datenkatalog des Kantons Zürich wurde im Jahr 2019 veröffentlicht. Wesentliche Weiterentwicklungen und Änderungen ab 2025 werden hier dokumentiert.
Erklärung
Erklärung
8 Beratung und Unterstützung 💡
Bei Fragen zur Publikation von offenen Behördendaten steht neben den Data Guides auch die Fach- und Koordinationsstelle OGD im Statistischen Amt zur Verfügung.
Für generelle Fragen zu Daten und Auswertungen kann das Team Data vom Statistischen Amt kontaktiert werden.