Diskussion:Interdisziplinäres Zentrum OpenStat
Aus Wikiversity
Ein paar erste Ideen zur Umsetzung des Projekts;
Inhaltsverzeichnis |
[Bearbeiten] Ungeklärte Copyright-Fragen
Welchen Status haben staatlich produzierte Statistiken. Können z.B. Statistiken von Ministerien mit Daten des Statistischen Bundesamtes kombiniert und zusammengeführt werden.
Aus der Richtung des deutschen Urheberrechtes ist man auf der sicheren Seite.
Urheberrecht
Teil 1, Abschnitt 2
§ 5 Amtliche Werke (1) Gesetze, Verordnungen, amtliche Erlasse und Bekanntmachungen sowie Entscheidungen und amtlich verfaßte Leitsätze zu Entscheidungen genießen keinen urheberrechtlichen Schutz. (2) Das gleiche gilt für andere amtliche Werke, die im amtlichen Interesse zur allgemeinen Kenntnisnahme veröffentlicht worden sind, mit der Einschränkung, daß die Bestimmungen über Änderungsverbot und Quellenangabe in § 62 Abs. 1 bis 3 und § 63 Abs. 1 und 2 entsprechend anzuwenden sind. (3) Das Urheberrecht an privaten Normwerken wird durch die Absätze 1 und 2 nicht berührt, wenn Gesetze, Verordnungen, Erlasse oder amtliche Bekanntmachungen auf sie verweisen, ohne ihren Wortlaut wiederzugeben. In diesem Fall ist der Urheber verpflichtet, jedem Verleger zu angemessenen Bedingungen ein Recht zur Vervielfältigung und Verbreitung einzuräumen. Ist ein Dritter Inhaber des ausschließlichen Rechts zur Vervielfältigung und Verbreitung, so ist dieser zur Einräumung des Nutzungsrechts nach Satz 2 verpflichtet.
Astroboi 19:21, 18. Sep. 2007 (CEST)
Es kommt aber auch darauf an, wo der Server von der Wikiversity steht. Falls er in den USA steht gilt das Digital Millennium Copyright Act.
-
- Interessant ich sammele alle rechtlichen Informationen auf der Seite en:Topic:Statistics:OpenStat/Research_projects/Copyright_and_the_legal_status_of_statistical_material
- Euro 00:33, 6. Okt. 2007 (CEST)
[Bearbeiten] Qualitätsmerkmale statistischer Meta-Datensätze
- Quellentransparenz. Grundlegend muss jeder einzelnen Zahl eines Meta-Datensatz ihre Quelle angefügt werden. Dies kann in Wikipedia über ein signifizierendes Kürzel analog Literaturangabenschlüsseln. bewerkstelligt werden.
- Gegenprüfung. Daten müssen hinsichtlich ihrer Quelle und Übereinstimmung mit dieser überprüfbar sein und vor der Übernahme in den Gesamtdatensatz einer Gegegenprüfung unterzogen werden.
- Creative Commons-Prüfung - Clearing der Urheberrechte. Welche Rechtslage besteht für statistische Datensätze? Behördlich erstellte Datensätze sind vermutlich gemeinfrei. Wie ist es, wenn diese aufbereitet wurden.
- Informationen zur Erstellung Dabei sollten auch Informationen zu den Erhebungsmethoden und eine kritische Bewertung verfügbar sein. Mittelfristig kann eine entsprechende Datenbank aufgebaut werden, die das Verfahren erleichtert.
Ich sehe da ein gewaltiges Problem mit der illegalen Migration. Es würde kaum reichen einfach die Statistiken der EU-Länder zusammenzuführen. Man müßte auch die Abwanderungsstatistiken der Herkunftsländer haben. Wenn es da keine ordentliche statistische Behörde gibt, wird das sehr sehr schwer werden. Illegale melden sich nicht einfach beim Einwohnermeldeamt oder werden vom Mikrozensus erfaßt oder können einfach ein Bankkonto anmelden. Verbesserungshinweise könnten da aus der Wirtschaft kommen, denn Migration ist immer mit einem Geldfluß in umgekehrter Richtung verbunden in Form von Geldtransfer an die verwandschaftlichen Netzwerke daheim. Aber da hat man nur Schätzungen. Auch werden die Arbeitgeber, die von der illegalen Migration profitieren kaum, hilfreiche Hinweise geben.
Astroboi 19:37, 18. Sep. 2007 (CEST)
-
- Ich stimme zu. Behördendaten können "illegale" oder auch irreguläre Migration prinzipiell nicht erfassen. Interessant ist die Entwicklung verfügbarer Daten zu Ausweisungen, laufenden Verfahren˜ usw. aber dennoch. Ländervergleiche stellen vor schwerwiegende Probleme: unterschiedliche Erfassungsmethoden, Selektionseffekte usw. Die Erstellung des Datensatzes kann aber die Probleme der Interpretation zunächst ausklammern. Euro 23:57, 5. Okt. 2007 (CEST)
[Bearbeiten] Codierungs-Standard
Wünschenswert wäre eine spezielle Wiki für statistische Daten. Daten können aber auch in gewöhnliche Wikis eingetragen werden und dann mit entsprechender Software wie z.B. R (vgl. wikibooks:de:GNU R ) ausgelesen werden, wenn eine bestimmte Form gewahrt wird. Eine Möglichkeit wäre eine mehrspaltige Tabelle für jede Variable, etwa so: ---
| VAR | asylsuchende |
| Beschreibung | Asylsuchende in der BRD |
Jahr/Monat/Tag/Zeit - Zahl - Quellenkürzel
1990 - 193063 - baafbrd2002/1
1991 - 256112 - baafbrd2002/1
1992 - 438191 - baafbrd2002/1
1993 - 322599 - baafbrd2002/1
1994 -127210 - baafbrd2002/1
1995 - 127937 - baafbrd2002/1
1996 -116367 - baafbrd2002/1
1997- 104353 - baafbrd2002/1
1998 - 98644 - baafbrd2002/1
1999- 95113 - baafbrd2002/1
2000 - 78564 - baafbrd2002/1
2001- 88287- baafbrd2002/1
2002 - 71127- baafbrd2002/1
Quellen: bafbrd2002/1 - Sources: 1975,1980,1985,1990-2002: Bundesamt für die Anerkennung ausländischer Flüchtlinge, Nürnberg / ab 1994 nur Erstanträge / cited after: Statistisches Bundesamt (2005) Datenreport 2004
[Bearbeiten] Publikationsweise
Veröffentlichbar wären die Daten über die Wikimedia-Commons-Seite als csv-Datei und als R-Objekt über den [CRAN-Server] des R-Projektes (vgl. wikibooks:de:GNU R ).

