Kommerzielle Datenernte

Aus Wikiversity

Das Konzept Commercial Data Harvesting (CDH) benötigt 5 Grundbestandteile:

  • (Nutzen/Anreiz) Informations-/Kommunikationsdienst oder Spiele, die für die Nutzer attraktiv sind. Die Nutzer sind dabei Anbieter/Lieferanten der Daten, die von der CDH-Firma verarbeitet und verkauft werden können. Die Nutzer nehmen dabei den vordergründige Nutzen eines Dienstes positiv, nützlich oder unterhaltsam wahr, da die Lieferung der eigenen Daten wird dabei in Kauf genommen, um den Dienst bzw. den Nutzen erhalten zu können. Die Lieferung von Daten, die systematisch durch die Nutzung eines Dienste geliefert werden, verwendet den Anreiz oder ein positives Nutzungserlebnis um den Datenstrom für die Ernte nicht abbrechen zu lassen. Anreizsystem werden bewertet, in weit ein Anreiz zu mehr Nutzungszeit für die Datenernte führt.
  • '(BENUTZERGRUPPE) eine große Gemeinschaft von Nutzern des Dienstes, der die Daten erzeugt (z.B. Nutzer eines Informationssystems oder eines Messengers)
  • (CDH COMPANY: Dienstleister) (CDH COMPANY: Dienstleister) Unternehmen, das kommerzielles Daten-Harvesting durchführt.
  • (Methode: Analyse von Benutzerdaten) Analyse der gesammelten Daten von und über den Benutzer unter Verwendung von data mining Ansätzen für (digitale) Destillationsprodukte[1] die verkauft werden können, damit Kunden des Unternehmens
  • (CDH-KUNDEN: Käufer von Benutzerdaten und abgeleiteten Produkten) Kunden des Unternehmens, das kommerzielles Daten-Harvesting (CDH) durchführt. Die Kunden sind bereit, für das Wissen über die Benutzer zu zahlen, z.B. für maßgeschneiderte Werbung entsprechend dem Profil der Benutzer. Die Bezahlung von CDH-Nutzerdaten und abgeleiteten Produkten ermöglicht einen kostenlosen Service (z.B. kostenloses E-Mail-Konto, kostenlose Nutzung des Messengers, ...)

Definition[Bearbeiten]

Dies führt zu der folgenden Definition:

Commercial Data Harvesting ist ein Konzept, das
  • einen Kommunikations- und Informationsdienst oder ein Spiel verwendet, um Daten von einer bestimmten Benutzergruppe zu sammeln und
  • die Daten oder davon abgeleitete digitale Produkte an Kunden zu verkaufen, die ein Nutzen von den Informationen erwarten, die die Daten selbst über Personen haben oder einen weiteren digitalen Dienst verwenden möchten, der auf den gesammelten Benutzerdaten basiert.

Wert der geernteten Daten[Bearbeiten]

Der Wert sind Daten und die abgeleiteten Informationsdienste sind abhängig von der

  • Größe: die Größengemeinschaft bestimmt, ob der Einfluss der KUNDEN der Daten geerntet wird.
  • Kommunikationsnetz einer Gemeinschaft: Wer kommuniziert mit wem? Welche Art von Zielgruppe arbeitet in dem Netzwerk (Pädagogen/Studenten, Ingenieure/Entwickler, Forscher, Verwaltung)? Welche Art von Daten können geerntet werden? Welche Sicherheitsmechanismen sollten daher bei der Kommunikation angewendet werden?
  • Inhalt: Welche Themen werden in der digitalen Infrastruktur bearbeitet und diskutiert? Wer hat ein Interesse diese Daten zu nutzen und welche Datenschutzanforderungen bestehen für die genutzten Inhalte? Beachten Sie dabei: Wenn Inhalte eine kommerziellen Wert besitzen, heißt es nicht notwendig, dass diese auch geteilt werden sollten (wenn z.B. gesetzliche Rahmenbedingungen fehlen) oder dürfen?

Sicherheit[Bearbeiten]

  • Erläutern Sie die Anforderungen und Einschränkungen zur Vermeidung von kommerziellem Daten-Harvesting in kritischen Infrastrukturen!
  • Was sind für Sie kritische Infrastrukturen in Verwaltung, Forschung, Entwicklung, Medizin, Bildungseinrichtungen, ..., die einen besonderen Schutz bzgl. kommerzieller Datenernte benötigen?

Digitale Lernumgebungen[Bearbeiten]

  • Erläutern Sie die Anforderungen und Einschränkungen zur Vermeidung von kommerziellem Data Harvesting in Digitale Lernumgebungen.
  • Erläutern Sie die Rolle von Open Source und einer transparenten Implementierung von Digitale Lernumgebungen.
  • Diskutieren Sie in einer Gruppe von Lehramtsstudierenden, wie CHD in Bildungssystemen reduziert werden kann. Welches sind die effektivsten Maßnahmen?
  • Welche Rolle spielt die Lehrerausbildung im Hinblick auf CDH?
  • Wie würden Sie CDH als Bildungsinhalt in IKT-Risikokompetenz und -bewusstsein einbeziehen?

Abgeleitete Informationen[Bearbeiten]

  • Erstellen Sie ein Benutzerprofil von Wissen und Fachkenntnissen, um z.B. maßgeschneiderte Werbeazeigen daraus abzuleiten. Grundkonzept dabei ist, dass die Wahrscheinlichkeit, ein Produkt zu kaufen, höher ist, wenn die Werbung mit den Interessen und dem Hintergrund der Nutzerinnen und Nutzer übereinstimmt.
  • Politische Meinungen und Haltungen: Politische Aussagen können auf öffentliche Meinungen zugeschnitten werden, die durch Data-Mining-Methoden ermittelt werden.
  • Freizeitaktivitäten, verwendete Technologie: Benutzer können zu Freizeitaktivitäten geführt werden, die für den Benutzer von Interesse sind
  • Gesundheitsbezogene Informationen und Fitness. Bestimmte Aktivitäten haben einen positiven oder negativen Einfluss auf die Gesundheit. Das Wissen über diese Aktivitäten kann für das Gesundheitswesen und die Krankenversicherung von Interesse sein.

IT-Umgebungen für das Datenernten[Bearbeiten]

  • Kommerzielles Data Harvesting benötigt IT-Umgebungen, in denen die Nutzer einen "großen" Digital Footprint hinterlassen. Analysieren Sie Ihr eigenes Online-Verhalten! Wo hinterlassen Sie einen digitalen Fußabdruck (bestimmen Sie grob den Prozentsatz der gesamten Online-Zeit oder explizit die Zeitspanne für jede IT-Umgebung. Beispiele für IT-Umgebungen, die als Harvesting-Umgebungen dienen können, sind
    • Messenger (WhatsApp, Telegram, Signal, deltaChat, Mail, ...)
    • Soziale Medien,
    • Büroprodukte (z.B. Schreiben von Projektanträgen, Zusammenfassungen, Ergebnissen, einer Analyse, ...)
    • GPS-Tracks und Navigation,
    • Spracherkennung,
    • Videokonferenz, die auf einer IT-Infrastruktur läuft, die nicht vom Unternehmen, der Forschungs- und Entwicklungsabteilung, kontrolliert wird,
    • ...
  • Analysieren Sie den Nutzen für Sie und führen Sie eine Risikoanalyse durch
    • für sich selbst,
    • für ein Unternehmen oder eine Institution, für die Sie arbeiten, oder
    • im Allgemeinen für Institutionen, Unternehmen, ... die Sie kennen (z.B. Gesundheitseinrichtungen, Regierungsverwaltung, ...).

Lernaufgaben[Bearbeiten]

  • (Kunde oder Datenquelle)' Die meisten Benutzer denken, sie erhalten z.B. einen kostenlosen digitalen Dienst.
    • ein E-Mail-Konto,
    • Fitness-Analyse,
    • Unterstützung von Routenplanung und Navigation.
Die Nutzer sehen sich also als Kunde eines Anbieters eines kostenlosen digitalen Dienstes, anstatt die Informationsquelle für digitale Produkte zu sein, die an jemanden verkauft werden, der bereit ist, für die Informationen oder die aus den ermittelten Nutzerprofilen abgeleiteten Dienste zu bezahlen. Warum ist es wichtig, dass sich Nutzer als "Kunden eines kostenlosen digitalen Dienstes" betrachten, anstatt Teil eines verkauften digitalen Produkts zu sein?
  • (Spracherkennung) Erklären Sie die Rolle der Spracherkennung mit mobilen Geräten[2] für kommerzielles Data Harvesting. Wie ist es möglich, durch Analyse von Gesprächen maßgeschneiderte Werbung abzuleiten. Was sind die potenziellen Bedenken hinsichtlich des Datenschutzes? [3] von Einzelpersonen, Forschungs- oder Entwicklungseinheiten, Gesundheitseinrichtungen,...
  • (Wettbewerb mit einer Auszeichnung) Ein Unternehmen entwirft einen Wettbewerb mit einem ersten, zweiten und dritten Preis für die Bereitstellung einer Lösung für ein bestimmtes Problem.
    • Vergleichen Sie die PROs und CONs eines Wettbewerbs im Vergleich zur Forschungs- und Entwicklungsabteilung des Unternehmens.
    • Es gibt viele Einreichungen zu den Wettbewerben, die Schwächen haben und keinen Preis erhalten werden. Warum haben selbst erfolglose Wettbewerbsbeiträge einen Wert für das Unternehmen und die Lösung für das gegebene Problem? Würden Sie den Teilnehmern den Wert der Einreichungen für das Unternehmen mitteilen?
Was sind die Gemeinsamkeiten und Unterschiede von Wettbewerb mit Auszeichnung und Kommerzielles Daten-Harvesting?
Erörtern Sie die Notwendigkeit, das "WARUM" zu kommunizieren, warum Daten von einem neutralen Standpunkt (NPOV) gesammelt werden, um die Entscheidungsfindung der Benutzer zu unterstützen, ob sie die Daten teilen wollen oder nicht bereit sind, die Daten für einen bestimmten Zweck zu teilen.
  • '(Aufgabe für Autoren der Lernressource) Wie sollte sich diese Lernressource entwickeln, damit der neutrale Standpunkt (NPOV) in Wikiversity respektiert wird (use talk/discuss page])?
  • (Künstliche Intelligenz) Kommerzielles Data Harvesting z.B. von mobilen Geräten, Fitnesstracker, ... erzeugen benutzerspezifische Daten. Analysieren Sie die Konzepte der künstlichen Intelligenz und erklären Sie, wie KI für die Mustererkennung von gesammelten Daten über Benutzer eingesetzt werden kann!
  • * (Digitale Lernumgebung) Diese Lernaufgabe konzentriert sich auf Lernumgebungen und Schutzmaßnahmen für Lernende/Schüler, um das Sammeln kommerzieller Daten im Bildungssystem zu vermeiden. Erklären Sie, warum es wichtig ist, dass Daten über die Lernenden geschützt werden müssen. Darüber hinaus kann die Anpassung einer digitalen Lernumgebung an die Anforderungen und Einschränkungen des Lernenden (Learner Analytics) so gestaltet werden, dass die Daten über den Lernenden das Gerät des Lernenden nicht verlassen und die Kontrolle über
    • die ausgewählte Anwendung,
    • das ausgewählte Speichergerät,
    • Datenschutz der Daten des Lernenden,
    • ...
Erklären Sie, wie Sie eine OpenSource-Distribution für mobile Geräte (z.B. basierend auf LineageOS) entwerfen würden, um eine maßgeschneiderte Linux/Android-Distribution für Hochschulen, Universitäten oder Schulen zu erstellen, die alle Werkzeuge vorinstalliert haben, die in der IT-Infrastruktur der Lehreinheit erlaubt sind. Wie können Schulen und Bildungseinheiten Open Educational Resources gemeinsam nutzen und dem zugrunde liegenden Open-Source-Betriebssystem adaptive Komponenten hinzufügen? Bottom-up aufbauen
  • aus dem Betriebssystem auf Clients mit Root-Zugriff,

Open-Source-Server-Infrastruktur, die von Schulen gemeinsam genutzt werden kann, z.B. eine RESTful-API

  • einen Boot-Selektor für das Gerät, um das anfängliche Betriebssystem für die maßgeschneiderte Installation des LineageOS-Image für den Gerätekurs auszuwählen, Klasse, ....
  • Erklären Sie, wie Sie die geeigneten Anwendungen für die Gruppe der Lernenden auswählen würden, ...
  • ...

Quellenangaben[Bearbeiten]

  1. Silverstein, C., Marais, H., Henzinger, M., & Moricz, M. (1999, September). Analyse eines sehr großen Web-Suchmaschinen-Abfrageprotokolls. In ACm SIGIR Forum (Band 33, Nr. 1, S. 6-12). ACM.
  2. McGraw, I., Prabhavalkar, R., Alvarez, R., Arenas, M. G., Rao, K., Rybach, D., ... & Parada, C. (2016, März).
  3. Ramos, C., Augusto, J. C., & Shapiro, D. (2008). Ambient Intelligence - der nächste Schritt für künstliche Intelligenz. IEEE Intelligent Systems, 23(2), 15-18.
  4. Humanitarian Open Street Map Team - Web Portal (Zugriff am 11.09.2007) - https://www.hotosm.org/