25.08.2023

Tech-Riesen trainieren AI mit User:innen-Daten

Die Angst vor dem Jobverlust durch Künstliche Intelligenz ist bei vielen Berufsgruppen groß. Noch größer wird der Unmut, wenn der zukünftige Konkurrent von menschlich erstellten Werken lernt – meist ohne aktive Zustimmung.
/artikel/tech-riesen-trainieren-ai-mit-userinnen-daten
Die Hände eines Menschen und eines Roboters berühren sich
ipopba - stock.adobe.com

Seit Elon Musks Bekanntgabe im Juli, er möchte die hauseigene KI xAI anhand öffentlicher Tweets trainieren, verlassen viele Künstler:innen die Social Media Plattform X (the website formerly known as Twitter). Realität jedoch ist, dass man AI crawlern kaum entkommen kann, sollte man auf öffentlichen Plattformen publizieren. Ob es nun die Crawler der Plattformen selbst, oder externe Programme sind, die verschiedenste Webseiten nach verwendbaren Daten durchforsten, spielt keine große Rolle mehr.

Wie sieht die genaue Situation auf anderen großen Apps und Plattformen aus?

Facebook/Instagram

Instagram Posts wurden zunächst händisch von indischen Leiharbeiter:innen gelabelt, um Facebooks AI zu trainieren. 2021 gab Meta (damals noch Facebook Inc.) bekannt, ein „selbstsehendes“ KI-Programm namens „Seer“ geschaffen zu haben. Trainiert wurde Seer von sich selbst – durch Self-Supervised Learning mithilfe über einer Milliarde öffentlicher Instagram-Posts. Das Unternehmen rechtfertigt die Legitimität der Vorgehensweise durch die bestehenden Datenschutzrichtlinien.

TikTok

Die chinesische Plattform des Mutterkonzerns ByteDance ist nicht gerade ein Aushängeschild für Datenschutz. Der weitreichende Erfolg TikToks liegt doch hauptsächlich daran, dass die App User:innen hochgradig maßgeschneiderten Content ausspielt – möglich gemacht durch Künstliche Intelligenz und maschinelles Lernen. TikToks Umgang mit persönlichen Informationen ist laut Datenschützer Max Schrems nach der EU-Datenschutzverordnung sogar illegal.

Zoom

Die bisherigen Beispiele beziehen sich alle auf öffentliche Postings. Zoom gab im Juli jedoch bekannt, es möchte seine eigene AI anhand privater Videochats trainieren – ohne Opt-Out Möglichkeit. Nach einem weitreichenden Shitstorm hat das Unternehmen doch zurückgerudert: „Zoom verwendet keine Audio-, Video-, Chatinhalte, per Bildschirmfreigabe weitergegebenen Dateien, Anhänge oder sonstige kommunikationsähnliche Kundeninhalte (z. B. Ergebnisse von Umfragen, Whiteboards und Reaktionen), um Modelle künstlicher Intelligenz zu trainieren.“

Deine ungelesenen Artikel:
07.11.2024

Verdea: Wiener Compliance-Startup erhält sechsstelliges Investment

Das Wiener Startup Verdea beschäftigt sich mit der Umsetzung von EU-Richtlinien und hat eine Lösung zur einfachen Umsetzung von Compliance für Unternehmen entwickelt. Dafür gab es jetzt ein Investment.
/artikel/verdea-wiener-compliance-startup-erhaelt-sechsstelliges-investment
07.11.2024

Verdea: Wiener Compliance-Startup erhält sechsstelliges Investment

Das Wiener Startup Verdea beschäftigt sich mit der Umsetzung von EU-Richtlinien und hat eine Lösung zur einfachen Umsetzung von Compliance für Unternehmen entwickelt. Dafür gab es jetzt ein Investment.
/artikel/verdea-wiener-compliance-startup-erhaelt-sechsstelliges-investment
Verdea, CSRD
(c) Verdea - Sebastian Reich (l.) und Shane Devane von Verdea.

Während seines Studiums in Mailand hat Sebastian Reich, der das Compliance-Startup Verdea gemeinsam mit Shane Devane aus Irland gegründet hat, bei freiwilligen Beratungsprojekten leider hautnah erfahren, wie langsam und ineffizient Compliance in der EU – von Nachhaltigkeit bis Cybersicherheit – noch abläuft. Und welchen Wettbewerbsnachteil dies gegenüber den USA bedeutet.

Verdea arbeitet mit Knowledge Graphs

Der Wiener wurde anschließend in das Antler-Accelerator-Programm aufgenommen, wo er seinen Co-Founder fand, dessen letztes Startup unter anderem auch von Google gefunded worden war. “Gemeinsam haben wir uns intensiv mit neuen EU-Richtlinien auseinandergesetzt und diese so strukturiert, dass eine KI sie besser verstehen kann (Anm.: Knowledge Graphs)”, sagt er. Um mit ihrer Lösung Unternehmen dort zu unterstützen, wo Prozesse noch langsam und unübersichtlich sind. Dafür erhielt man nun ein sechsstelliges Investment.

An der Finanzierungsrunde beteiligen sich die Investoren Techsoft Invest, Daniel Wülbern, und ein weiterer Business Angel. Mit dem neuen Kapital plant Verdea, sein Angebot weiterzuentwickeln und den europäischen Markt gezielt zu adressieren. Auch soll heuer noch ein Produkt für die NIS2-Richtlinie und die AIFMD gelauncht werden.

Indexierung auf Aufbereitung von Daten

Verdea strukturiert konkret EU-Richtlinien in jene Knowledge Graphs, sodass eine KI die Anforderungen besser verstehen soll. Unternehmen könnten so verschiedene Daten mit Verdea teilen, die dann indexiert und gemäß den Anforderungen der Richtlinie aufbereitet werden. Dies erfolgt mithilfe von “Retrieval-Augmented Generation” (RAG)-Modellen.

Zusätzlich fine-tuned Verdea Open-Source-KI-Modelle, die automatisch erkennen, wo noch Daten eingesammelt werden sollten und wie diese zu finden sind.

Verdea und das Problem der Daten

Die “Corporate Sustainability Reporting Directive” (CSRD) betrifft etwa 50.000 Unternehmen in der EU, die relativ komplexe Anforderungen erfüllen und enorme Datenmengen aufbereiten müssen.

“Das grundlegende Problem vieler Unternehmen ist, überhaupt zu verstehen, welche Daten aus einem unstrukturierten Daten-Dschungel für die verschiedenen Compliance-Prozesse relevant sind”, erklärt Reich. “Eine vollständige Automatisierung durch KI ergibt hier wenig Sinn. Aber gezielte Unterstützung, etwa beim Lesen von tausenden Seiten Unternehmensberichten und CSV-Dateien und deren Aufbereitung gemäß den Richtlinien, kann KI sehr gut und effizient leisten.”

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Tech-Riesen trainieren AI mit User:innen-Daten