19.06.2024
KÜNSTLICHE INTELLIGENZ

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

Halluzinationen sind ein großes Problem der KI-Szene. Und das weltweit. Während Google und Microsoft sich bei einer Lösung schwertun, kommt aus Österreich ein Modell, dass solche "KI-Unsicherheiten" besser erkennen soll. Es heißt: SDLG. Wie genau, erklärt KI-Experte Sepp Hochreiter in einem Gespräch mit uns.
/artikel/loesung-gegen-ki-halluzinationen-so-funktioniert-sepp-hochreiters-sdlg-methode
SDLG, KI, Hochreiter, Halluzination
(c) brutkasten - Sepp Hochreiter zu SDLG.

“Großartige Arbeit meines Teams: Erkennen, ob LLMs (Anm.: Large Language Models) halluzinieren. Sie halluzinieren, wenn sie unsicher sind. Wir erkennen diese Unsicherheit und markieren Halluzinationen” – so beschreibt KI-Koryphäe Sepp Hocheiter auf LinkedIn die Errungenschaft, die er uns seine Forscher:innen am Institut für Machine Learning der Johannes Kepler Universität Linz vollbracht haben. Dabei spricht er von dem SDLG-Modell. Der Begriff steht für “Semantically Diverse Language Generation”.

Denn es ist ein großes Thema, das die KI-Community beherrscht. Bei Nutzung von Künstlicher Intelligenz (KI) kann es passieren, dass man eine Frage stellt und falsche Antworten bekommt. Im Fachjargon sagt man dazu, die KI halluziniert.

SDLG verbessert Erkennung von Halluzinationen

Wie brutkasten berichtete, tun sich Giganten wie Google und Microsoft schwer, dieser Problematik habhaft zu werden. Eine neuer Lösungsansatz kam heuer vom Wiener Startup datAInsights, die statt impliziten explizite Fakten bzw. explizites Wissen verwenden, das dokumentiert ist. “Wir reichern bestehende Knowledge-Systeme mit Quellen an, sodass sie für unsere Architektur verarbeitet werden können”, erklärte datAInsights-Co-Founder René Heinzl im März 2023.

Nun kommt ein weiterer Lösungsansatz aus dem Umfeld von Sepp Hochreiter: SDLG. Diese neue Methode verbessert die Erkennung von Halluzinationen in LLMs (Large Language Modellen), indem es die Unsicherheitsabschätzung vorantreibt oder anders gesagt, aufzeigt, wenn ein Large Language Modell “unsicher” ist.

Man muss wissen, dass LLMs als Basis für Künstliche Intelligenz dienen und wie eine Zeichenkette aufgebaut sind. Hier wirken Wahrscheinlichkeiten, die das nächste Zeichen (konkret das nächste Wort oder um noch genauer zu sein, die nächsten Buchstaben) produzieren und Antworten auf Fragen liefern. Da kann es zu Fehlern oder falschen Informationen kommen.

Einstein oder Newton?

“Hochreiter präzisiert gegenüber brutkasten: “Halluzinationen können entstehen, wenn ein Trainingsdaten-Set fehlende oder zu wenige Daten zu einem Thema hat”, sagt er. “‘Albert Einstein hat die Relativitätstheorie entwickelt’ kann in verschiedenen Varianten (Anm.: Einstein hat die Relativitätstheorie erfunden, die Relativitätstheorie wurde von Einstein erfunden oder entwickelt, Der Vater der Relativitätstheorie ist Alber Einstein, etc.) im Trainingsdaten-Set als Information dienen. Gibt es diese nicht oder nur ungenügend, und die KI weiß, dass das Relativität etwas mit Physik zu tun hat, kann es sein, dass die Antwort plötzlich Newton ist.”

SDLG erkennt ob “LLMs halluzinieren”

Lukas Aichberger, “ELLIS PhD”-Student am Institut für Machine Learning der JKU beschreibt per LinkedIn-Post die SDLG-Methode – die er, Kajetan Schweighofer, Mykyta Ielanskyi und Sepp Hochreiter entwickelt haben – wie folgt: “Wir schaffen eine theoretische Grundlage für Unsicherheitsmaße in LLMs und führen theoretisch begründete ‘Estimatoren’ (Schätzer) für semantische Unsicherheit ein. Und stellen eine Methode zur Verfügung, um semantisch vielfältige und dennoch wahrscheinliche Ausgabesequenzen zu erzeugen, indem wir die Texterzeugung eines LLMs so steuern, dass wichtige Informationen für den semantischen Unsicherheitsschätzer erfasst werden.”

SDGL, KI, Halluzinationen, Hochreiter
(c) zVg – (v.l.) Sepp Hochreiter, Lukas Aichberger, Mykyta Ielanskyi und Kajetan Schweighofer.

In anderen Worten hebt die SDGL-Methode jene Aussagen hervor, wo sich die KI nicht sicher ist und markiert sie, damit man die durch “semantische Unsicherheit” (des Large Language Models) hervorgerufenen Halluzinationen erkennt, wie Hochreiter präzisiert.

Im 23-seitigen Paper, das die Forscher herausgebracht haben, heißt es konkret: “SDLG steuert das LLM, um semantisch unterschiedliche, aber wahrscheinliche Alternativen für einen ursprünglich generierten Text zu erzeugen. Dieser Ansatz liefert ein präzises Maß für die aleatorische (Anm.: vom Zufall abhängige) semantische Unsicherheit und erkennt, ob der ursprüngliche Text wahrscheinlich halluziniert ist. Experimente mit Aufgaben zur Beantwortung von Fragen zeigen, dass SDLG bestehende Methoden durchgängig übertrifft und dabei rechnerisch am effizientesten ist, wodurch ein neuer Standard für die Unsicherheitsabschätzung in LLMs gesetzt wird.”

Deine ungelesenen Artikel:
15.11.2024

WhatAVenture startet Partnerschaft mit CERN

Der Wiener Corporate Venture Builder WhatAVenture kooperiert mit dem Forschungszentrum im Rahmen des Entrepreneurship-Programms CERN Venture Connect.
/artikel/whataventure-startet-partnerschaft-mit-cern
15.11.2024

WhatAVenture startet Partnerschaft mit CERN

Der Wiener Corporate Venture Builder WhatAVenture kooperiert mit dem Forschungszentrum im Rahmen des Entrepreneurship-Programms CERN Venture Connect.
/artikel/whataventure-startet-partnerschaft-mit-cern
WhatAVenture wird Partner - Eines der Gebäude am CERN | (c) Torbjorn Toby Jorgensen via Wikimedia Commons
Eines der Gebäude am CERN | (c) Torbjorn Toby Jorgensen via Wikimedia Commons

Startups einen schnellen, unkomplizierten und maßgeschneiderten Zugang zu CERN-Ressourcen bieten – so lautet die Zielsetzung des Programms CERN Venture Connect (CVC). Das renommierte internationale Forschungszentrum mit Sitz in der Schweiz ist für seine Teilchenbeschleuniger bekannt und bringt mit der Grundlagenforschung im Bereich Teilchenphysik Ergebnisse in Feldern wie Lasertechnologie und Chips hervor, die etwa in der Robotik und im Energie-Bereich Anwendung finden können. Mit WhatAVenture wird nun ein heimischer Corporate Venture Builder ab 2025 CVC-Partner.

“Ansatz kombiniert ingenieurwissenschaftliches Denken und Forschung mit schnellem, marktorientiertem Handeln”

Das Wiener Unternehmen, das unter anderem heimische Konzerne wie Verbund, Strabag und ÖBB und große internationale Unternehmen wie Miele oder EnBW bei ihren Corporate-Venturing-Aktivitäten betreut, will die Übernahme der Technologien durch Startups und Unternehmensgründungen beschleunigen. “Unser Ansatz kombiniert ingenieurwissenschaftliches Denken und Forschung mit schnellem, marktorientiertem Handeln. Auf diese Weise helfen wir Startups und Unternehmen, innovative Produkte schneller zu validieren und auf den Markt zu bringen”, sagt Georg Horn, Lead Venture Architect bei WhatAVenture.

WhatAVenture mit Erfahrung in der Zusammenarbeit mit Forschungsprogrammen

Mit dem WhatAVenture-Framework führe man eine “360-Grad-Validierung” durch, um Machbarkeit und Wirtschaftlichkeit zu überprüfen und technologischen Fortschritt in marktfähige Geschäftsmodelle zu übersetzen. “Wir kennen und verstehen die Denkweise von Ingenieuren und ergänzen diese mit unserem Expertennetzwerk und Marktverständnis”, so Horn. Man habe in der Vergangenheit bereits erfolgreich mit akademischen Forschungs- und Startup-Programmen zusammengearbeitet.

CERN: “Idealer Partner für diese Kooperation”

CERN habe WhatAVenture aufgrund dieser umfassenden Erfahrung als CVC-Partner ausgewählt, heißt es in einer Aussendung. “Wir erkennen das enorme Potenzial unserer Technologien in Deep-Tech-Bereichen wie Energie oder Robotik, und unsere Partnerschaft mit WhatAVenture wird uns dabei helfen, dieses Potenzial zu verwirklichen. Mit ihrer umfassenden Erfahrung in der Frühphasenvalidierung und im Bereich von Startups in der Frühphase haben wir in WhatAVenture den idealen Partner für diese Kooperation gefunden”, sagt dazu Linn Kretzschmar vom CERN.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode