19.06.2024
KÜNSTLICHE INTELLIGENZ

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

Halluzinationen sind ein großes Problem der KI-Szene. Und das weltweit. Während Google und Microsoft sich bei einer Lösung schwertun, kommt aus Österreich ein Modell, dass solche "KI-Unsicherheiten" besser erkennen soll. Es heißt: SDLG. Wie genau, erklärt KI-Experte Sepp Hochreiter in einem Gespräch mit uns.
/artikel/loesung-gegen-ki-halluzinationen-so-funktioniert-sepp-hochreiters-sdlg-methode
SDLG, KI, Hochreiter, Halluzination
(c) brutkasten - Sepp Hochreiter zu SDLG.

“Großartige Arbeit meines Teams: Erkennen, ob LLMs (Anm.: Large Language Models) halluzinieren. Sie halluzinieren, wenn sie unsicher sind. Wir erkennen diese Unsicherheit und markieren Halluzinationen” – so beschreibt KI-Koryphäe Sepp Hocheiter auf LinkedIn die Errungenschaft, die er uns seine Forscher:innen am Institut für Machine Learning der Johannes Kepler Universität Linz vollbracht haben. Dabei spricht er von dem SDLG-Modell. Der Begriff steht für “Semantically Diverse Language Generation”.

Denn es ist ein großes Thema, das die KI-Community beherrscht. Bei Nutzung von Künstlicher Intelligenz (KI) kann es passieren, dass man eine Frage stellt und falsche Antworten bekommt. Im Fachjargon sagt man dazu, die KI halluziniert.

SDLG verbessert Erkennung von Halluzinationen

Wie brutkasten berichtete, tun sich Giganten wie Google und Microsoft schwer, dieser Problematik habhaft zu werden. Eine neuer Lösungsansatz kam heuer vom Wiener Startup datAInsights, die statt impliziten explizite Fakten bzw. explizites Wissen verwenden, das dokumentiert ist. “Wir reichern bestehende Knowledge-Systeme mit Quellen an, sodass sie für unsere Architektur verarbeitet werden können”, erklärte datAInsights-Co-Founder René Heinzl im März 2023.

Nun kommt ein weiterer Lösungsansatz aus dem Umfeld von Sepp Hochreiter: SDLG. Diese neue Methode verbessert die Erkennung von Halluzinationen in LLMs (Large Language Modellen), indem es die Unsicherheitsabschätzung vorantreibt oder anders gesagt, aufzeigt, wenn ein Large Language Modell “unsicher” ist.

Man muss wissen, dass LLMs als Basis für Künstliche Intelligenz dienen und wie eine Zeichenkette aufgebaut sind. Hier wirken Wahrscheinlichkeiten, die das nächste Zeichen (konkret das nächste Wort oder um noch genauer zu sein, die nächsten Buchstaben) produzieren und Antworten auf Fragen liefern. Da kann es zu Fehlern oder falschen Informationen kommen.

Einstein oder Newton?

“Hochreiter präzisiert gegenüber brutkasten: “Halluzinationen können entstehen, wenn ein Trainingsdaten-Set fehlende oder zu wenige Daten zu einem Thema hat”, sagt er. “‘Albert Einstein hat die Relativitätstheorie entwickelt’ kann in verschiedenen Varianten (Anm.: Einstein hat die Relativitätstheorie erfunden, die Relativitätstheorie wurde von Einstein erfunden oder entwickelt, Der Vater der Relativitätstheorie ist Alber Einstein, etc.) im Trainingsdaten-Set als Information dienen. Gibt es diese nicht oder nur ungenügend, und die KI weiß, dass das Relativität etwas mit Physik zu tun hat, kann es sein, dass die Antwort plötzlich Newton ist.”

SDLG erkennt ob “LLMs halluzinieren”

Lukas Aichberger, “ELLIS PhD”-Student am Institut für Machine Learning der JKU beschreibt per LinkedIn-Post die SDLG-Methode – die er, Kajetan Schweighofer, Mykyta Ielanskyi und Sepp Hochreiter entwickelt haben – wie folgt: “Wir schaffen eine theoretische Grundlage für Unsicherheitsmaße in LLMs und führen theoretisch begründete ‘Estimatoren’ (Schätzer) für semantische Unsicherheit ein. Und stellen eine Methode zur Verfügung, um semantisch vielfältige und dennoch wahrscheinliche Ausgabesequenzen zu erzeugen, indem wir die Texterzeugung eines LLMs so steuern, dass wichtige Informationen für den semantischen Unsicherheitsschätzer erfasst werden.”

SDGL, KI, Halluzinationen, Hochreiter
(c) zVg – (v.l.) Sepp Hochreiter, Lukas Aichberger, Mykyta Ielanskyi und Kajetan Schweighofer.

In anderen Worten hebt die SDGL-Methode jene Aussagen hervor, wo sich die KI nicht sicher ist und markiert sie, damit man die durch “semantische Unsicherheit” (des Large Language Models) hervorgerufenen Halluzinationen erkennt, wie Hochreiter präzisiert.

Im 23-seitigen Paper, das die Forscher herausgebracht haben, heißt es konkret: “SDLG steuert das LLM, um semantisch unterschiedliche, aber wahrscheinliche Alternativen für einen ursprünglich generierten Text zu erzeugen. Dieser Ansatz liefert ein präzises Maß für die aleatorische (Anm.: vom Zufall abhängige) semantische Unsicherheit und erkennt, ob der ursprüngliche Text wahrscheinlich halluziniert ist. Experimente mit Aufgaben zur Beantwortung von Fragen zeigen, dass SDLG bestehende Methoden durchgängig übertrifft und dabei rechnerisch am effizientesten ist, wodurch ein neuer Standard für die Unsicherheitsabschätzung in LLMs gesetzt wird.”

Deine ungelesenen Artikel:
02.07.2024

Startup-Investments: Ein Überblick über das Halbjahr 2024

Das Jahr ist zur Hälfte vorbei - ein guter Zeitpunkt für einen Investment-Überblick. Daten, Zahlen und Grafiken über die Investments in österreichische Startups.
/artikel/startup-investments-ein-ueberblick-ueber-das-halbjahr-2024
02.07.2024

Startup-Investments: Ein Überblick über das Halbjahr 2024

Das Jahr ist zur Hälfte vorbei - ein guter Zeitpunkt für einen Investment-Überblick. Daten, Zahlen und Grafiken über die Investments in österreichische Startups.
/artikel/startup-investments-ein-ueberblick-ueber-das-halbjahr-2024
Eine Collage von Fotos der Founder-Teams mit den 3 größten INvestments. Zu sehen sind 2 Männerteams, ein gemischtes Team
Die drei Startups mit Top-Investments: storyblok, prewave, enspired

Das Jahr ist schon zur Hälfte vorbei und das ist ein guter Zeitpunk für einen Investment-Überblick. 55 Investments in österreichische Startups erfasste brutkasten im ersten Halbjahr 2024. Dadurch gewinnt brutkasten Einblicke in Finanzierungstrends, Investitionsvolumina und Tätigkeitsbereiche. Deutlich ist auch, dass der Gender-Gap zugleich ein Investment-Gap ist.

Disclaimer: Die Darstellung zählt die Investments, die der brutkasten-Redaktion bekannt sind. Sie erhebt keinen Anspruch auf Vollständigkeit, aber auf Redlichkeit. Die Redaktion bemüht sich täglich darum, Investments in österreichische Startups zu verfolgen, darüber zu berichten und aufzubereiten. Als Leser:in darf man sich also auf einen umfassenden Überblick freuen.

Investmentvolumen

Die Höhe von Kapitalbereitstellungen werden oft unspezifisch bekanntgegeben. Das macht es schwer, das Gesamtvolumen zu erfassen. Am beliebtesten ist die Ankündigung eines “sechsstelligen Investments”. Der Betrag liegt somit in der weiten Spanne zwischen 100.000 und 999.999 Euro. Im ersten Halbjahr 2024 wurde diese unspezifische Summe 15 mal verlautbart.

eigene Darstellung I unspezifisch-bekanntgegebene Investments

Natürlich werden auch Investments bekannt in denen die Summe genau beziffert ist. brutkasten hat diese in Zahlenbereiche zusammengefasst und sie hier nach Summen aufgelistet.

eigene Darstellung I Investments nach Summe sortiert

Von den 55 Investitionen sind die meisten unspezifisch angegeben, denn 22-mal sind lediglich Zahlenbereiche kommuniziert und bei neun Kapitalrunden gibt es gar keine Bekanntgabe über die Höhe. Von jenen, bei denen die genaue Summe kommuniziert wurde, sind die meisten im Bereich zwischen einer und fünf Millionen Euro.

Die TOP-Investments

Zu den Top-Investments im ersten Halbjahr zählen zwei Kapitalrunden über mehr als 50 Millionen Euro. Das betrifft das Linzer Content-Management-Scaleup Storyblok, mit 80 Millionen Dollar – brutkasten berichtete und das KI-Scaleup Prewave. Dieses holte ein Investment über 63 Millionen Euro. Hier sind die TOP-Investments des ersten Halbjahres dargestellt:

eigene Darstellung I Die Top 10 Investments

Zusatzinfos: Das Investment in Storyblok ist mit 80 Mio US Dollar bekannt gegeben worden. Das Investment in fiskaly wurde in der Höhe nicht genannt – es liegt aber zwischen 20 und 250 Millionen Euro, mehr dazu wird hier erklärt.


Wohin mit dem Geld?

eigene Darstellung I Investments nach Bundesländer geordnet

Österreichs Startup-Hub bleibt klar die Hauptstadt Wien, denn nach Wien gingen 32 der uns bekannten Finanzierungen. Daneben behaupten sich aber auch die Steiermark, in die sieben Investitionen flossen und Oberösterreich, das sechs Investments anziehen konnte.

Vier Kapitalrunden Verzeichnen jeweils Niederösterreich und Tirol. Salzburg und Vorarlberg haben jeweils ein Startup-Investment abgeholt. Keine Finanzierungsrunden sind im ersten Halbjahr aus Kärnten und dem Burgenland bekannt.

Brancheninvestments

eigene Darstellung I Investments nach Startup-Tätigkeit

Die Tätigkeitsbereiche der österreichischen Startup-Szene sind vielfältig und so auch der Investmentfokus, deshalb werden in den Kategorien mehrere Tätigkeitsbereiche zusammengefasst. Als Buchungsplattformen gelten zum Beispiel Startups wie like2camp und ein Startup wie Flash Chance. Diese Kategorie verzeichnet vier Investments im vergangenen Halbjahr.

Unter Ed-Tech/HR-Tech sind Startups zusammengefasst, die digitale Lösungen für Lernen, Training und Personal anbieten. Dazu gehören Teachino, die Linzer von Talents&Company und auch das VR-Startup Innerspace.

Die Auflistung zeigt, dass die meisten Investments in die Bereiche ClimateTech/Energy fließen, darunter das größte mit 25,5 Mio an enspired. Die Software-Kategorie umfasst ebenso unterschiedliche Unternehmen, die wie Prewave Lösungen für das Lieferkettenmanagement anbieten und dafür mit 63 Mio Euro ausgestattet wurden oder auch Proofcheck, das im Bereich Texterstellung tätig ist.

Investment-Gap ist Gendergap

Eine Aufschlüsselung der Investments nach Geschlecht der Founderteams zeigt einen erheblichen Gendergap. Im ersten Halbjahr 2024 erhielten zwei Startups Kapital, die von einer Frau geführt sind. Im Vergleich wurde in fünf Startups unter Ein-Mann Führung investiert.

Noch deutlicher zeigt sich der Gendergap bei den Founder-Teams. In kein rein weibliches Founder-Team ist im ersten Halbjahr 2024 investiert worden. Finanziert wurden hingegen 33 rein männliche Founder-Teams. Im Vergleich zum letzten Jahr zeigt sich, dass die Anzahl an Teams, die sowohl männliche als auch weibliche Founder beinhalten – hier als gemischte Teams ausgewiesen – mit 12 Kapitalrunden gleich blieb.

eigene Darstellung I Zusammensetzung der Gründungs-Teams nach Geschlecht

Der beste Monat für Investments

Bei den Monaten, in denen Unternehmen ihre Investments verkünden, kann man auch einen Trend erkennen. Der Jänner war im ersten Halbjahr der beliebteste Monat, um neue Finanzierungen mitzuteilen. Unternehmen haben zu Jahresbeginn 13-mal Kapitalerhöhungen angekündigt. Die Monate März und Juni zeigen sich am schwächsten bei der Anzahl der kommunizierten Investments.

eigene Darstellung I Monate der Investmentankündigung
Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Lösung gegen KI-Halluzinationen? So funktioniert Sepp Hochreiters SDLG-Methode