14.06.2023

Dank KI: So schön können (funktionierende) QR-Codes sein

Nur die markanten Eckpunkte verraten diese Bilder als QR-Codes, der Scanner erkennt sie aber problemlos. Das Stable-Diffusion-Modell Controlnet macht's möglich.
/artikel/dank-ki-so-schoen-koennen-funktionierende-qr-codes-sein
Einer der Anime-QR-Codes des chinesischen Bloggers
Einer der Anime-QR-Codes des chinesischen Bloggers

Die kleinen viereckigen Bildchen sind mittlerweile seit vielen Jahren omnipräsent. Wo man auch hinsieht, begegnen einem QR-Codes. Auch an die üblicherweise schwarz-weiße, im besten Fall in einem anderen Ton eingefärbte Optik, haben wir uns längst gewöhnt. Und eines ist klar: Ein QR-Code muss aus vielen kleinen Quadraten bestehen, um zu funktionieren. Oder?

Ein simples alternatives QR-Code-Design (ganz ohne KI) | via qrbtf.com

Generative KI bringt Bilder-QR-Codes auf nächstes Level

Tatsächlich ist das nicht der Fall. Nicht nur in der Farbe, sondern auch in der Form ist eine gewisse Variation möglich, trotz der QR-Code-Scanner die Links problemlos abrufen können (siehe oben – der Standard-Scanner in der Handykamera erkennt diese allerdings nicht automatisch). Und nimmt man generative KI zur Hilfe, geht diese Variation noch viel, viel weiter, als im oberen Beispiel, wie ein chinesischer Blogger nun eindrücklich zeigte und damit auf Reddit viral ging.

Einer der besonderen QR-Codes im Blog-Beitrag

Bauwerke, Landschaften und Anime-Figuren

Im Blog-Beitrag zu sehen sind Bauwerke, Landschaften, Anime-Figuren sowie traditionelle (asiatische) Muster und Grafik-Stile. Dass es sich um einen QR-Code handelt, verraten nur die markanten Eckpunkte, die sich in vielen Fällen ebenfalls harmonisch in die Grafik einfügen. Die meisten Codes führen zur Website qrbtf.com, auf der man deutlich einfachere Bilder-QR-Codes (wie das zuoberst gezeigte Beispiel) erstellen kann.

Einer der besonderen QR-Codes im Blog-Beitrag

Stable Diffusion-Modell Controlnet genutzt

Der Blogger nutzte für seine Werke eine generative KI: das auf dem Bildgenerator Stable Diffusion basierende Modell Controlnet. Dieses erlaubt besonders spezifische Prompts. Für die gezeigten Codes wurde es darauf trainiert, eingespeiste QR-Codes (diese werden zuvor über einen normalen Generator erstellt) mit Grafiken zu “übermalen”, ohne dass sie ihre Funktion verlieren. Ganz genau verrät der Blogger aber nicht, wie er solche Ergebnisse erzielt hat.

Einer der besonderen QR-Codes im Blog-Beitrag
Deine ungelesenen Artikel:
23.12.2024

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

OpenAI hat ein neues Sprachmodell vorgestellt, das die Diskussionen um Artificial General Intelligence (AGI) wieder anheizt. Was steckt dahinter?
/artikel/openai-modell-o3-artifical-general-intelligence
23.12.2024

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

OpenAI hat ein neues Sprachmodell vorgestellt, das die Diskussionen um Artificial General Intelligence (AGI) wieder anheizt. Was steckt dahinter?
/artikel/openai-modell-o3-artifical-general-intelligence
Logo von OpenAI
Foto: Adobe Stock

Wenn OpenAI neue Dinge ankündigt, hört die KI-Szene hin. Klar, nicht jede Ankündigung des US-Unternehmens in den vergangenen zwei Jahren hatte dieselbe Tragweite wie jene vom 30. November 2022, als OpenAI den Start eines Chatbots namens ChatGPT verlautbaren ließ. Aber potenziell könnte jede Mitteilung des Unternehmens rund um CEO Sam Altman bahnbrechend sein. Kein Wunder also, dass es für Aufsehen sorgte, als OpenAI Anfang Dezember verlautbarte, zwölf Tage hintereinander neue Dinge vorzustellen.

Schon in der Ankündigung hatte Altman darauf hingewiesen, dass es neben größeren auch kleinere Neuigkeiten sein würden, die OpenAI liefern würde. So kam es dann auch: Zugang zu ChatGPT über WhatsApp oder die Integration in Apple Intelligence waren eher in die zweite Kategorie einzuordnen. Daneben veröffentlichte OpenAI aber auch das neue Modell o1 für ChatGPT – oder Sora, ein Tool zur Videoerstellung.

Den größten Widerhall in der KI-Szene fand allerdings die Ankündigung am letzten der zwölf Tage. Am vergangenen Freitagabend stellte OpenAI sein neues Modell o3 vor. Wichtig dabei: Das Modell ist noch nicht öffentlich zugänglich. OpenAI stellte zunächst einmal nur vor, wie das Modell in unterschiedlichen KI-Benchmarks abschnitt. Aber diese Ergebnisse hatten es in sich.

o3 zeigt starke Performance bei AGI-Benchmark

Vielbeachtet wurde dabei vor allem die Benchmark namens ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence), bei der zwei Varianten des o3-Modells deutlich bessere Ergebnisse erzielten als die bisher führenden o1-Modelle. Das Ziel von ARC-AGI ist es zu messen, wie sich eine KI im Umgang mit ihr unbekannten Aufgaben schlägt.

Wie die O3-Modelle verglichen mit anderen OpenAI-Modellen abschneiden // Grafik: ARC Prize

Es gibt unterschiedliche Definitionen von AGI. Die meisten davon verstehen AGI aber als ein System, das sämtliche intellektuellen Aufgaben mindestens so gut oder besser als ein Mensch erledigen kann.

Die ARC-AGI-Benchmark wurde von François Chollet konzipiert. Er definiert AGI als ein System, das “in der Lage ist, effizient neue Fähigkeiten zu erwerben und neuartige Probleme zu lösen, für die es trainiert wurde.”

Eine AGI ist also nicht für eine bestimmte Aufgabe trainiert, sondern kann jegliche Aufgaben übernehmen. Es ist weitgehender Konsens in der KI-Szene, dass solche Systeme noch nicht existieren. OpenAI wurde aber beispielsweise explizit mit dem Ziel gegründet, AGI zu erreichen.

Chollet gehört zu den bekanntesten Namen der internationalen KI-Szene. Er hat die bekannte KI-Library Keras entwickelt und seit einigen Jahren für Google tätig. Dem von ChatGPT ausgelösten Hype rund um generative KI steht Chollet seit Anfang an eher kritisch gegenüber, wie beispielsweise auch dieser brutkasten-Bericht wenige Wochen nach Erscheinen von ChatGPT thematisierte.

o3: “Wir befinden uns auf neuem Terrain”

Umso interessanter ist es, was Chollet nun zu den Ergebnissen des o3-Modells bzw. seiner Varianten zu sagen hat. In einem Blogeintrag attestiert er OpenAI, mit dem Modell einen “bedeutenden Sprung nach vorne” erreicht zu haben.

Die Performance des Modells stelle “einen echten Durchbruch” in der Anpassungsfähigkeit und Verallgemeinerung” von KI-Modellen dar”, wenn es darum gehe, wie sich KI-Modelle an neue Aufgaben anpassen könnten. o3 stelle nicht bloß einen “schrittweisen Fortschritt” dar. Vielmehr befinde man sich auf “neuem Terrain”, das “ernsthafte wissenschaftliche Aufmerksamkeit” erfordere.

Aber es ist schon Artificial General Intelligence (AGI)? Hier schränkt Chollet ein: “o3 scheitert immer noch an einigen sehr einfachen Aufgaben, was auf grundlegende Unterschiede zur menschlichen Intelligenz hinweist”. Dennoch befeuerten die Ergebnisse die Diskussion rund um AGI – und manche Stimmen sahen, anderes als Chollet, mit o3 AGI sogar bereits erreicht.

Selbst wenn dem so wäre, wäre es zum jetzigen Zeitpunkt schwer nachzuprüfen: Denn das Modell ist noch nicht veröffentlicht. Forscher:innen im Bereich der KI-Sicherheit können sich für Zugang vormerken lassen. Wann und zu welchen Konditionen das Modell für Endnutzer:innen zugänglich sein wird, ist aktuell noch unklar. Klar ist allerdings schon jetzt, dass die beeindruckenden Ergebnisse bei der ARC-AGI-Benchmark enorme Rechenressourcen erforderten – und dementsprechend teuer waren.

Reasoning-Modelle

Das o3-Modell ist eine verbesserte Version des o1-Modells, welches OpenAI am 4. Dezember veröffentliche und das zuvor bereits in Preview- und Mini-Varianten für ChatGPT-User:innen zugänglich gewesen war. Dieses Modell unterscheidet sich zu dem im Mai 2024 veröffentlichten GPT4o-Modell insofern, als es auf einen “Reasoning”-Ansatz setzt.

OpenAI bezeichnet GPT4o weiterhin als das “vielseitige, hochintelligente Flagship-Modell”, das für die “meisten Aufgaben” die richtige Wahl sei. Die o1-Modelle wiederum referenziert das Unternehmen als “Reasoning-Modelle, die sich bei komplexen, mehrstufigen Aufgaben auszeichnen”.

Enduser:innen von ChatGPT merken dies in der Nutzung vor allem insofern, als sich die o1-Modelle länger Zeit nehmen, Ergebnisse zu produzieren. Diese Modelle “verbringen mehr Zeit mit Nachdenken, bevor sie reagieren”, wie es OpenAI formuliert. In einigen (aber nicht notwendigerweise in allen) Bereichen liefern sie dann deutlich bessere Ergebnisse als die bisherigen Modelle.


Tipp der Redaktion: Die neue brutkasten-Serie “No Hype KI”

No Hype KI
Nach zwei Jahren ChatGPT liefern wir eine Bestandsaufnahme aus der österreichischen Wirtschaft – wo stehen wir wirklich?
Du willst bei "No Hype KI" am Laufenden bleiben?

Trag dich hier ein und du bekommst jede Folge direkt in die Inbox!

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Als AI-Sprachmodell kann ich keine Meinung haben. Allerdings könnte man argumentieren, dass die Verwendung von generativer KI zur Erstellung von ästhetisch ansprechenden und funktionalen QR-Codes für Werbezwecke oder als künstlerischer Ausdruck kreative Möglichkeiten eröffnet. Es könnte auch eine Debatte darüber geben, ob diese Art von QR-Codes die Bildung von visueller Ästhetik und Design fördert oder sie vereinfacht.

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Im Artikel wird keine spezifische Information zu wirtschaftlichen Auswirkungen von generativer KI und alternativen QR-Code-Designs gegeben. Es wird lediglich auf einfacher zu erstellende Bilder-QR-Codes auf einer Website hingewiesen.

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Als Innovationsmanager:in ist es wichtig, sich stets mit neuen Technologien auseinanderzusetzen und Potentiale auszuloten. Der Artikel zeigt, dass durch den Einsatz von generativer KI selbst QR-Codes, die seit vielen Jahren im Einsatz sind, noch weiterentwickelt werden können. Somit kann der Einsatz von KI auch in anderen Bereichen der Produktentwicklung und -gestaltung einen Mehrwert bieten und neue Möglichkeiten eröffnen. Als Innovationsmanager:in sollte man sich daher mit den Potentialen von generativer KI auseinandersetzen und prüfen, ob sich dadurch neue Ideen und Lösungsansätze ergeben können.

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Als Investor:in hat dieser Artikel direkt wenig Relevanz. Allerdings zeigt er, wie Fortschritte in der künstlichen Intelligenz auch die Gestaltung von QR-Codes beeinflussen können und somit auch in der Marketingbranche Veränderungen bringen könnten.

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Als Politiker:in könnten Sie von der neuen Möglichkeit der Gestaltung von QR-Codes mittels generativer KI profitieren. Durch die Einbindung von ansprechenden und individuellen Designs in QR-Codes könnten Sie Ihre Kampagnen und Wahlprogramme noch besser bewerben und interessanter gestalten.

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Das Bigger Picture dieses Artikels ist, dass die generative KI neue Möglichkeiten eröffnet hat, um QR-Codes in verschiedenen Formen und Farben zu gestalten, die ihre Funktion immer noch erfüllen können. Dies könnte für Marketing- und Werbezwecke interessant sein, da QR-Codes oft als visuelle Brücke zwischen der realen und digitalen Welt verwendet werden. Es zeigt auch, wie Technologie wie KI das Design und die kreativen Möglichkeiten erweitern kann.

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

  • Der chinesische Blogger, der die besonderen QR-Codes erstellt hat

Dank KI: So schön können (funktionierende) QR-Codes sein

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

  • qrbtf.com

Dank KI: So schön können (funktionierende) QR-Codes sein