✨ AI Kontextualisierung
Breakout Year
2022 wird als jenes Jahr in die Geschichtsbücher eingehen, in dem zum ersten Mal auch innerhalb der breiten Bevölkerung eine pro-aktive Beschäftigung mit Artifical Intelligence (AI) stattgefunden hat.
Die letzten 10 Jahre haben uns zwar regelmäßig technologische Durchbrüche beschert, man denke nur an AlphaGo, autonome Fahrzeuge oder Alexa, jedoch war aus Enduser:innen-Sicht AI zumeist nur eine Basistechnologie, die eine bessere Erkennrate bei Bildern und Videos oder Vorhersagegenauigkeit von Finanz- und Absatzzahlen ermöglichte.
Mit der raschen Entwicklung im Bereich der generativen AI hat sich dies binnen kürzester Zeit geändert und wir erleben seit Spätsommer eine regelrechte kreative Explosion, wenn es um die Anwendung von AI geht.
Wie ist es dazu gekommen?
OpenAI lässt bereits seit Jahren mit sog. Transformer-Modellen aufhorchen, welche die Generierung von Text und Bildern erlauben. Die Qualität hatte dabei mit GPT-3 in 2021 ein Niveau erreicht, welches in vielen Fällen nur noch schwer von Texten zu unterscheiden war, welche von Menschen geschrieben wurden.
Mit dem ebenfalls von OpenAI stammenden Dall-e2-Modell wurde es möglich, aus Texteingabe fotorealistische Bilder wie in diesem Beispiel zu erstellen.
Aus der Eingabe “Teddy bears working on new AI research underwater with 1990s technology” erstellte dall-e2 folgendes Bild:
Beiden Technologien und auch ähnlichen Ansätzen von Meta und Google ist gemein, dass der zugrunde liegende Code nicht einsehbar ist und der Zugriff, wenn überhaupt, nur über eine API möglich ist.
Technologische Demokratisierung
Die Entwicklung solcher oft auch als “Foundation Models” bezeichneten Technologien ist sehr daten-, zeit- und kostenintensiv, weshalb der Economist noch im Juli diesen Jahres eine Zukunft skizzierte, in der einige wenige Unternehmen diese Modelle trainieren werden und in weiterer Folge lizenzieren werden.
Knapp ein Monat später erschien mit Stable Diffusion quasi die Open-Source-Version von Dall-e2 und hat seitdem einen regelrechten AI-Kunst-Boom ausgelöst, der weit über Tech- und Startup Kreise hinausgeht. So wurde die diesjährige Gala des österreichischen Kreativpreises EFFIE bereits mit KI-Kunst ausgestaltet.
Die nächste Evolutionsstufe stellt aktuell ChatGPT dar (brutkasten berichtete) – das neueste Sprachmodell von OpenAI, das einen Zugriff durch simple Texteingabe wie in der Google Searchbox ermöglicht und somit auch für Non-Techies verwendbar wird.
Das Besondere daran ist, dass ChatGPT nicht nur Antworten auf Fragen wie “Erkläre mir den Unterschied zwischen x und y” geben kann, sondern auch mit komplexeren Anfragen wie “Schreibe mir eine Python-Funktion, die Website x crawled” umgehen kann. Somit ist ChatGPT nicht nur eine glorifizierte Suchmaschine sondern ein vielseitiges Produktivitätstool, dass sich in zahlreichen white-collar settings einsetzen lässt.
What’s next in Artificial Intelligence?
Die Auswirkungen auf Arbeit, Bildung, Gesellschaft und Politik lassen sich aktuell nur sehr schwer abschätzen, da wir uns mitten in einem Paradigmenwechsel befinden, wie er nur alle paar Jahrzehnte stattfindet.
Der Optimist in mir sieht eine Demokratisierung von technologischem Fortschritt, die Personen in allen Lebenslagen sinnvoll unterstützen kann: vom automatisch generierten Code bis hin zur korrekten Excel-Formel oder Social-Media-Text und Sujet.
Das Thema “vertrauenswürdige KI” bekommt in solch einem Setting jedoch eine vollkommen neue Dimension, da der Output von diesen Systemen uns keine Quellenangaben mehr liefert, sondern bereits das Endergebnis darstellt. Wenn uns heute ein Algorithmus einen Artikel vorschlägt, lässt sich recht schnell erkennen um welche Art von Medium es sich handelt (right/left wing, conspiracy, …). In einer Zukunft, in der mir eine AI-Suchmaschine direkt die Antwort auf meine Frage liefert, lässt sich nur schwer rekonstruieren, auf welchen Texten diese basiert.
Medienkompetenz und Fact-checking bekommen hier eine vollkommen neue Dimension, die sich nicht nur über Regulierung lösen lassen wird.