Was haben ChatGPT, Midjourney und DeepL gemeinsam? Klar: Sie sind ausgesprochen populäre AI-Tools. Und noch was: Sie gehören alle drei nicht zu Google. Der eigentlich alles dominierende Riese ist zuletzt in der öffentlichen Wahrnehmung ins Hintertreffen geraten. Im KI-Bereich haben sich andere – allen voran OpenAI – die Pole Position gesichert. Doch das will der Internetkonzern natürlich nicht auf sich sitzen lassen. Bei der gestrigen Google I/O Keynote ließ man keinen Zweifel daran, dass eine Offensive auf ganzer Linie bereits begonnen hat.

Großer Rollout für ChatGPT-Rivale Bard

Eine zentrale Rolle in dieser Offensive spielt natürlich Googles ChatGPT-Rivale Bard. Er wird nun in 180 weiteren Ländern öffentlich zugänglich gemacht und kann neu auf Japanisch und Koreanisch genutzt werden. Der Chatbot soll laut Google bis Ende des Jahres in den 40 weltweit meistgesprochenen Sprachen verfügbar sein. Auch vom dahinterliegenden Sprachmodell wurde eine neue Version präsentiert: PaLM 2, das dem Sprachmodell GPT-4 von OpenAI entgegengesetzt wird, beherrscht laut Google Mathematik, Coding, logisches Denken und mehrsprachige Übersetzung, womit es auch zur DeepL-Konkurrenz wird.

Google-Chatbot soll es auch mit DALL·E, Midjourney und Stable Diffusion aufnehmen

Und noch etwas soll Bard bald können: Bilder generieren. Damit wird eine Funktion, mit der Google in Konkurrenz zu DALL·E (ebenfalls OpenAI), Midjourney und Stable Diffusion tritt, direkt in den Chatbot integriert. Es ist nicht die einzige Ankündigung im Grafik-Bereich. Der KI-Bildgenerator wird auch in die neue Android-Version integriert, um individuelle Bildschirmhintergründe einstellen zu können. Und mit dem “Magic Editor” können zukünftig in den Google-Diensten Fotos mit KI-Unterstützung bearbeitet werden – Personen und Gegenstände können etwa entfernt oder in den Vorder- oder Hintergrund gerückt werden.

Macht Googles “Universal Translator” bald Synchronsprecher:innen arbeitslos?

Vom statischen zum bewegten Bild: Einen AI-Videogenerator zeigte Google diesmal noch nicht. Allerdings ein anderes Video-Tool mit großer Ansage. Der “Universal Translator” übersetzt die Sprachspur von Videos und gibt sie dann in einer gewählten Sprache mit der Stimme der übersetzten Person wieder – und zwar exakt Lippen-synchronisiert. Dabei ist es aber auch möglich, den Personen Worte in den Mund zu legen, die sie nie gesagt haben. Man sei sich der Missbrauchsmöglichkeit bewusst und integriere von Anfang an Features, um das zu verhindern, beteuert man beim Internetriesen.

MusicLM: “Gefühlvoller Jazz” vom AI-Algorithmus

Text, Bilder, Videos – was kann eine AI denn noch generieren? Google hat eine Antwort: Musik. MusicLM macht – analog zu Bild- und Videogeneratoren – Text-Prompts zu Musik. Man könne etwa einfach “gefühlvoller Jazz für eine Dinnerparty” eintippen und bekomme dann mehrere Versionen entsprechender AI-Songs zur Auswahl, heißt es dazu bei der Präsentation.

Ein “Sidekick” für Google Docs und vieles mehr

Und wofür kann man AI noch nutzen? Bei der Google I/O Keynote wurde noch eine ganze weitere Palette an KI-Features präsentiert. Künftig kann man etwa in Google Docs die “Sidekick”-Funktion nutzen, die KI-gestützt Tipps zur Texterstellung geben soll, und im “Project Tailwind” werden User:innen-Daten smart organisiert. Auch die klassische Suche, Google Maps, der Google Play Store und mehrere Produkte für Developer bekommen zusätzlich AI-basierte Funktionen. Daneben wurden bei der Keynote auch neue Betriebssystem-Versionen, Smartphones und Tablets präsentiert. Hier ein detaillierter Überblick von den Kolleg:innen von TechCrunch.