11.05.2023

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

Bei der gestrigen Google I/O Keynote zeigte der Internetkonzern, dass er nicht vor hat, irgendwem anderen das AI-Feld zu überlassen.
/artikel/google-ki-offensive
Google CEO Sundar Pichai bei der Google I/O 2023 Keynote | (c) Google
Google CEO Sundar Pichai bei der Google I/O 2023 Keynote | (c) Google

Was haben ChatGPT, Midjourney und DeepL gemeinsam? Klar: Sie sind ausgesprochen populäre AI-Tools. Und noch was: Sie gehören alle drei nicht zu Google. Der eigentlich alles dominierende Riese ist zuletzt in der öffentlichen Wahrnehmung ins Hintertreffen geraten. Im KI-Bereich haben sich andere – allen voran OpenAI – die Pole Position gesichert. Doch das will der Internetkonzern natürlich nicht auf sich sitzen lassen. Bei der gestrigen Google I/O Keynote ließ man keinen Zweifel daran, dass eine Offensive auf ganzer Linie bereits begonnen hat.

Großer Rollout für ChatGPT-Rivale Bard

Eine zentrale Rolle in dieser Offensive spielt natürlich Googles ChatGPT-Rivale Bard. Er wird nun in 180 weiteren Ländern öffentlich zugänglich gemacht und kann neu auf Japanisch und Koreanisch genutzt werden. Der Chatbot soll laut Google bis Ende des Jahres in den 40 weltweit meistgesprochenen Sprachen verfügbar sein. Auch vom dahinterliegenden Sprachmodell wurde eine neue Version präsentiert: PaLM 2, das dem Sprachmodell GPT-4 von OpenAI entgegengesetzt wird, beherrscht laut Google Mathematik, Coding, logisches Denken und mehrsprachige Übersetzung, womit es auch zur DeepL-Konkurrenz wird.

Google-Chatbot soll es auch mit DALL·E, Midjourney und Stable Diffusion aufnehmen

Und noch etwas soll Bard bald können: Bilder generieren. Damit wird eine Funktion, mit der Google in Konkurrenz zu DALL·E (ebenfalls OpenAI), Midjourney und Stable Diffusion tritt, direkt in den Chatbot integriert. Es ist nicht die einzige Ankündigung im Grafik-Bereich. Der KI-Bildgenerator wird auch in die neue Android-Version integriert, um individuelle Bildschirmhintergründe einstellen zu können. Und mit dem “Magic Editor” können zukünftig in den Google-Diensten Fotos mit KI-Unterstützung bearbeitet werden – Personen und Gegenstände können etwa entfernt oder in den Vorder- oder Hintergrund gerückt werden.

Macht Googles “Universal Translator” bald Synchronsprecher:innen arbeitslos?

Vom statischen zum bewegten Bild: Einen AI-Videogenerator zeigte Google diesmal noch nicht. Allerdings ein anderes Video-Tool mit großer Ansage. Der “Universal Translator” übersetzt die Sprachspur von Videos und gibt sie dann in einer gewählten Sprache mit der Stimme der übersetzten Person wieder – und zwar exakt Lippen-synchronisiert. Dabei ist es aber auch möglich, den Personen Worte in den Mund zu legen, die sie nie gesagt haben. Man sei sich der Missbrauchsmöglichkeit bewusst und integriere von Anfang an Features, um das zu verhindern, beteuert man beim Internetriesen.

MusicLM: “Gefühlvoller Jazz” vom AI-Algorithmus

Text, Bilder, Videos – was kann eine AI denn noch generieren? Google hat eine Antwort: Musik. MusicLM macht – analog zu Bild- und Videogeneratoren – Text-Prompts zu Musik. Man könne etwa einfach “gefühlvoller Jazz für eine Dinnerparty” eintippen und bekomme dann mehrere Versionen entsprechender AI-Songs zur Auswahl, heißt es dazu bei der Präsentation.

Ein “Sidekick” für Google Docs und vieles mehr

Und wofür kann man AI noch nutzen? Bei der Google I/O Keynote wurde noch eine ganze weitere Palette an KI-Features präsentiert. Künftig kann man etwa in Google Docs die “Sidekick”-Funktion nutzen, die KI-gestützt Tipps zur Texterstellung geben soll, und im “Project Tailwind” werden User:innen-Daten smart organisiert. Auch die klassische Suche, Google Maps, der Google Play Store und mehrere Produkte für Developer bekommen zusätzlich AI-basierte Funktionen. Daneben wurden bei der Keynote auch neue Betriebssystem-Versionen, Smartphones und Tablets präsentiert. Hier ein detaillierter Überblick von den Kolleg:innen von TechCrunch.

Deine ungelesenen Artikel:
25.09.2024

Der geklonte Manager: Ein KI-Selbstversuch

Vor einem Jahr startete Martin Giesswein, Digitalisierungsexperte und langjähriger Vortragender der WU Executive Academy, ein Experiment: Er wollte sich als Führungskraft und Unternehmer durch Künstliche Intelligenz überflüssig machen. Für die wichtigsten Aufgaben seines beruflichen Alltags wählte er die aktuelle KI-Tools aus und überließ ihnen die Arbeit. Das kam dabei heraus…
/artikel/der-geklonte-manager-ein-ki-selbstversuch
25.09.2024

Der geklonte Manager: Ein KI-Selbstversuch

Vor einem Jahr startete Martin Giesswein, Digitalisierungsexperte und langjähriger Vortragender der WU Executive Academy, ein Experiment: Er wollte sich als Führungskraft und Unternehmer durch Künstliche Intelligenz überflüssig machen. Für die wichtigsten Aufgaben seines beruflichen Alltags wählte er die aktuelle KI-Tools aus und überließ ihnen die Arbeit. Das kam dabei heraus…
/artikel/der-geklonte-manager-ein-ki-selbstversuch
KI, Giesswein, WU Academy, Selbstversuch
(c) WU Executive Academy/Canva - Martin Giesswein, Digitalisierungsexperte und Vortragender der WU Executive Academy.

Mitarbeitergespräche mit KI-Coaching

Gespräche sind wichtig und nehmen viel Zeit in Anspruch. Da möchte ich alles richtig machen. Vor schwierigen Gesprächen habe ich mich von Sprach-KIs coachen lassen, meist während meiner Zug- und Autofahrten. Die KI simulierte anhand meiner Beschreibungen das Gesprächsverhalten des jeweiligen Kollegen und gab mir Anregungen für eine motivierende Gesprächsführung und effektive Fragetechniken. Auch ich selbst stehe mit dem Wissen aus meinen Büchern als Chat-KI für meine Kollegen und Klienten zur Verfügung. Verwendete Tools: character.ai, pi.ai, HalloSpohia.com

Meetings ohne mich

Einen großen Teil meiner Zeit beanspruchten Online-Meetings, bei denen ich aber keine fachliche Hauptrolle hatte. Ich schickte im Vorfeld einer Videokonferenz nur mehr meine Agenda-Punkte und einen KI-Klon, der mich während den Meetings ersetzte – ich selbst blieb aber immer öfter fern. Hierbei, zur Erklärung, hackt sich eine AI in den eigenen Kalender hinein und ein Klon bzw. ein Bot wählt sich folglich ins Meeting und tritt wie ein User auf.

Meine menschlichen Kollegen diskutierten, erarbeiteten Lösungen und verteilten Aufgaben – ohne mein physisches Zutun. Wenige Minuten nach den Meetings hatte ich eine KI-Zusammenfassung des Gesagten und die zugewiesenen Tasks in meinem Posteingang. Um eine korrekte To-Do-Liste zu erhalten, muss das Gespräch im Meeting aber strukturiert ablaufen. Mit klaren Ansagen, wie Martin bitte erstelle mir den Bericht bis Freitag. Verwendete Tools: Fireflies, Sembly, MS Teams mit Co-Pilot, apollo.ai.

Schneller Vorträge, Konzepte und Präsentationen erstellen

Wann immer ich einen guten Business-Gedanken hatte, sprach ich die frischen Ideen in mein Smartphone und ließ die Texte von der KI transkribieren (verwendetes Tool: sonix). Die spätere detaillierte Recherche zum Thema wurde mir durch perplexity.ai erleichtert. Diese KI gibt zu jedem ihrer Vorschläge einen Weblink an. So konnte ich schnell die Quelle und die Richtigkeit überprüfen. Die von mir definierten Inhalte lud ich in KI-Tools wie Gamma.ai oder PowerPoint mit Co-Pilot und sparte so in der Regel 1-2 Stunden pro Präsentation oder Vortragstext.

Abbau von Datensilos: Ein ERP an einem Sonntag

Zusammen mit einem Logistikunternehmen stellte sich mein Team der Herausforderung, die Funktionen ihres Bestell- und Liefersystems mit Hilfe von KI nachzubilden. An einem einzigen Sonntag konfigurierten wir ein rudimentäres ERP-System mit ChatGPT von openai. Dieses war in der Lage, Kunden über Lieferzeiten und Produktverfügbarkeit zu informieren und sogar Ersatzprodukte je nach Lagerbestand vorzuschlagen. Um die Aufgabe bewusst komplexer zu gestalten, verteilten wir die Daten auf drei verschiedene Datenbanken. Trotz dieser Hürde hat die generative KI alle Kundenanfragen korrekt beantwortet. Diese “synthetische KI” birgt enormes Potenzial, um die leidigen Datensilos in unseren Unternehmen zu überwinden.

Team-Building mit KI

Statt Flöße zu bauen und über Teiche zu paddeln, haben wir uns für ein KI-gestütztes Teambuilding entschieden. Mit Hilfe von Midjourney, RunwayML und Suno verwandelten wir uns in kurzen Videos im Marvel-Stil in Superhelden, inklusive passendem KI-Soundtrack. Neben dem Teamgeist wurde so auch jede Menge KI-Know-how geschaffen – und: der Spaß kam nicht zu kurz.

Geschäftsführer-Betrug (CEO-Fraud) 2.0

Um das Thema Betrugsversuche mit Hilfe von KI zu beleuchten, habe ich in Trainings an der WU Executive Academy meinen täuschend echt wirkenden KI-Avatar mit geklonter Stimme eingesetzt (verwendetes Tool: heygen). Gemischt mit echten Videos von mir mussten die Teilnehmenden ihre detektivischen Fähigkeiten unter Beweis stellen und die gefälschten Versionen entlarven. Auch wenn Videokonferenzsysteme immer mehr Sicherheit bei der Identifizierung bieten: Letztendlich müssen wir Menschen entscheiden, ob unser Gegenüber ein Mensch oder ein Betrüger mit KI-Unterstützung ist.

Ich habe es den Studierenden nicht allzu schwer gemacht und bewusst einmal meine Hand vor dem Mund gehalten. Die KI-generierte Mundpartie wurde dann vor der Hand angezeigt, was ein Zeichen für einen Deepfake ist. Ich empfehle hier genau auf die Stimme zu hören, wobei es Programme gibt, die die österreichische Aussprache sehr gut umsetzen. Künftig wird man die Identifizierung über die IP-Adresse oder Biometrie angehen müssen, um zu sehen, ob das Video echt ist.

Fazit: Bin ich nun als Manager ersetzbar?

Die KI hat mich nicht ersetzt, aber meine Produktivität wurde massiv gesteigert. Obwohl die eingesetzten Systeme (noch) nicht perfekt sind, habe ich im letzten Jahr durchschnittlich 5 Stunden pro Woche eingespart. Zeit, die ich für mein Unternehmen oder meine Familie nutzen konnte. Bis die KI einen Manager oder eine Führungskraft gänzlich ersetzen kann, wird es noch lange dauern. Aber einzelne Managementaufgaben übernimmt Künstliche Intelligenz schon heute – und das in einer erstaunlichen Qualität.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive