11.05.2023

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

Bei der gestrigen Google I/O Keynote zeigte der Internetkonzern, dass er nicht vor hat, irgendwem anderen das AI-Feld zu überlassen.
/artikel/google-ki-offensive
Google CEO Sundar Pichai bei der Google I/O 2023 Keynote | (c) Google
Google CEO Sundar Pichai bei der Google I/O 2023 Keynote | (c) Google

Was haben ChatGPT, Midjourney und DeepL gemeinsam? Klar: Sie sind ausgesprochen populäre AI-Tools. Und noch was: Sie gehören alle drei nicht zu Google. Der eigentlich alles dominierende Riese ist zuletzt in der öffentlichen Wahrnehmung ins Hintertreffen geraten. Im KI-Bereich haben sich andere – allen voran OpenAI – die Pole Position gesichert. Doch das will der Internetkonzern natürlich nicht auf sich sitzen lassen. Bei der gestrigen Google I/O Keynote ließ man keinen Zweifel daran, dass eine Offensive auf ganzer Linie bereits begonnen hat.

Großer Rollout für ChatGPT-Rivale Bard

Eine zentrale Rolle in dieser Offensive spielt natürlich Googles ChatGPT-Rivale Bard. Er wird nun in 180 weiteren Ländern öffentlich zugänglich gemacht und kann neu auf Japanisch und Koreanisch genutzt werden. Der Chatbot soll laut Google bis Ende des Jahres in den 40 weltweit meistgesprochenen Sprachen verfügbar sein. Auch vom dahinterliegenden Sprachmodell wurde eine neue Version präsentiert: PaLM 2, das dem Sprachmodell GPT-4 von OpenAI entgegengesetzt wird, beherrscht laut Google Mathematik, Coding, logisches Denken und mehrsprachige Übersetzung, womit es auch zur DeepL-Konkurrenz wird.

Google-Chatbot soll es auch mit DALL·E, Midjourney und Stable Diffusion aufnehmen

Und noch etwas soll Bard bald können: Bilder generieren. Damit wird eine Funktion, mit der Google in Konkurrenz zu DALL·E (ebenfalls OpenAI), Midjourney und Stable Diffusion tritt, direkt in den Chatbot integriert. Es ist nicht die einzige Ankündigung im Grafik-Bereich. Der KI-Bildgenerator wird auch in die neue Android-Version integriert, um individuelle Bildschirmhintergründe einstellen zu können. Und mit dem „Magic Editor“ können zukünftig in den Google-Diensten Fotos mit KI-Unterstützung bearbeitet werden – Personen und Gegenstände können etwa entfernt oder in den Vorder- oder Hintergrund gerückt werden.

Macht Googles „Universal Translator“ bald Synchronsprecher:innen arbeitslos?

Vom statischen zum bewegten Bild: Einen AI-Videogenerator zeigte Google diesmal noch nicht. Allerdings ein anderes Video-Tool mit großer Ansage. Der „Universal Translator“ übersetzt die Sprachspur von Videos und gibt sie dann in einer gewählten Sprache mit der Stimme der übersetzten Person wieder – und zwar exakt Lippen-synchronisiert. Dabei ist es aber auch möglich, den Personen Worte in den Mund zu legen, die sie nie gesagt haben. Man sei sich der Missbrauchsmöglichkeit bewusst und integriere von Anfang an Features, um das zu verhindern, beteuert man beim Internetriesen.

MusicLM: „Gefühlvoller Jazz“ vom AI-Algorithmus

Text, Bilder, Videos – was kann eine AI denn noch generieren? Google hat eine Antwort: Musik. MusicLM macht – analog zu Bild- und Videogeneratoren – Text-Prompts zu Musik. Man könne etwa einfach „gefühlvoller Jazz für eine Dinnerparty“ eintippen und bekomme dann mehrere Versionen entsprechender AI-Songs zur Auswahl, heißt es dazu bei der Präsentation.

Ein „Sidekick“ für Google Docs und vieles mehr

Und wofür kann man AI noch nutzen? Bei der Google I/O Keynote wurde noch eine ganze weitere Palette an KI-Features präsentiert. Künftig kann man etwa in Google Docs die „Sidekick“-Funktion nutzen, die KI-gestützt Tipps zur Texterstellung geben soll, und im „Project Tailwind“ werden User:innen-Daten smart organisiert. Auch die klassische Suche, Google Maps, der Google Play Store und mehrere Produkte für Developer bekommen zusätzlich AI-basierte Funktionen. Daneben wurden bei der Keynote auch neue Betriebssystem-Versionen, Smartphones und Tablets präsentiert. Hier ein detaillierter Überblick von den Kolleg:innen von TechCrunch.

Deine ungelesenen Artikel:
12.06.2026

Ex-Microsoft-Engineer Nael Elagabani: „Unternehmen ähnlich wie überforderte Gehirne“

Der Wiener Nael Elagabani, ehemaliger Microsoft-Engineer, gründete gemeinsam mit Shadan Ajdari The Process Doctors (TPD), ein Startup, das das operative Betriebssystem AnchorOps für mittelständische Unternehmen im DACH-Raum entwickelte. Der Gründer nähert sich Unternehmen aus einer ungewöhnlichen, weil neurowissenschaftlichen, Sicht, wie er brutkasten erklärt.
/artikel/ex-microsoft-engineer-nael-elagabani-unternehmen-aehnlich-wie-ueberforderte-gehirne
12.06.2026

Ex-Microsoft-Engineer Nael Elagabani: „Unternehmen ähnlich wie überforderte Gehirne“

Der Wiener Nael Elagabani, ehemaliger Microsoft-Engineer, gründete gemeinsam mit Shadan Ajdari The Process Doctors (TPD), ein Startup, das das operative Betriebssystem AnchorOps für mittelständische Unternehmen im DACH-Raum entwickelte. Der Gründer nähert sich Unternehmen aus einer ungewöhnlichen, weil neurowissenschaftlichen, Sicht, wie er brutkasten erklärt.
/artikel/ex-microsoft-engineer-nael-elagabani-unternehmen-aehnlich-wie-ueberforderte-gehirne
AnchorOps, The Process Doctors
© zVg - Shadan Ajdari (l.) und Nael Elagabani.

Viele Unternehmen beschäftigen sich derzeit mit KI, Automatisierung und neuen Cloud-Technologien. Für Nael Elagabani, der gemeinsam mit Shadan Ajdari The Process Doctors (TPD) gründete, liegt die eigentliche Herausforderung jedoch an einer anderen Stelle. Der ehemalige Neurowissenschaftler und spätere Microsoft-Cloud-Engineer ist überzeugt, dass viele Unternehmen zunächst ihre operativen Abläufe verstehen und strukturieren müssen, bevor neue Technologien ihr volles Potenzial entfalten können.

AnchorOps als eine Art „Brain“

Ihre Lösung AnchorOps ist ein Ansatz, der die Art und Weise verändern soll, wie Unternehmen ihre internen Abläufe organisieren und digitale Technologien einsetzen. Im Zentrum steht das Konzept eines sogenannten „Company Brain“ – eines operativen Unternehmenssystems, das Prozesse, Mitarbeiteraktivitäten und technische Systeme miteinander verbinden und so Transparenz, Steuerbarkeit und Skalierbarkeit erhöhen soll.

Elagabani und Ajdari verfolgen dabei eine Sichtweise, die bewusst nicht mit Technologie beginnt, sondern mit der Struktur des Unternehmens selbst. Erst wenn diese stabil und nachvollziehbar ist, sollen Automatisierung, Cloud-Systeme und KI-Technologien darauf aufbauen.

Microsoft und UNO

Elagabani selbst verbrachte rund 20 Jahre in der Forschung und beschäftigte sich dabei mit Gedächtnisprozessen – zunächst mit immunologischem Gedächtnis, später mit Lern- und Gedächtnisvorgängen im Gehirn. Nach seinem Wechsel in die Betriebsentwicklung und die Computational Sciences arbeitete er mit Startups, als Unternehmensberater und später bei Microsoft. Dort war er Teil eines Pilotprogramms, das Prozesse in der Kundenbetreuung rund um Cloud-Technologien neu aufsetzen sollte. „Der Betrieb ist das, was das Unternehmen stabilisiert“, sagt er. „Ich habe dort gesehen, dass selbst in großen Organisationen die größten Herausforderungen nicht nur technischer Natur sind, sondern vor allem in der Struktur von Prozessen und Entscheidungen liegen.“

Aus diesen Erfahrungen entstand zunächst die Idee zu The Process Doctors (TPD) und später zu AnchorOps. Nach seiner Rückkehr nach Wien arbeitete Elagabani unter anderem an mehreren Sovereign-Cloud-Projekten für Einrichtungen der Vereinten Nationen. Dort testete er einen Ansatz, bei dem Prozesse und operative Abläufe im Mittelpunkt stehen. Gemeinsam mit Mitgründer Ajdari entwickelte er daraus das aktuelle Konzept.

From Neuroscience to Business

Die theoretische Grundlage stammt dabei aus der Neurowissenschaft. Elagabani betrachtet Unternehmen als komplexe Systeme, die ähnlich funktionieren wie ein Nervensystem. Informationen, Prozesse und Entscheidungen müssten miteinander verbunden sein, damit ein Unternehmen effizient arbeiten könne. Werden Informationen nicht richtig weitergegeben, entstünden Reibungsverluste, die sich unter anderem in langsamen Entscheidungen, doppelter Arbeit, manuellen Übergaben oder voneinander getrennten Datensilos zeigen können. Ziel von AnchorOps sei es, solche Engpässe sichtbar zu machen und in einer operativen Cloud-Architektur abzubilden.

„Unternehmen verhalten sich neurobiologisch erschreckend ähnlich wie überforderte Gehirne. Wachstum verstärkt keine Ordnung, sondern Instabilität“, sagt Elagabani. Aus dieser Perspektive entstehen typische Probleme nicht primär durch fehlende Tools, sondern vor allem durch mangelnde operative Klarheit. „Wenn Informationen nicht richtig fließen, reagiert das System wie ein überlastetes Nervensystem.“

Cloud-Architektur

Ziel der beiden Founder ist es nicht, einzelne Tools zu ersetzen, sondern die operative Realität eines Unternehmens sichtbar und steuerbar zu machen. Dadurch entsteht eine Art „organisatorisches Nervensystem“, das Informationen strukturiert weitergibt und Entscheidungswege nachvollziehbar mache.

Ein zentraler Bestandteil ist dabei die sogenannte operative Cloud-Architektur. Sie bildet die Grundlage, auf der weitere Technologien wie Automatisierung oder KI-Agenten aufsetzen können „Wir gehen bewusst schrittweise vor“, erklärt Elagabani. „Viele Unternehmen versuchen direkt KI einzuführen, ohne dass ihre Prozesse stabil sind. Unser Ansatz ist: zuerst Struktur, dann Technologie.“

AnchorOps: Zielgruppe kleine und mittlere Unternehmen

Aktuell richtet sich AnchorOps gezielt an kleine und mittlere Unternehmen, um operative Strukturen sichtbar zu machen und schrittweise in eine digitale Architektur zu überführen.
„Wir suchen nicht Kunden, sondern Partner“, betont der Neurospezialist. „Wenn das Fundament steht, beginnt die eigentliche Arbeit. Dann entwickeln wir die operative Struktur gemeinsam weiter – Schritt für Schritt.“

Ajdari ergänzt: „Wir sind sehr daran interessiert, zuerst die Grundlagen sauber aufzubauen, bevor KI eingesetzt wird. KI ist für uns dabei ein zusätzlicher Layer, der erst aufgesetzt wird, wenn ein stabiles Fundament und klar definierte, smarte Prozesse vorhanden sind. Was bei Großkonzernen ein mindestens sechsstelliges Vorhaben ist, setzen wir für den Mittelstand kostengünstiger um. Unser Computationsmodell generiert auf Basis der AnchorOps-Daten verschiedene Zukunftsszenarien, probabilistisch statt deterministisch, und leitet daraus konkrete, umsetzbare Handlungsempfehlungen – sogenannte Prescriptions – ab. Diese Szenarien bleiben dabei nicht abstrakt, sondern werden visuell und als Skizzen so aufbereitet, dass sie intuitiv verständlich und direkt nutzbar sind.“

Computational-Modell

Parallel zur Entwicklung des „Company Brain“ arbeiten Elagabani und Ajdari an einem eigenen Computational-Modell. Dieses soll die operative Realität eines Unternehmens mathematisch abbilden und simulieren können. Ziel ist es hier, zusätzliche Ebenen der Analyse zu ermöglichen, die über klassische KI-Systeme hinausgehen. Das Modell soll künftig perspektivisch als Erweiterung in AnchorOps integriert werden und Unternehmen helfen, ihre operativen Strukturen noch besser zu verstehen.

The Process Doctors ist derzeit eigenfinanziert und befindet sich in Gesprächen mit potenziellen Pilotkunden sowie Investoren. Für die Gründer steht dabei vor allem die Skalierung der Methode im Mittelstand im Vordergrund. Langfristig wollen sie Unternehmen dabei unterstützen, ihre digitale Transformation auf einer stabilen operativen Grundlage aufzubauen – und damit den Zugang zu Technologien zu ermöglichen, die bislang vor allem Großkonzernen vorbehalten waren.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

AI-Musik bis Video-Synchronisation: Google präsentierte große KI-Offensive