✨ AI Kontextualisierung
Große KI-Sprachmodelle entstehen in der Regel in gut finanzierten Forschungslabors mit umfangreichen Rechenressourcen. In Wien ist nun ein Projekt vorgestellt worden, das diesem Muster widerspricht. Mit Noeum wurde ein kompaktes KI-Sprachmodell veröffentlicht, das in Benchmark-Vergleichen mit internationalen Modellen der sogenannten Nano-Kategorie mithalten kann.
Entwickelt wurde Noeum vom in Wien ansässigen KI-Forscher Bledar Ramo. Das Projekt entstand bislang ohne institutionelle Förderung, Risikokapital oder ein Team. Nach Angaben des Entwicklers handelt es sich um eine vollständig eigenfinanzierte Forschungsinitiative.
Entwicklung außerhalb etablierter Strukturen
Noeum befinde sich aktuell in einer frühen Forschungsphase, eine formale Unternehmensstruktur existiere noch nicht, ebenso wenig ein erweitertes Entwicklerteam. Die bisher angefallenen direkten Kosten beziffert Ramo auf rund 2.000 Euro, vor allem für Rechenleistung und Serverinfrastruktur.
„Das Projekt ist derzeit vollständig eigenfinanziert und wurde ausschließlich von mir selbst entwickelt“, erklärt Ramo. Perspektivisch werde jedoch geprüft, ob und in welcher Form sich daraus ein Startup entwickeln lasse.
Nano-Modell als technischer Nachweis
Die aktuell veröffentlichte Version trägt den Namen Noeum-1-Nano. Dabei handelt es sich um ein besonders kleines Sprachmodell, das auf Effizienz und lokale Ausführung ausgelegt ist. Solche Modelle werden häufig dort eingesetzt, wo Rechenressourcen begrenzt sind oder Daten nicht in externe Cloud-Infrastrukturen ausgelagert werden sollen.
Noeum-1-Nano wurde mit mehreren internationalen Modellen ähnlicher Größe verglichen, darunter Qwen 0.5B, TinyLlama und BLOOM-1B. In diesen Vergleichen erreichte das Wiener Modell laut Ramo in zwei Benchmark-Kategorien den ersten Platz und zeigte insgesamt eine konkurrenzfähige Leistung, obwohl es mit deutlich weniger Trainingsdaten und Rechenbudget trainiert wurde.
Das Nano-Modell sei dabei vor allem als Machbarkeitsnachweis zu verstehen. Ziel sei es, zu zeigen, dass sich leistungsfähige Sprachmodelle auch mit begrenzten Mitteln entwickeln lassen.
Fokus auf Effizienz und Verlässlichkeit
Inhaltlich setzt Noeum weniger auf Größe als auf Effizienz und Zuverlässigkeit. Geplant seien zusätzliche technische Mechanismen, die insbesondere für fachlich anspruchsvolle oder sicherheitskritische Anwendungen relevant sein sollen. Dazu zählen Verifikationsschichten für technisch-naturwissenschaftliche Antworten sowie sogenannte rekursive Reasoning-Architekturen, die Fehler während der Inferenz erkennen und korrigieren sollen.
Nach Einschätzung des Entwicklers fehlen solche Mechanismen bei vielen heute verbreiteten Sprachmodellen, was deren Einsatz in sensiblen Bereichen einschränke. Entsprechend richtet sich Noeum nicht primär an den Massenmarkt, sondern an spezialisierte Anwendungen.
Lokale KI für sensible Einsatzbereiche
Noeum ist Open Source und so konzipiert, dass es vollständig ohne Cloud-Anbindung betrieben werden kann. Das sei insbesondere für Branchen relevant, in denen Datenschutz, geistiges Eigentum oder regulatorische Anforderungen eine zentrale Rolle spielen.
Als mögliche Einsatzfelder nennt Ramo unter anderem Pharma, Logistik und Verteidigung. In diesen Bereichen werde zunehmend nach KI-Systemen gesucht, die auch in abgeschotteten oder instabilen Netzumgebungen zuverlässig funktionieren.
„Gerade diese Branchen benötigen On-Device-Intelligenz, um vollständige Datensouveränität zu gewährleisten“, so Ramo.
Nächste Schritte noch offen
Langfristig ist vorgesehen, auf Basis von Noeum ein größeres, voll skaliertes Modell zu entwickeln. Dieses soll multimodal, mehrsprachig und mit erweiterten Reasoning-Funktionen ausgestattet sein. Für die Umsetzung dieses Schritts wären jedoch zusätzliche Ressourcen notwendig.










