Baidu veröffentlicht ERNIE 4.5 und ERNIE X1: Ein Wendepunkt in der KI-Demokratisierung?
Am 16. März 2025 hat sich in der Welt der künstlichen Intelligenz ein bemerkenswerter Wendepunkt ereignet. Der chinesische Technologieriese Baidu veröffentlichte zwei neue KI-Modelle: ERNIE 4.5 und ERNIE X1. Das Besondere daran? Beide Modelle sind in ihrer Basisversion kostenlos verfügbar. Dieser Schritt könnte der Beginn einer neuen Ära in der Demokratisierung fortschrittlicher KI-Technologien sein.
ERNIE 4.5: Das multimodale Foundation Model
ERNIE 4.5 ist ein sogenanntes multimodales Foundation Model. Es verarbeitet nicht nur Text, sondern auch Bilder und möglicherweise Audio gleichzeitig. Das bedeutet, dass ERNIE 4.5 verschiedene Arten von Daten (Modalitäten) integrieren und gemeinsam interpretieren kann. Ein Beispiel wäre die Analyse eines Diagramms mitsamt begleitendem Text – das Modell versteht beide Informationsquellen im Kontext.
Besonders hervorgehoben werden seine:
- Verbesserten Sprachfähigkeiten
- Logischen Denkfähigkeiten
- Textgenerierung auf hohem Niveau
- Emotionale Intelligenz (EQ), was dem Modell ermöglicht, Satire und kulturelle Feinheiten zu erfassen.
Diese Kombination könnte es ermöglichen, Anwendungen zu entwickeln, die komplexe Daten verarbeiten, wie z. B. Röntgenbilder in Verbindung mit Patientenakten oder umfassende Finanzanalysen.
ERNIE X1: Deep Thinking für komplexe Aufgaben
Während ERNIE 4.5 auf Vielseitigkeit setzt, wurde ERNIE X1 als Deep Thinking Model konzipiert. Es ist auf logisches Denken, komplexes Reasoning und mehrstufige Problemlösungen spezialisiert. Laut Baidu soll es sich besonders bei:
- Mathematischen Herausforderungen
- Logischen Schlussfolgerungen
- Multitask-Verständnis
auszeichnen. ERNIE X1 wird unter anderem mit DeepSeek v3, ChatGPT 4.0 und sogar GPT 4.5 verglichen. Besonders beeindruckend: In Benchmarks wie CMMLU (Chinese Massive Multitask Language Understanding) und Math 500 soll es besser abschneiden als GPT 4.5.
Beeindruckende Benchmarks – aber mit Vorsicht zu genießen
Baidu veröffentlichte beeindruckende Benchmark-Ergebnisse:
- ERNIE 4.5 erzielt 77,77 % bei multimodalen Aufgaben (im Vergleich zu 73,92 % bei GPT 4.0)
- Im DocVQA-Test erreicht es angeblich über 90 %
ERNIE X1 wird mit einer Benchmark-Bewertung von 79,14 % beworben. Besonders in chinesischen Anwendungen und komplexer Mathematik zeigt es laut Baidu starke Leistungen.
Wichtig: Diese Zahlen stammen von Baidu selbst. Unabhängige Überprüfungen stehen noch aus.
Preisgestaltung: Kampfansage an die Konkurrenz
Die Preise könnten den Markt nachhaltig verändern:
- ERNIE 4.5: ab 0,55 USD pro 1 Million Token
- ERNIE X1: 28 USD pro 1 Million Token
Zum Vergleich: Baidu behauptet, dass ERNIE 4.5 nur 1 % des Preises von GPT 4.5 kostet. Besonders attraktiv sind die extrem niedrigen Input- und Output-Kosten, die bei 0,4 Yuan (Input) bzw. 0,16 Yuan (Output) pro 1.000 Token liegen.
Demokratisierung der KI oder strategisches Kalkül?
Baidu spricht von einer Demokratisierung der KI. Mit kostenlosen Modellen will das Unternehmen Barrieren abbauen und Entwicklern sowie Forschern weltweit Zugang zu hochentwickelter KI ermöglichen. Beispielgeschichten wie die von Siri, einer Forscherin in Indonesien, oder Arty, einem Entwickler in Jakarta, unterstreichen diese Vision – auch wenn sie vermutlich PR-getrieben sind.
Dennoch könnten kostenlose KI-Modelle gerade in Regionen mit begrenzten Ressourcen transformative Auswirkungen haben. Forscher, kleine Unternehmen und Bildungseinrichtungen könnten endlich KI-Lösungen nutzen, die bisher unerschwinglich waren.
Konkurrenzdruck und der chinesische KI-Wettlauf
Baidus Offensive fügt sich in einen größeren Trend:
- Tencent veröffentlichte ein schnelles Sprachmodell
- Alibaba kooperiert mit Apple und plant Milliardeninvestitionen in KI
- ByteDance baut Chatbots und KI-Tools aus
Die chinesische Regierung fördert KI-Zentren und Subventionen, mit dem Ziel, die KI-Industrie bis 2028 auf 811 Milliarden Yuan zu steigern.
Risiken und Herausforderungen
Trotz aller Euphorie gibt es offene Fragen:
- Kann Baidu den kostenlosen Zugang dauerhaft aufrechterhalten?
- Die Infrastruktur (Webseite, Zugriff) ist aktuell hauptsächlich auf Chinesisch ausgerichtet, was die internationale Nutzung erschwert.
- Die Antwortgeschwindigkeit ist langsamer als bei ChatGPT.
- Erste Tests zeigten, dass ERNIE X1 bei der Erstellung von Spielen (wie dem Snake-Game) gut abschneidet, aber manchmal mehrere Anläufe braucht.
Open Source ab Juni 2025: Ein neuer Meilenstein?
Ab dem 30. Juni 2025 will Baidu einige seiner ERNIE-Modelle als Open Source zur Verfügung stellen – ein Schachzug, der den Wettbewerb weiter anheizen dürfte. Entwickler weltweit könnten damit eigene Anwendungen auf Basis dieser Modelle erstellen, ohne Lizenzkosten zahlen zu müssen.
Fazit: Ein Wendepunkt in der KI-Welt?
Der 16. März 2025 könnte als Wendepunkt in die KI-Geschichte eingehen – als Tag, an dem Baidu zeigte, dass hochentwickelte KI nicht zwingend teuer sein muss. Doch auch strategische Interessen spielen eine Rolle. Kostenlose Basisfunktionen könnten langfristig durch Premium-Services ergänzt werden. Die nächsten Monate werden zeigen, wie nachhaltig Baidus Ansatz wirklich ist und wie Konkurrenten reagieren.
Eines steht fest: Diese Entwicklung hat das Potenzial, den Zugang zu KI-Technologien weltweit grundlegend zu verändern.
Hat dir der Beitrag gefallen? Dann empfehle ihn gerne auf der Plattform deines Vertrauens weiter. Wir lesen uns beim nächsten Mal, bis dahin, bleib real!