Offenes KI-Modell von Google

Google veröffentlicht Gemma 4 12B

Google Gemma
Bildquelle. Google

Google hat das offene KI-Modell Gemma 4 12B vorgestellt, das mit 12 Milliarden Parametern und ohne Cloud-Infrastruktur lokal auf Laptops läuft.

Der US-amerikanische Technologiekonzern Google hat mit Gemma 4 12B ein neues offenes Künstliche-Intelligenz-Modell eingeführt. Das System verfügt über 12 Milliarden Parameter und ist speziell dafür konzipiert, vollständig lokal auf Notebooks ausgeführt zu werden. Dadurch entfällt für Anwender die dauerhafte Abhängigkeit von einer externen Cloud-Infrastruktur oder entfernten Rechenzentren. Nach Angaben des Herstellers erzielt das kompakte Modell eine Leistungsfähigkeit, die nahe an die Ergebnisse deutlich größerer KI-Systeme heranreicht, während zeitgleich der Speicherbedarf signifikant reduziert wurde.

Anzeige

Für den lokalen Betrieb von Gemma 4 12B reicht eine Hardware-Ausstattung mit 16 Gigabyte Videospeicher (VRAM) aus. Diese Reduzierung der technischen Mindestanforderungen soll fortschrittliche KI-Anwendungen für Software-Entwickler, Forscher und Unternehmen breiter zugänglich machen. Die Veröffentlichung folgt einem anhaltenden Branchentrend, rechenintensive KI-Modelle direkt auf Endgeräten von Nutzern bereitzustellen.

Multimodale Fähigkeiten und Apache-Lizenzierung von Google Gemma 4 12B

Gemma bildet die Produktfamilie offener KI-Modelle von Google, welche auf den technologischen Grundlagen und Forschungsergebnissen des hauseigenen Gemini-Programms aufbaut. Im Gegensatz zu traditionellen KI-Systemen, die ausschließlich auf die Verarbeitung und Generierung von Texten beschränkt sind, handelt es sich bei Gemma 4 12B um ein multimodales Modell. Die Software kann verschiedene Arten von Informationen nativ verarbeiten und verstehen. Dazu gehören neben Texten auch visuelle Inhalte wie Bilder sowie Audio-Eingaben. Zudem ist das Modell in der Lage, komplexe logische Schlussfolgerungen zu ziehen.

Dieser erweiterte Funktionsumfang ermöglicht den Einsatz in unterschiedlichen Anwendungsbereichen, wie der automatisierten Software-Entwicklung, der Erstellung von Medieninhalten, wissenschaftlichen Recherchen und industriellen Automatisierungsprozessen. Google stellt das Modell unter der quelloffenen Apache 2.0-Lizenz zur Verfügung. Diese kommerziell freizügige Lizenzierung erlaubt es externen Entwicklern und Organisationen, das Modell mit wenigen rechtlichen Einschränkungen kostenfrei zu nutzen, zu modifizieren und in eigenen Infrastrukturen bereitzustellen.

Anzeige

Effizienzsteigerung durch vereinheitlichte Systemarchitektur

Die wesentliche technologische Neuerung von Gemma 4 12B liegt in seiner veränderten internen Systemarchitektur. Klassische multimodale KI-Systeme nutzen in der Regel separate, vorgeschaltete Software-Komponenten, sogenannte Encoder, um Bilder, Töne und Texte unabhängig voneinander zu verarbeiten, bevor die Datenströme im Kernmodell zusammengeführt werden.

Google hat bei der Entwicklung von Gemma 4 12B diese separaten multimodalen Encoder vollständig entfernt. Stattdessen verarbeitet das Modell die unterschiedlichen Informationstypen über eine einzige, vereinheitlichte Architektur. Durch diesen Verzicht auf zusätzliche Verarbeitungsschritte wird die Effizienz bei der Datenberechnung gesteigert, während gleichzeitig der Bedarf an Arbeitsspeicher und der allgemeine Rechenaufwand sinken. Das Endergebnis ist ein kompaktes Modell, das komplexe multimodale Fähigkeiten bietet, aber klein genug bleibt, um auf moderner Standard-Hardware ohne Cloud-Anbindung stabil zu laufen.

Autorenbild Lisa Löw

Lisa

Löw

Junior Online-Redakteurin

IT-Verlag

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.