Google treibt die KI-gestützte Dateianalyse weiter voran – und das mit einem ganz neuen Fundament. Mit Magika 1.0 kommt die erste stabile Version des Tools, das jetzt komplett in Rust entwickelt wurde. Doch was macht das Update so besonders?
Magika ist nicht einfach ein weiteres Entwicklerwerkzeug, sondern ein leistungsfähiger Helfer, der über 200 verschiedene Dateiformate automatisch erkennt – doppelt so viele wie zuvor. Durch die Rust-Implementierung hat Google das System deutlich beschleunigt: Auf einem MacBook Pro mit M4-Chip verarbeitet Magika rund 1000 Dateien pro Sekunde. Die Kombination aus ONNX Runtime für die KI-Inferenz und Tokio für asynchrone Verarbeitung sorgt für einen schnellen, stabilen Workflow – ganz gleich ob über die Kommandozeile oder via Module in Python und TypeScript.
Besonders spannend ist die Erweiterung der unterstützten Formate: Von Jupyter Notebooks über NumPy-Arrays und PyTorch-Modelle bis hin zu modernen Programmiersprachen wie Swift, Kotlin oder Solidity deckt Magika ein breites Spektrum ab. Auch feine Unterschiede zwischen JSON und JSONL oder C und C++ werden nun erkannt. Für die neuen Fähigkeiten musste Google den Trainingsdatensatz auf mehr als 3 Terabyte erweitern – und sogar das hauseigene Gemini-Modell einsetzen, um synthetische Trainingsdaten zu erzeugen.
Mit Magika 1.0 liefert Google ein universelles Werkzeug für Entwickler, das sich nahtlos in bestehende Projekte auf Linux, macOS und Windows integrieren lässt. Kein Wunder also, dass das Projekt inzwischen über eine Million Downloads pro Monat zählt.
