Ein chinesisches KI-Unternehmen sorgt für Wirbel in der Tech-Welt. Kann Deepseek die dominierenden Player aus dem Silicon Valley ins Wanken bringen?
Deepseek, ein 2023 gegründetes Unternehmen unter der Leitung des ehemaligen Hedgefonds-Managers Liang Wenfeng, hat mit seinen neuen KI-Modellen R1 und V3 weltweit Aufmerksamkeit erregt. Die beiden Modelle, die unter einer MIT-Lizenz veröffentlicht wurden, überzeugen durch ihre beeindruckende Leistung und eine kosteneffiziente Entwicklung.
Das Modell V3 übertrifft in einigen Benchmarks sogar GPT-4o und Claude 3.5, während das Reasoning-Modell R1 mit OpenAIs o1 konkurrieren kann. Besonders bemerkenswert: Die Trainingskosten lagen bei lediglich 5,6 Millionen US-Dollar, mit einem Einsatz von 2,78 Millionen GPU-Stunden – ein Bruchteil der Kosten vergleichbarer Modelle wie Metas Llama.
Zusätzlich hat Deepseek mit seiner Open-Source-Strategie und einer kostengünstigen Nutzung eine breite Nutzerbasis angesprochen. Die App des Unternehmens ist mittlerweile die meistgeladene im App-Store, beflügelt durch prominente Unterstützung von Großinvestoren wie Marc Andreessen. Auch die globale KI-Community zeigt Interesse: Yann LeCun von Meta lobte das Modell als „exzellent“, während Microsoft-CEO Satya Nadella auf die zunehmende Bedeutung der chinesischen KI-Entwicklung hinwies. KI-Experten betonen, dass Deepseek möglicherweise durch Ressourcenschonung und innovative Ansätze effizientere Modelle entwickelt hat.