DeepSeek: Alles, was Sie über die KI-Chatbot-App wissen müssen

DeepSeek ist viral gegangen.
Das chinesische KI-Labor DeepSeek ist diese Woche ins öffentliche Bewusstsein gerückt, nachdem seine Chatbot-App an die Spitze der Charts im Apple App Store ( und auch im Google Play Store ) gelangte. Die KI-Modelle von DeepSeek, die mit recheneffizienten Techniken trainiert wurden, haben Wall-Street-Analysten – und Technologen – dazu veranlasst, sich zu fragen, ob die USA ihre Führung im KI-Rennen halten können und ob die Nachfrage nach KI-Chips anhalten wird.
Aber woher kommt DeepSeek und wie erlangte es so schnell internationalen Ruhm?
DeepSeek wird von High-Flyer Capital Management unterstützt, einem chinesischen quantitativen Hedgefonds, der KI zur Information seiner Handelsentscheidungen nutzt.
Der KI-Enthusiast Liang Wenfeng war 2015 Mitbegründer von High-Flyer. Wenfeng, der Berichten zufolge bereits während seines Studiums an der Zhejiang-Universität mit dem Handel begann, gründete 2019 High-Flyer Capital Management als Hedgefonds, der sich auf die Entwicklung und Bereitstellung von KI-Algorithmen konzentriert.
Im Jahr 2023 gründete High-Flyer DeepSeek als Labor, das sich der Erforschung von KI-Tools widmete, getrennt von seinem Finanzgeschäft. Mit High-Flyer als einem seiner Investoren wurde das Labor in ein eigenes Unternehmen ausgegliedert, das ebenfalls DeepSeek heißt.
Vom ersten Tag an baute DeepSeek eigene Rechenzentrumscluster für das Modelltraining auf. Doch wie andere KI-Unternehmen in China ist auch DeepSeek von US-Exportverboten für Hardware betroffen . Um eines seiner neueren Modelle zu trainieren, war das Unternehmen gezwungen, Nvidia H800-Chips zu verwenden, eine weniger leistungsfähige Version des Chips H100, der für US-Unternehmen erhältlich ist.
Das technische Team von DeepSeek soll vorwiegend aus jungen Leuten bestehen. Das Unternehmen wirbt Berichten zufolge aggressiv promovierte KI-Forscher von führenden chinesischen Universitäten an . Laut der New York Times stellt DeepSeek auch Leute ohne Informatik-Hintergrund ein, um seiner Technik zu helfen, eine breite Palette von Themen besser zu verstehen.
DeepSeek stellte seine ersten Modelle – DeepSeek Coder, DeepSeek LLM und DeepSeek Chat – im November 2023 vor. Doch erst im vergangenen Frühjahr, als das Startup seine Modellfamilie DeepSeek-V2 der nächsten Generation herausbrachte, wurde die KI-Branche auf das Unternehmen aufmerksam.
DeepSeek-V2, ein universelles Text- und Bildanalysesystem, schnitt in verschiedenen KI-Benchmarks gut ab – und war im Betrieb deutlich günstiger als vergleichbare Modelle seiner Zeit. Es zwang DeepSeeks heimische Konkurrenz, darunter ByteDance und Alibaba, dazu, die Nutzungspreise für einige ihrer Modelle zu senken und andere völlig kostenlos anzubieten.
DeepSeek-V3 , das im Dezember 2024 auf den Markt kam, trug nur zur Bekanntheit von DeepSeek bei.
Laut den internen Benchmarktests von DeepSeek übertrifft DeepSeek V3 sowohl herunterladbare, frei verfügbare Modelle wie Llama von Meta als auch „geschlossene“ Modelle, auf die nur über eine API zugegriffen werden kann, wie GPT-4o von OpenAI.
Ebenso beeindruckend ist DeepSeeks R1-„Argumentation“-Modell. DeepSeek behauptet, dass R1, das im Januar veröffentlicht wurde, bei wichtigen Benchmarks genauso gut abschneidet wie OpenAIs o1-Modell .
Da es sich bei R1 um ein logisches Modell handelt, überprüft es sich selbst effektiv auf seine Fakten und vermeidet dadurch einige der Fallstricke, die Modelle normalerweise zum Stolpern bringen. Im Vergleich zu einem typischen nicht logischen Modell brauchen logische Modelle etwas länger – normalerweise Sekunden bis Minuten länger –, um zu Lösungen zu gelangen. Der Vorteil besteht darin, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.
R1, DeepSeek V3 und die anderen Modelle von DeepSeek haben allerdings auch eine Kehrseite. Da es sich bei ihnen um in China entwickelte KI handelt, unterliegen sie einem Benchmarking durch die chinesische Internetaufsichtsbehörde, um sicherzustellen, dass ihre Antworten „die sozialistischen Grundwerte verkörpern“. In der Chatbot-App von DeepSeek beantwortet R1 beispielsweise keine Fragen zum Tiananmen-Platz oder zur Autonomie Taiwans.
Falls DeepSeek ein Geschäftsmodell hat, ist nicht klar, wie dieses genau aussieht. Das Unternehmen verlangt seine Produkte und Dienstleistungen deutlich unter dem Marktwert – und bietet andere kostenlos an.
DeepSeek behauptet, dass Effizienzdurchbrüche dem Unternehmen ermöglicht hätten, seine extreme Kostenwettbewerbsfähigkeit aufrechtzuerhalten. Einige Experten bestreiten jedoch die von dem Unternehmen vorgelegten Zahlen.
Wie dem auch sei, die Entwickler haben sich DeepSeeks Modellen zugewandt, die zwar nicht im üblichen Sinne Open Source sind, aber unter freizügigen Lizenzen erhältlich sind, die eine kommerzielle Nutzung ermöglichen. Laut Clem Delangue, dem CEO von Hugging Face, einer der Plattformen, auf denen DeepSeeks Modelle gehostet werden, haben die Entwickler von Hugging Face über 500 „abgeleitete“ Modelle von R1 erstellt , die insgesamt 2,5 Millionen Mal heruntergeladen wurden.
Der Erfolg von DeepSeek gegenüber größeren und etablierteren Konkurrenten wurde als „KI-Umbruch“ und „überbewertet“ beschrieben. Der Erfolg des Unternehmens war zumindest teilweise dafür verantwortlich, dass der Aktienkurs von Nvidia am Montag um 18 % fiel und dass OpenAI-CEO Sam Altman eine öffentliche Reaktion auslöste .
Microsoft gab bekannt, dass DeepSeek auf seinem Azure AI Foundry-Dienst verfügbar ist , der Plattform von Microsoft, die KI-Dienste für Unternehmen unter einem einzigen Banner zusammenführt. Als CEO Mark Zuckerberg während der Gewinnbesprechung zum ersten Quartal nach den Auswirkungen von DeepSeek auf Metas KI-Ausgaben gefragt wurde, sagte er, dass die Ausgaben für die KI-Infrastruktur weiterhin ein „strategischer Vorteil“ für Meta sein werden .
Gleichzeitig verbieten einige Unternehmen DeepSeek , und das Gleiche gilt für ganze Länder und Regierungen , darunter auch Südkorea . Auch der Bundesstaat New York hat die Nutzung von DeepSeek auf Regierungsgeräten verboten .
Was die Zukunft von DeepSeek bringen könnte, ist unklar. Verbesserte Modelle sind eine Selbstverständlichkeit. Aber die US-Regierung scheint zunehmend misstrauisch gegenüber dem zu werden, was sie als schädlichen ausländischen Einfluss ansieht .
TechCrunch bietet einen KI-Newsletter an! Melden Sie sich hier an , um ihn jeden Mittwoch in Ihrem Posteingang zu erhalten.
Diese Geschichte wurde ursprünglich am 28. Januar 2025 veröffentlicht und wird kontinuierlich mit weiteren Informationen aktualisiert.
techcrunch