Von KI-Agenten geschrieben, von mir kuratiert und geprüft.
DeepSeek V4: Der API-Preis hängt künftig an der Uhrzeit
- DeepSeek
- Agentic Engineering
- Automation
DeepSeek hat Ende Juni angekündigt, V4 Mitte Juli offiziell zu veröffentlichen, mit einem Kontextfenster von einer Million Token über die gesamte Modellreihe. Das berichtet TechNode am 30. Juni. Veröffentlicht ist damit noch nichts: Es ist ein Termin, kein Modell. Interessanter als der Termin ist ohnehin, was daneben steht. Zum Start soll ein neues Preismodell greifen, das API-Aufrufe in Spitzenzeiten doppelt so teuer macht wie außerhalb. Und in den API-Docs steht bereits ein hartes Datum: Die Endpunkte deepseek-chat und deepseek-reasoner werden am 24. Juli abgeschaltet. Die eigentliche Nachricht ist keine Modellnachricht. Es ist eine über Kostenarchitektur.
Was ist angekündigt, und was ist noch nicht da?
Angekündigt ist die offizielle Veröffentlichung von V4 Mitte Juli 2026, mit einer Million Token Kontext für alle Modelle der Reihe. Dazu nennt das DeepSeek-Team „weitere Funktions- und Leistungsverbesserungen“, insbesondere bei agentischen Aufgaben, beim Code und bei mathematischer Argumentation. Das sind Herstellerangaben ohne Benchmarks, und das Modell selbst ist noch nicht verfügbar. Ob die Fähigkeiten halten, was die Ankündigung verspricht, lässt sich erst nach dem Start prüfen. Was sich heute schon prüfen lässt, sind die beiden anderen Teile der Ankündigung: der Preis und die Abschaltung.
Was ändert sich am Preis?
Mit der Veröffentlichung führt DeepSeek zeitbasierte API-Preise ein. Täglich zwischen 9 und 12 Uhr sowie zwischen 14 und 18 Uhr kostet derselbe Aufruf das Doppelte des Preises außerhalb dieser Fenster. Nach meinem Wissen ist DeepSeek damit das erste große Labor, das einen Aufschlag nach Uhrzeit berechnet, nicht nur einen Rabatt für Batch-Verarbeitung. Zwei Dinge lässt die Meldung offen: die Zeitzone der Fenster und die Basispreise pro Million Token. Beides müssen Sie vor dem Start in den API-Docs nachlesen, denn ohne Zeitzone ist ein Spitzenzeitfenster für einen Scheduler in Europa schlicht nicht definiert.
Wer muss bis zum 24. Juli handeln?
Jeder, der heute deepseek-chat oder deepseek-reasoner aufruft. Laut den API-Docs enden beide Endpunkte am 24. Juli 2026 um 15:59 UTC. Sie bilden derzeit den Non-Thinking- beziehungsweise Thinking-Modus von deepseek-v4-flash ab, als Nachfolger nennt DeepSeek deepseek-v4-flash und deepseek-v4-pro. Die Migration ist damit klein, aber nicht optional. Wer sie verschleppt, dessen Pipelines brechen an einem Freitagnachmittag im Juli, und zwar unabhängig davon, ob V4 pünktlich erscheint.
Was heißt das für den Agenten-Betrieb?
Zeitbasierte Preise machen aus der Frage „wann laufen Ihre Agenten“ einen Engineering-Parameter. Ein Faktor zwei ist keine Rundungsgröße: Wer lange Läufe, Evaluationen oder Batch-Jobs in die Spitzenfenster legt, zahlt für dieselbe Arbeit das Doppelte. Agenten brauchen aber keine Bürozeiten. Ein Lauf, der nachts startet und morgens ein geprüftes Ergebnis abliefert, kostet die Hälfte, ohne dass sich am Ergebnis etwas ändert. Erst vor wenigen Tagen hat DeepSeek mit DSpark gezeigt, dass Latenz und Kosten in der Bedienung des Modells entstehen, nicht im Modell. Jetzt zieht der Preis selbst in diese Schicht ein. Es ist dieselbe Linie wie beim Agentic Engineering: Verlässlichkeit entsteht in der Architektur um das Modell herum. Ab Mitte Juli gilt das bei DeepSeek auch für die Rechnung.