Qwen3 Framework: Stelle dein Thinking-Budget ein und sehe, wie die Antwortqualität je nach Task-Typ mit dem investierten Token-Budget skaliert. Accuracykurven für Math, Code und kreative Aufgaben.
Ergänzt Effort Parameter mit dem direkteren Token-Budget-Ansatz.
Math braucht ~2000 Thinking-Tokens für optimale Ergebnisse, kreative Aufgaben nur ~500. Mit Token-Budget-Kontrolle kann man Kosten um 60-80% senken.