💰
Output ist teurer als Input
GPT-4: Input $15, Output $30 (2×). DeepSeek: 2× auch. Längere Outputs = proportional höhere Kosten. Bei 1000 Output-Tokens bereits signifikant.
📊
Token-Zählung: ~4 chars = 1 Token
1000 Words ≈ 1500 Tokens. "Hello" = 1 Token, aber "ChatGPT" = 1-2. Modelle zählen unterschiedlich (BPE Varianten). Immer testen!
🌍
DeepSeek Preis-Revolution
DeepSeek: $0.14/$0.28 (100× günstiger als GPT-4). Macht Bulk Processing & Fine-tuning wirtschaftlich. Aber Qualität-Abstriche bei Complex Tasks.
✅
$3/$15 (5× günstiger als GPT-4, bessere Qualität als Llama). Für Production: Claude oder Llama, für Cost: DeepSeek, für Quality: GPT-4/o3.
🔧
Self-Hosted = High upfront
Llama auf A100: $1-5 pro Million Tokens (Infra-Kosten). Lohnt sich ab ~100M Tokens/Monat. Darunter: API besser.
📈
Prices fallen kontinuierlich
GPT-4 Preise halbierten sich 2024. DeepSeek unterbot alle 2025. Trend: Commodity-Preise für Modelle <100B Parameter.