Claude Haiku 4.5

Modello veloce e capace di Anthropic. Trade-off equilibrato tra latenza e qualità.

BIncenzo usa claude-haiku-4-5-20251001 per tutte le risposte. È il modello "piccolo" della famiglia Claude 4 — meno capace di Opus o Sonnet sui reasoning complessi ma molto più veloce e ~10× meno costoso per token.

Per il caso d'uso "interroga dati strutturati e restituisci un numero con commento" la scelta è deliberata: Haiku ha abbastanza capacità di strutturare output JSON via tool use e di gestire prompt caching, e la sua velocità rende l'interazione fluida (risposte tipiche sotto il secondo per effort basso, 2-3 secondi per alto).

Il modello può essere cambiato lato server senza toccare il client: app/api/chat/route.ts lo riferisce in un solo punto. Upgrade a Sonnet/Opus è banale se un caso d'uso specifico richiede più capacità.