Effort del modello

Basso, medio, alto. Bilancia velocità di risposta e profondità di analisi.

Tre livelli che controllano quanto "fa pensare" il modello prima di rispondere. Basso: 600 token di output massimo, risposte rapide e concise, ideale per domande singole o operative. Medio (default): 1200 token, analisi completa ma senza divagazioni. Alto: 2400 token, ragionamento esteso per domande che richiedono confronti, trend, forecast o suggerimenti multipli.

L'effort influisce anche sulla ricchezza del payload strutturato: con alto più facilmente vedi grafici multi-serie, suggestedActions più articolate, analisi dense. Con basso hai spesso solo dato + fonte + commento minimale.

Il setting è conservativo: partire da medio è sempre la scelta giusta. Si sale ad alto solo quando la domanda è genuinamente complessa ("confrontami questa settimana con le ultime quattro e spiegami la tendenza"). Si scende a basso quando serve solo il numero.