Valutare la qualità di una risposta dell'IA non è un'operazione soggettiva. Esiste un framework strutturato che puoi applicare a qualsiasi output per decidere se è accettabile, migliorabile o da scartare.
I cinque criteri di valutazione
- Pertinenza — La risposta affronta effettivamente la domanda posta? Risponde a ciò che hai chiesto o ha deviato?
- Accuratezza — Le informazioni sono corrette e verificabili? Ci sono errori fattuali, date sbagliate, riferimenti inventati?
- Completezza — La risposta copre tutti gli aspetti richiesti? Manca qualcosa di importante?
- Struttura — Il formato è quello richiesto? L'organizzazione è logica e leggibile?
- Tono e registro — Il linguaggio è appropriato per il destinatario? Il tono è coerente con la richiesta?
prompt
Ho ricevuto questa risposta dall'IA: [incolla la risposta] Valutala secondo questi criteri (punteggio 1-5 per ciascuno): 1. Pertinenza: risponde alla domanda? 2. Accuratezza: le informazioni sono corrette? 3. Completezza: copre tutti gli aspetti? 4. Struttura: è ben organizzata? 5. Tono: è appropriato per il destinatario? Per ogni criterio sotto il 4, suggerisci come migliorare il prompt originale.
Metodo pratico
Usa la regola del '3 sì': prima di usare una risposta dell'IA, chiediti: 1) È corretta? 2) È completa? 3) È appropriata per il mio contesto? Se la risposta è 'no' a una qualsiasi, riscrivi il prompt.
Suggerimento
Puoi usare un modello diverso per valutare la risposta di un altro modello. Questo 'secondo parere' riduce il rischio di confermare errori.