Vai al contenuto
Miraat·dweb developer journey, reflected

Valutare gli output LLM

Dataset, risposte di riferimento, LLM-as-judge, suite di regressione.

Advanced 30 minuti Prerequisiti: Basi di prompt engineering