Der Vortrag „LLM-Benchmarking: Metriken, Limitationen und LLM as a Judge“ von Lecturio GmbH ist Bestandteil des Kurses „KI-Manager: Modul 4 hidden BC“.
Was beschreibt in der KI-Evaluierung das "Was" der Prüfung?
Worin unterscheidet sich Rouge grundlegend von Bleu?
Was ist das zentrale Merkmal von BertScore?
Warum werden beim LLM-as-a-Judge-Ansatz niedrige Temperaturwerte eingesetzt?
| 5 Sterne |
|
5 |
| 4 Sterne |
|
0 |
| 3 Sterne |
|
0 |
| 2 Sterne |
|
0 |
| 1 Stern |
|
0 |