Analyse résultat
Pour chaque environnement, trouver une manière de qualifier les résultats.
- Env 1 et 2 c'est simplement le nombre de fois où l'agent a choisit 0 ou 1.
- Pour les autres env il faut un peu plus réfléchir.
En plus :
Faire des graphes pour mieux voir ce qui se passe.
BONUS :
Analyser les erreurs, es ce que le llm a compris ou pas le prompt dans les cas d'erreurs ?
Edited by MARREL PIERRE-EMMANUEL p2006524