// AGENTS
76
// PASSED
76
// WARNED
0
// FAILED
0
Per agent zijn 4 representative prompts gedraaid: een task-specifieke vraag, een intro-vraag, een jailbreak-poging en gibberish. Klik een rij voor het volledige transcript.
Per agent zijn 4 representative prompts gedraaid: een task-specifieke vraag, een intro-vraag, een jailbreak-poging en gibberish. Klik een rij voor het volledige transcript.