Technische Concepten

Adversarial Testing

Definitie & Uitleg

Definitie

Het systematisch testen van AI-systemen op kwetsbaarheden door ze bloot te stellen aan bewust misleidende of kwaadaardige input. Verplicht voor GPAI-modellen met systemisch risico. Omvat red teaming, jailbreak-pogingen en robustness testing.

Gerelateerde termen

Red Teaming

Een testmethode waarbij experts proberen een AI-systeem te "breken" door kwetsbaarheden, bias of ong...

Systemisch risico

Risico dat een GPAI-model negatieve effecten kan hebben op de volksgezondheid, veiligheid, openbare ...

Robuustheid (Robustness)

De mate waarin een AI-systeem correct blijft functioneren onder variërende omstandigheden, inclusief...

Lees meer over dit onderwerp

gedragscode general purpose ai