Recital 67 of 18037%

Recital 67 AI Act

Official text

id="rct_67">

(67)

Kvaliteetsed andmed ja juurdepääs kvaliteetsetele andmetele on struktuuri pakkumiseks ja paljude tehisintellektisüsteemide toimimise tagamiseks hädavajalik, eriti kui kasutatakse mudelite treenimise meetodeid, et tagada suure riskiga tehisintellektisüsteemide sihipärane ja ohutu töö ja see, et neist ei saa liidu õigusega keelatud diskrimineerimise allikas. Kvaliteetsed treenimis-, valideerimis- ja testimisandmestikud eeldavad asjakohaste andmehaldus- ja juhtimistavade rakendamist. Treenimis-, valideerimis- ja testimisandmestikud, sealhulgas märgistus, peaksid olema asjakohased, piisavalt representatiivsed ning võimalikult suurel määral vigadeta ja täielikud, pidades silmas süsteemi sihtotstarvet. Selleks et hõlbustada liidu andmekaitseõiguse, näiteks määruse (EL) 2016/679 järgimist, peaksid andmehaldus- ja -juhtimistavad sisaldama isikuandmete puhul andmete kogumise algse eesmärgi läbipaistvust. Neil andmestikel peaksid olema asjakohased statistilised omadused, sealhulgas mis puudutab selliseid isikuid või isikute rühmi, kellega seoses kavatsetakse suure riskiga tehisintellektisüsteemi kasutada, pöörates erilist tähelepanu andmestike võimalike kallutatuste leevendamisele, kuna need võivad mõjutada inimeste tervist ja ohutust, avaldada negatiivset mõju põhiõigustele või põhjustada liidu õigusega keelatud diskrimineerimist, eriti kui andmeväljundid mõjutavad tulevaste toimingute sisendeid (tagasisideahelad). Kallutatus võib tuleneda näiteks aluseks olevatest andmestikest, eriti kui kasutatakse varasemaid andmeid, või see võib tekkida süsteemide rakendamisel tegelikus keskkonnas. Tehisintellektisüsteemide abil saavutatud tulemusi võib mõjutada selline loomupärane kallutatus, mis kaldub järk-järgult suurenema ning sel viisil põlistama ja võimendama olemasolevat diskrimineerimist, eriti teatud kaitsetutesse rühmadesse, sealhulgas rassilistesse või etnilistesse rühmadesse kuuluvate isikute puhul. Nõue, et andmestikud peavad olema võimalikult suurel määral täielikud ja vigadeta, ei tohiks mõjutada eraelu puutumatuse säilitamise meetodite kasutamist tehisintellektisüsteemide arendamise ja testimise kontekstis. Eeskätt tuleks andmestikes sihtotstarbe jaoks nõutavas ulatuses võtta arvesse funktsioone, omadusi või elemente, mis iseloomustavad konkreetset geograafilist, kontekstuaalset, käitumuslikku või funktsionaalset keskkonda, kus kavatsetakse suure riskiga tehisintellektisüsteemi kasutada. Andmehaldusega seotud nõudeid saab täita, kasutades kolmandaid isikuid, kes pakuvad sertifitseeritud vastavusteenuseid, sealhulgas andmehalduse, andmestiku tervikluse ning andmete treenimise, valideerimise ja testimise tavade kontrollimist, kui on tagatud vastavus käesoleva määruse andmenõuetele.

Source: EUR-Lex, Regulation (EU) 2024/1689 — text reproduced verbatim.

📬 AI Act Weekly

Get the most important AI Act developments in your inbox every week.