Annex XI AI Act
Artikli 53 lõike 1 punktis a osutatud tehniline dokumentatsioon – üldotstarbeliste tehisintellektimudelite pakkujate tehniline dokumentatsioon
Officiële tekst
id="anx_XI "> XI LISA Artikli 53 lõike 1 punktis a osutatud tehniline dokumentatsioon – üldotstarbeliste tehisintellektimudelite pakkujate tehniline dokumentatsioon 1. jagu Teave, mille peavad esitama kõik üldotstarbeliste tehisintellektimudelite pakkujad Artikli 53 lõike 1 punktis a osutatud tehniline dokumentatsioon peab sisaldama vähemalt järgmist teavet vastavalt mudeli suurusele ja riskiprofiilile.
1. Üldotstarbelise tehisintellektimudeli üldine kirjeldus, sealhulgas:
a) ülesanded, mida mudel on ette nähtud täitma, ning selliste tehisintellektisüsteemide liik ja olemus, millesse seda saab integreerida;
b) kohaldatavad vastuvõetavad kasutuspõhimõtted;
c) tarbimisse lubamise kuupäev ja turustamismeetodid;
d) arhitektuur ja parameetrite arv;
e) sisendite ja väljundite modaalsus (nt tekst, kujutis) ja vorming;
f) litsents.
2. Punktis 1 osutatud mudeli elementide üksikasjalik kirjeldus ja asjakohane teave arendusprotsessi kohta, sealhulgas järgmised elemendid:
a) tehnilised vahendid (nt kasutusjuhend, taristu, vahendid), mis on vajalikud üldotstarbelise tehisintellektimudeli integreerimiseks tehisintellektisüsteemidesse;
b) mudeli ja treenimisprotsessi spetsifikatsioonid, sealhulgas treenimismeetodid ja -tehnikad, peamised projekteerimisvalikud, sealhulgas põhjendused ja tehtud eeldused; mida on mudel projekteeritud optimeerima ja milline on eri parameetrite olulisus, kui see on asjakohane;
c) teave treenimisel, testimisel ja valideerimisel kasutatud andmete kohta, kui see on kohaldatav, sealhulgas andmete liik ja päritolu ning andmehooldusmeetodid (nt puhastamine, filtreerimine jne), andmepunktide arv, nende ulatus ja põhiomadused; kuidas andmed saadi ja valiti, samuti kõik muud meetmed andmeallikate ja kindlaks määratava kallutatuse tuvastamise meetodite sobimatuse avastamiseks, kui see on kohaldatav;
d) mudeli treenimiseks kasutatavad arvutusressursid (nt ujukomatehete arv), treenimise aeg ja muud treenimisega seotud asjakohased üksikasjad;
e) mudeli teadaolev või hinnanguline energiatarbimine.
Punkti e puhul, kui mudeli energiatarbimine ei ole teada, võib energiatarbimine põhineda kasutatud arvutusressursse käsitleval teabel.
2. jagu Lisateave, mille peavad esitama kõik süsteemse riskiga üldotstarbeliste tehisintellektimudelite pakkujad
1. Hindamisstrateegiate üksikasjalik kirjeldus, sealhulgas hindamistulemused, tuginedes kättesaadavatele avalikele hindamisprotokollidele ja -vahenditele või muudele hindamismeetoditele. Hindamisstrateegiad hõlmavad hindamiskriteeriume, parameetreid ja metoodikat piiride tuvastamiseks.
2. Kui see on kohaldatav, siis selliste meetmete üksikasjalik kirjeldus, mis on kehtestatud sisemiste ja/või väliste vastandtestimiste tegemiseks (nt punaste tiimide kasutamine), mudelite kohandamiseks, sealhulgas ühtlustamiseks ja peenhäälestamiseks.
3. Kui see on kohaldatav, siis süsteemi arhitektuuri üksikasjalik kirjeldus, milles selgitatakse, kuidas tarkvarakomponendid üksteisele toetuvad või üksteisele sisendit annavad ja üldise andmetöötlusega integreeruvad.
Bron: EUR-Lex, Verordening (EU) 2024/1689 — tekst ongewijzigd overgenomen.
📬 AI Act Weekly
Ontvang elke week de belangrijkste AI Act ontwikkelingen in je inbox.
AanmeldenVeelgestelde vragen
Wat regelt Bijlage XI van de AI Act?
Bijlage XI beschrijft de technische documentatie die aanbieders van AI-modellen voor algemene doeleinden (GPAI) moeten opstellen conform artikel 53, lid 1, punt a). Het bevat twee secties: een voor alle GPAI-aanbieders en een extra sectie voor modellen met systeemrisico.
Wat moet in de technische documentatie van een GPAI-model?
Sectie 1 vereist: (1) algemene beschrijving inclusief taken, gebruiksbeleid, architectuur, parameters, modaliteiten en licentie, en (2) gedetailleerde beschrijving van ontwikkeling, trainingsmethodologieën, data, rekenkracht en energieverbruik.
Moet ik het energieverbruik van mijn AI-model documenteren?
Ja, punt 2e van Sectie 1 vereist het bekende of geschatte energieverbruik van het model. Als het exacte verbruik onbekend is, mag een schatting gebaseerd op gebruikte rekenkracht worden gegeven.
Welke extra documentatie is vereist voor GPAI met systeemrisico?
Sectie 2 vereist drie extra onderdelen: (1) gedetailleerde evaluatiestrategieën met resultaten en methoden, (2) beschrijving van adversarial testing (red teaming), alignment en fine-tuning, en (3) beschrijving van de systeemarchitectuur.
Moet ik mijn trainingsdata beschrijven?
Ja, punt 2c van Sectie 1 vereist informatie over trainings-, test- en validatiedata, inclusief type, herkomst, curatiemethoden, aantal datapunten, omvang, kenmerken, en maatregelen voor bias-detectie.
Verschilt Bijlage XI van Bijlage IV?
Ja, Bijlage IV is voor hoog-risico AI-systemen (artikel 11), terwijl Bijlage XI specifiek is voor GPAI-modellen (artikel 53). Bijlage XI focust meer op modelarchitectuur, trainingsdata en rekenkracht, terwijl Bijlage IV breder is met eisen voor risicobeheer en menselijk toezicht.
Wat is red teaming en waarom is het vereist?
Red teaming is adversarial testing waarbij het model wordt aangevallen om kwetsbaarheden te ontdekken. Sectie 2, punt 2 vereist dit voor GPAI-modellen met systeemrisico, inclusief beschrijving van alignment en fine-tuning maatregelen.
Hoeveel parameters moet mijn model hebben om onder Bijlage XI te vallen?
Bijlage XI geldt voor alle GPAI-modellen ongeacht grootte. Het aantal parameters moet worden gedocumenteerd (punt 1d), maar er is geen minimumdrempel. De extra eisen van Sectie 2 gelden alleen voor modellen met systeemrisico (artikel 51).