Annex XI AI Act
class="oj-doc-ti" id="d1e38-141-1">LIITE XI
Officiële tekst
id="anx_XI"> LIITE XI Tämän asetuksen 53 artiklan 1 kohdan a alakohdassa tarkoitettu tekninen dokumentaatio – yleiskäyttöisten tekoälymallien tarjoajia koskeva tekninen dokumentaatio 1 jakso Tiedot, jotka kaikkien yleiskäyttöisten tekoälymallien tarjoajien on toimitettava Tämän asetuksen 53 artiklan 1 kohdan a alakohdassa tarkoitettuun tekniseen dokumentaation on sisällyttävä vähintään seuraavat tiedot mallin koon ja riskiprofiilin mukaan:
1. Yleiskäyttöisen tekoälymallin yleinen kuvaus, mukaan lukien seuraavat tiedot:
a) tehtävät, jotka mallin on tarkoitus suorittaa, sekä niiden tekoälyjärjestelmien tyyppi ja luonne, joihin se voidaan integroida;
b) sovellettavat hyväksyttävän käytön periaatteet;
c) julkaisupäivä ja jakelumenetelmät;
d) parametrien arkkitehtuuri ja lukumäärä;
e) syöttötietojen ja tuotosten modaalisuus (esim. teksti ja kuva) ja muoto;
f) lisenssi.
2. Yksityiskohtainen kuvaus 1 kohdassa tarkoitetuista mallin osista ja olennaiset tiedot kehittämisprosessista, mukaan lukien seuraavat seikat:
a) tekniset välineet (esim. käyttöohjeet, infrastruktuuri ja työkalut), jotka vaaditaan yleiskäyttöisen tekoälymallin integroimiseksi tekoälyjärjestelmiin;
b) mallin ja koulutusprosessin rakennespesifikaatiot, myös koulutusmenetelmät ja -tekniikat, keskeiset rakenteelliset valinnat, mukaan lukien periaatteet ja tehdyt oletukset; se, mihin nähden malli on suunniteltu optimoitumaan ja tapauksen mukaan eri parametrien merkitys;
c) tiedot koulutuksessa, testauksessa ja validoinnissa käytetystä datasta, tarvittaessa myös datan tyypistä ja alkuperästä sekä kuratointimenetelmistä (esim. puhdistus, suodatus jne.), tietopisteiden lukumäärästä, laajuudesta ja pääpiirteistä; se, miten data on saatu ja valittu, sekä tarvittaessa kaikki muut toimenpiteet, joilla havaitaan datalähteiden sopimattomuus, ja menetelmät vinoutumien havaitsemiseksi;
d) mallin kouluttamiseen käytetyt laskentaresurssit (esim. liukulukulaskutoimitusten lukumäärä), koulutusaika ja muut koulutukseen liittyvät olennaiset tiedot;
e) mallin tunnettu tai arvioitu energiankulutus.
Edellä olevan e alakohdan osalta, jos mallin energiankulutus ei ole tiedossa, energiakulutuksen perustana voidaan hyödyntää käytettyjä laskentaresursseja koskevia tietoja.
2 jakso Sellaisten yleiskäyttöisten tekoälymallien tarjoajien, joihin liittyy systeeminen riski, toimitettavat lisätiedot
1. Yksityiskohtainen kuvaus arviointistrategioista, mukaan lukien arvioinnin tulokset, käytettävissä olevien julkisten arviointiprotokollien ja -välineiden tai muiden arviointimenetelmien perusteella. Arviointistrategioihin on sisällyttävä arviointiperusteet, mittarit ja menetelmät rajoitusten tunnistamiseksi.
2. Tarvittaessa yksityiskohtainen kuvaus toimenpiteistä, jotka on otettu käyttöön sisäisen ja/tai ulkoisen adversariaalisen testauksen suorittamiseksi (esim. red teaming -testaus) ja mallien mukauttamiseksi, mukaan lukien yhdenmukaistaminen ja hienosäätö.
3. Tarvittaessa järjestelmäarkkitehtuurin yksityiskohtainen kuvaus, jossa selitetään, miten ohjelmistokomponentit rakentuvat suhteessa toisiinsa tai ovat vuorovaikutuksessa ja miten ne osallistuvat järjestelmän toimintaan.
Bron: EUR-Lex, Verordening (EU) 2024/1689 — tekst ongewijzigd overgenomen.
📬 AI Act Weekly
Ontvang elke week de belangrijkste AI Act ontwikkelingen in je inbox.
AanmeldenVeelgestelde vragen
Wat regelt Bijlage XI van de AI Act?
Bijlage XI beschrijft de technische documentatie die aanbieders van AI-modellen voor algemene doeleinden (GPAI) moeten opstellen conform artikel 53, lid 1, punt a). Het bevat twee secties: een voor alle GPAI-aanbieders en een extra sectie voor modellen met systeemrisico.
Wat moet in de technische documentatie van een GPAI-model?
Sectie 1 vereist: (1) algemene beschrijving inclusief taken, gebruiksbeleid, architectuur, parameters, modaliteiten en licentie, en (2) gedetailleerde beschrijving van ontwikkeling, trainingsmethodologieën, data, rekenkracht en energieverbruik.
Moet ik het energieverbruik van mijn AI-model documenteren?
Ja, punt 2e van Sectie 1 vereist het bekende of geschatte energieverbruik van het model. Als het exacte verbruik onbekend is, mag een schatting gebaseerd op gebruikte rekenkracht worden gegeven.
Welke extra documentatie is vereist voor GPAI met systeemrisico?
Sectie 2 vereist drie extra onderdelen: (1) gedetailleerde evaluatiestrategieën met resultaten en methoden, (2) beschrijving van adversarial testing (red teaming), alignment en fine-tuning, en (3) beschrijving van de systeemarchitectuur.
Moet ik mijn trainingsdata beschrijven?
Ja, punt 2c van Sectie 1 vereist informatie over trainings-, test- en validatiedata, inclusief type, herkomst, curatiemethoden, aantal datapunten, omvang, kenmerken, en maatregelen voor bias-detectie.
Verschilt Bijlage XI van Bijlage IV?
Ja, Bijlage IV is voor hoog-risico AI-systemen (artikel 11), terwijl Bijlage XI specifiek is voor GPAI-modellen (artikel 53). Bijlage XI focust meer op modelarchitectuur, trainingsdata en rekenkracht, terwijl Bijlage IV breder is met eisen voor risicobeheer en menselijk toezicht.
Wat is red teaming en waarom is het vereist?
Red teaming is adversarial testing waarbij het model wordt aangevallen om kwetsbaarheden te ontdekken. Sectie 2, punt 2 vereist dit voor GPAI-modellen met systeemrisico, inclusief beschrijving van alignment en fine-tuning maatregelen.
Hoeveel parameters moet mijn model hebben om onder Bijlage XI te vallen?
Bijlage XI geldt voor alle GPAI-modellen ongeacht grootte. Het aantal parameters moet worden gedocumenteerd (punt 1d), maar er is geen minimumdrempel. De extra eisen van Sectie 2 gelden alleen voor modellen met systeemrisico (artikel 51).