Annex XI AI Act

class="oj-doc-ti" id="d1e38-141-1">LIITE XI

Official text

id="anx_XI"> LIITE XI Tämän asetuksen 53 artiklan 1 kohdan a alakohdassa tarkoitettu tekninen dokumentaatio – yleiskäyttöisten tekoälymallien tarjoajia koskeva tekninen dokumentaatio 1 jakso Tiedot, jotka kaikkien yleiskäyttöisten tekoälymallien tarjoajien on toimitettava Tämän asetuksen 53 artiklan 1 kohdan a alakohdassa tarkoitettuun tekniseen dokumentaation on sisällyttävä vähintään seuraavat tiedot mallin koon ja riskiprofiilin mukaan:

1. Yleiskäyttöisen tekoälymallin yleinen kuvaus, mukaan lukien seuraavat tiedot:

a) tehtävät, jotka mallin on tarkoitus suorittaa, sekä niiden tekoälyjärjestelmien tyyppi ja luonne, joihin se voidaan integroida;

b) sovellettavat hyväksyttävän käytön periaatteet;

c) julkaisupäivä ja jakelumenetelmät;

d) parametrien arkkitehtuuri ja lukumäärä;

e) syöttötietojen ja tuotosten modaalisuus (esim. teksti ja kuva) ja muoto;

f) lisenssi.

2. Yksityiskohtainen kuvaus 1 kohdassa tarkoitetuista mallin osista ja olennaiset tiedot kehittämisprosessista, mukaan lukien seuraavat seikat:

a) tekniset välineet (esim. käyttöohjeet, infrastruktuuri ja työkalut), jotka vaaditaan yleiskäyttöisen tekoälymallin integroimiseksi tekoälyjärjestelmiin;

b) mallin ja koulutusprosessin rakennespesifikaatiot, myös koulutusmenetelmät ja -tekniikat, keskeiset rakenteelliset valinnat, mukaan lukien periaatteet ja tehdyt oletukset; se, mihin nähden malli on suunniteltu optimoitumaan ja tapauksen mukaan eri parametrien merkitys;

c) tiedot koulutuksessa, testauksessa ja validoinnissa käytetystä datasta, tarvittaessa myös datan tyypistä ja alkuperästä sekä kuratointimenetelmistä (esim. puhdistus, suodatus jne.), tietopisteiden lukumäärästä, laajuudesta ja pääpiirteistä; se, miten data on saatu ja valittu, sekä tarvittaessa kaikki muut toimenpiteet, joilla havaitaan datalähteiden sopimattomuus, ja menetelmät vinoutumien havaitsemiseksi;

d) mallin kouluttamiseen käytetyt laskentaresurssit (esim. liukulukulaskutoimitusten lukumäärä), koulutusaika ja muut koulutukseen liittyvät olennaiset tiedot;

e) mallin tunnettu tai arvioitu energiankulutus.

Edellä olevan e alakohdan osalta, jos mallin energiankulutus ei ole tiedossa, energiakulutuksen perustana voidaan hyödyntää käytettyjä laskentaresursseja koskevia tietoja.

2 jakso Sellaisten yleiskäyttöisten tekoälymallien tarjoajien, joihin liittyy systeeminen riski, toimitettavat lisätiedot

1. Yksityiskohtainen kuvaus arviointistrategioista, mukaan lukien arvioinnin tulokset, käytettävissä olevien julkisten arviointiprotokollien ja -välineiden tai muiden arviointimenetelmien perusteella. Arviointistrategioihin on sisällyttävä arviointiperusteet, mittarit ja menetelmät rajoitusten tunnistamiseksi.

2. Tarvittaessa yksityiskohtainen kuvaus toimenpiteistä, jotka on otettu käyttöön sisäisen ja/tai ulkoisen adversariaalisen testauksen suorittamiseksi (esim. red teaming -testaus) ja mallien mukauttamiseksi, mukaan lukien yhdenmukaistaminen ja hienosäätö.

3. Tarvittaessa järjestelmäarkkitehtuurin yksityiskohtainen kuvaus, jossa selitetään, miten ohjelmistokomponentit rakentuvat suhteessa toisiinsa tai ovat vuorovaikutuksessa ja miten ne osallistuvat järjestelmän toimintaan.

Source: EUR-Lex, Regulation (EU) 2024/1689 — text reproduced verbatim.

📬 AI Act Weekly

Get the most important AI Act developments in your inbox every week.

Frequently asked questions

What does Annex XI of the AI Act regulate?

Annex XI describes the technical documentation that providers of general-purpose AI (GPAI) models must prepare under Article 53(1)(a). It has two sections: one for all GPAI providers and an additional section for models with systemic risk.

What must be in the technical documentation of a GPAI model?

Section 1 requires: (1) general description including tasks, usage policies, architecture, parameters, modalities and licence, and (2) detailed description of development, training methodologies, data, computational resources and energy consumption.

Do I need to document my AI model's energy consumption?

Yes, point 2e of Section 1 requires the known or estimated energy consumption of the model. If exact consumption is unknown, an estimate based on computational resources used may be provided.

What extra documentation is required for GPAI with systemic risk?

Section 2 requires three additional elements: (1) detailed evaluation strategies with results and methods, (2) description of adversarial testing (red teaming), alignment and fine-tuning, and (3) description of system architecture.

Do I need to describe my training data?

Yes, point 2c of Section 1 requires information on training, testing and validation data, including type, provenance, curation methods, number of data points, scope, characteristics, and bias detection measures.

How does Annex XI differ from Annex IV?

Annex IV is for high-risk AI systems (Article 11), while Annex XI is specifically for GPAI models (Article 53). Annex XI focuses more on model architecture, training data and compute, while Annex IV is broader with requirements for risk management and human oversight.

What is red teaming and why is it required?

Red teaming is adversarial testing where the model is attacked to discover vulnerabilities. Section 2, point 2 requires this for GPAI models with systemic risk, including description of alignment and fine-tuning measures.

How many parameters must my model have to fall under Annex XI?

Annex XI applies to all GPAI models regardless of size. The number of parameters must be documented (point 1d), but there is no minimum threshold. The extra Section 2 requirements only apply to models with systemic risk (Article 51).