Nel settembre 2025, la Svizzera ha presentato Apertus, un modello linguistico di grandi dimensioni (LLM) multilingue sviluppato grazie alla collaborazione tra ETH Zurich, EPFL e il Centro Svizzero di Supercalcolo (CSCS). A differenza della maggior parte degli LLM commerciali, Apertus è stato progettato fin dall'inizio come un progetto completamente aperto e trasparente, rilasciando non solo i pesi del modello, ma ogni componente della sua creazione, dagli script di raccolta dati ai metodi di allineamento etico. Il suo obiettivo è ambizioso: diventare una base pubblica e verificabile per la ricerca, l'innovazione e lo sviluppo di un'IA affidabile in Europa e oltre.
Data Compliance
Dal punto di vista della conformità dei dati, il team dietro Apertus ha adottato un approccio particolarmente rigoroso e trasparente, stabilendo un nuovo punto di riferimento per lo sviluppo responsabile dell'IA. L'obiettivo non era solo rispettare le normative attuali, ma anche anticipare i futuri requisiti europei, come l'AI Act dell'UE, che entrerà in vigore nell'agosto 2026.
Rispetto retroattivo degli opt-out: mentre molti progetti di IA rispettano le politiche dei siti web al momento della raccolta dei dati, Apertus va oltre applicando queste regole retroattivamente. Se un sito web attualmente vieta l'uso dei suoi contenuti per l'addestramento di IA, Apertus rimuove tutte le istantanee passate di quel sito dal suo dataset, anche se i contenuti erano stati raccolti in un momento in cui tali restrizioni non erano ancora in vigore. Questa interpretazione rigorosa del consenso protegge editori e creatori di contenuti e stabilisce un nuovo standard etico per la gestione dei dataset.
Filtri completi per sicurezza e privacy: tutti i dati di addestramento vengono sottoposti a una serie di processi di filtraggio automatizzati per migliorarne la qualità e ridurre i rischi. Questo include l'individuazione e la rimozione di Informazioni di Identificazione Personale (PII), oltre all'esclusione di contenuti tossici o dannosi. In particolare, il team ha anche reso open-source gli strumenti di filtraggio, rendendo il loro approccio verificabile e riproducibile (un passo raro nel settore, dato l'alto livello di complessità tecnica di questi filtri).
Uso dell'obiettivo Goldfish per prevenire la memorizzazione dei dati: Apertus è stato addestrato utilizzando una variante dell'obiettivo Goldfish per limitare la memorizzazione e la riproduzione dei dati di addestramento. In altre parole, questa scelta tecnica costringe l'LLM a evitare di imparare le parole "a memoria", riducendo il rischio che i dati contenuti nel set di addestramento possano essere esposti nelle risposte del modello.
Allineamento ai requisiti dell'AI Act UE: per prepararsi alle normative imminenti, il team di Apertus ha pubblicato una documentazione di conformità dettagliata che descrive la composizione del dataset, le fonti dei dati, i metodi di filtraggio e i meccanismi di consenso. Questi documenti sono stati appositamente progettati per soddisfare gli obblighi di trasparenza previsti dall'AI Act dell'UE, garantendo ad Apertus una posizione di vantaggio in vista dell'applicazione della legge nel 2026. Questo approccio proattivo dimostra un impegno non solo per l'eccellenza tecnica, ma anche per la responsabilità legale ed etica.
Supporto Multilingua
Apertus è stato addestrato su dati testuali che coprono oltre 1.800 lingue, posizionandolo tra i modelli linguistici di grandi dimensioni con la più ampia diversità linguistica disponibile oggi. Questa copertura estesa riflette non solo l'identità multilingue della Svizzera, ma risponde anche all'esigenza globale di sistemi di IA che possano servire sia parlanti di lingue diffuse sia di lingue sottorappresentate.
Oltre alla sua straordinaria portata linguistica, Apertus introduce un quadro etico unico che guida il suo comportamento e le sue risposte. Al centro di questo quadro si trova la Swiss AI Charter, un insieme di principi ispirati ai valori costituzionali della Svizzera, tra cui neutralità, costruzione del consenso, federalismo, multilinguismo, diversità culturale e un forte impegno per la protezione della privacy.
La Swiss AI Charter è composta da 11 principi fondamentali che definiscono come il modello dovrebbe interagire con gli utenti ed elaborare le informazioni:
Qualità delle risposte — Fornire risposte chiare, accurate e utili.
Standard di conoscenza e ragionamento — Basarsi su fatti verificati e ragionamenti solidi.
Comunicazione rispettosa — Garantire equità, cortesia e accessibilità.
Prevenzione del danno — Proteggere la sicurezza e rifiutare richieste dannose o illegali.
Risoluzione dei conflitti di valore — Gestire i compromessi in modo trasparente, salvaguardando i principi fondamentali.
Limiti di competenza professionale — Educare senza fornire consigli regolamentati o soggetti a licenza.
Decisioni collettive — Sostenere processi di gruppo equi e costruttivi.
Autonomia e confini personali — Rispettare la scelta, la privacy e il consenso dell'utente.
Orientamento a lungo termine e sostenibilità — Considerare i rischi futuri e l'impatto sulla società.
Agenzia umana — Mantenere il controllo e l'indipendenza nelle mani degli esseri umani.
Identità e limiti dell'IA — Essere trasparenti sulla natura e i limiti del modello.
Ciascun principio è ulteriormente dettagliato attraverso una serie di clausole (tipicamente da tre a nove) che forniscono indicazioni concrete sul comportamento pratico del modello.
È importante sottolineare che questi principi non sono stati definiti esclusivamente da ricercatori o decisori politici. Sono stati invece validati tramite un sondaggio in cui i cittadini svizzeri hanno valutato ciascun principio su una scala, indicando quanto fortemente ritenevano che Apertus dovesse aderire ad esso. Questo approccio partecipativo radica l'allineamento etico del modello nei valori democratici e nel consenso pubblico.
Realmente Open-Source
Quando molte aziende di IA oggi descrivono i loro modelli linguistici di grandi dimensioni come “open-source”, in realtà intendono solitamente open-weights: vengono rilasciati i parametri finali addestrati, ma i dati, il codice e i processi che li hanno generati restano chiusi e non divulgati. Apertus si distacca nettamente da questa tendenza, adottando un approccio di apertura totale, o full-stack openness.
Ogni componente della creazione di Apertus è stato rilasciato al pubblico con licenze open-source permissive ed è disponibile nel rapporto tecnico:
Raccolta e pulizia dei dati: tutti gli script utilizzati per raccogliere, filtrare e preprocessare il corpus di addestramento sono liberamente disponibili.
Architettura del modello e codice di addestramento: dalla definizione del modello di base alle strategie di ottimizzazione, ogni riga di codice necessaria per addestrare Apertus è aperta.
Strumenti di validazione e benchmarking: inclusi dataset di valutazione e metriche, per consentire ai ricercatori esterni di verificare le prestazioni dichiarate.
Quadro di allineamento etico: la progettazione e l'implementazione dei principi della Swiss AI Charter, compresi i sondaggi e i metodi di fine-tuning utilizzati per incorporare questi valori nel modello.
Questo livello di trasparenza è senza precedenti. Significa che qualsiasi ricercatore, policymaker o sviluppatore può non solo ispezionare il modello finale, ma anche riprodurre l'intero ciclo di vita, dai dati grezzi fino ai pesi finali allineati. Una tale apertura radicale permette una vera riproducibilità scientifica, pilastro fondamentale di una ricerca credibile in ambito IA, e fornisce la base per l'open science nel machine learning.
Il rilascio di Apertus segna un momento cruciale per l'IA in Europa. Mentre la maggior parte delle discussioni sui modelli linguistici si concentra su benchmark e metriche di performance, Apertus rappresenta qualcosa di più profondo: un impegno verso l'open science, la responsabilità e la sovranità nell'ambito dell'IA. Rendendo ogni fase del suo sviluppo aperta e riproducibile, stabilisce un nuovo standard di trasparenza nel machine learning e fornisce un modello su come nazioni e istituzioni possano collaborare per costruire sistemi di IA che riflettano i propri valori culturali e principi normativi.
In questo modo, Apertus sfida lo status quo delle IA opache e controllate dalle aziende, aprendo la strada a un futuro in cui i modelli fondamentali siano considerati infrastrutture pubbliche: strumenti da fidare, ispezionare e migliorare da parte di tutti.




