Claude Mythos: quando l’AI diventa lo scudo della rete

Anthropic ha sviluppato un modello ritenuto troppo potente per il pubblico. Invece di bloccarlo, lo ha consegnato ai guardiani dell’infrastruttura digitale globale.

L’intelligenza artificiale sta riscrivendo le regole del gioco nella sicurezza informatica. L’annuncio di Anthropic relativo al proprio nuovo modello Claude Mythos Preview non è solo una notizia tecnologica: è un segnale che la traiettoria dell’AI avanzata ha raggiunto un punto di non ritorno, dove il confine tra strumento difensivo e arma potenziale si assottiglia pericolosamente.

Un modello troppo potente per tutti

La decisione di Anthropic di non rilasciare Claude Mythos Preview al pubblico generale non nasce da calcoli commerciali né da eccesso di prudenza comunicativa. È il frutto di una valutazione tecnica precisa: questo sistema è sufficientemente avanzato da analizzare codice, individuare vulnerabilità e — per lo stesso meccanismo — potenzialmente sfruttarle.

Jared Kaplan, chief science officer di Anthropic, ha chiarito che l’obiettivo dell’iniziativa è duplice: sensibilizzare il settore su una nuova fase delle minacce legate all’AI e offrire agli attori virtuosi un vantaggio temporale nel processo di messa in sicurezza di codice e infrastrutture.

Project Glasswing — Cos’è

L’iniziativa di Anthropic che mette Claude Mythos Preview a disposizione di un consorzio selezionato di oltre quaranta aziende tecnologiche. I partecipanti includono Apple, Amazon, Microsoft, Google, Cisco, Broadcom e la Linux Foundation. Anthropic ha stanziato fino a 100 milioni di dollari in crediti di utilizzo per sostenere il progetto.

Il contesto: perché il codice open source è il tallone d’Achille

Per comprendere la portata della sfida, occorre inquadrarla nel panorama attuale della cybersicurezza. Le vulnerabilità nel software — specialmente in quello open source su cui reggono porzioni significative dell’infrastruttura digitale mondiale — rappresentano da sempre il punto d’attacco più sfruttato da gruppi criminali, organizzazioni state-sponsored e singoli individui con capacità tecniche avanzate.

Il processo di individuazione di queste falle è spesso complesso e in parte reattivo: si scopre una vulnerabilità quando viene già sfruttata, oppure si attendono i risultati di audit condotti da team di esperti con risorse limitate. Un modello di AI sufficientemente avanzato da analizzare milioni di righe di codice in tempi drasticamente ridotti e segnalare punti di debolezza prima che siano identificati da attori ostili rappresenterebbe un cambio qualitativo radicale.

Alcuni dati chiave dell’iniziativa:

Oltre 40 aziende coinvolte nel consorzio
Fino a 100 milioni di dollari in crediti stanziati da Anthropic
2 obiettivi strategici: difesa preventiva e sensibilizzazione del settore

La doppia natura del rischio

La medesima capacità che rende Claude Mythos Preview prezioso come strumento difensivo costituisce anche il suo rischio principale: un sistema in grado di trovare vulnerabilità può, per definizione, essere utilizzato per sfruttarle. È esattamente per questa ragione che Anthropic ha optato per un modello di accesso controllato, limitato a soggetti verificati con interessi strutturali nella difesa dell’infrastruttura digitale.

Logan Graham, responsabile del team interno di Anthropic che valuta le capacità pericolose dei nuovi modelli, ha descritto Claude Mythos Preview come il punto di partenza di un “regolamento dei conti” con la realtà emergente. Una terminologia volutamente forte, che richiama l’attenzione su qualcosa che il dibattito pubblico sull’AI tende a sottovalutare: i modelli di nuova generazione non sono semplici strumenti di produttività, ma sistemi capaci di analisi tecnica sofisticata con implicazioni concrete per la sicurezza globale.

Governance come sperimentazione collettiva

La struttura di Project Glasswing riflette una consapevolezza crescente: la sicurezza informatica non può più essere una questione di pertinenza esclusiva dei singoli attori. L’interconnessione delle infrastrutture digitali fa sì che una vulnerabilità in un componente open source ampiamente utilizzato possa propagarsi a sistemi eterogenei con rapidità difficilmente prevedibile.

Un consorzio che include operatori di diversi segmenti della filiera — dai produttori di hardware ai gestori di software critici, dalle grandi piattaforme cloud alle fondazioni open source — è meglio attrezzato per affrontare questa complessità rispetto a iniziative frammentate o soluzioni proprietarie chiuse.

Tuttavia il modello solleva interrogativi legittimi che meritano risposta:

Chi determina i criteri di accesso al consorzio?
Con quali meccanismi di trasparenza si condividono le scoperte sulle vulnerabilità individuate?
In che tempi si notificano i maintainer del software interessato?

La storia della divulgazione responsabile è costellata di casi in cui la gestione delle tempistiche ha determinato la differenza tra una patch efficace e un’esposizione prolungata al rischio.

Un precedente per il futuro dell’AI ad alto rischio

Sul piano più ampio, l’annuncio di Anthropic segnala una maturazione del pensiero interno alle organizzazioni che sviluppano sistemi avanzati. La consapevolezza che la potenza computazionale di nuova generazione non può essere trattata come una semplice funzionalità da distribuire senza un framework di gestione del rischio adeguato sta diventando una posizione operativa concreta, non solo un principio etico dichiarato.

Project Glasswing può essere letto quindi come un esperimento di governance tecnologica oltre che come un’iniziativa di cybersicurezza. Se dimostrerà di produrre risultati concreti — vulnerabilità identificate, corrette, infrastrutture più sicure — potrebbe diventare un modello di riferimento per altri scenari in cui capacità avanzate di AI si rendono disponibili in modo controllato per affrontare sfide di interesse collettivo.

Considerazione finale

Claude Mythos Preview non è semplicemente un modello di AI più potente dei precedenti. È la materializzazione di un dilemma che il settore tecnologico dovrà affrontare con crescente frequenza: come trasformare capacità potenzialmente pericolose in strumenti di protezione collettiva, senza che lo stesso strumento diventi un vettore d’attacco nelle mani sbagliate.

La risposta di Anthropic — un consorzio selezionato, finanziamento sostanziale, accesso controllato — è una proposta, non una soluzione definitiva. Ma è un punto di partenza concreto in un dibattito che non può permettersi di restare teorico.