Un nuovo studio condotto dalla startup di intelligenza artificiale Anthropic solleva dubbi sulla sicurezza dei modelli della cinese DeepSeek, di cui si parla molto ultimamente. Anthropic ha evidenziato gravi vulnerabilità nei sistemi di controllo di sicurezza del chatbot, con la possibilità di diffondere informazioni pericolose e dettagliate su argomenti sensibili, come la costruzione di armi biologiche.
"Il modello non ha nessuna forma di protezione contro la generazione di informazioni potenzialmente pericolose", ha scritto in un post sul blog ufficiale Dario Amodei, Ceo di Anthropic, spiegando che DeepSeek ha mostrato "le difese più deboli mai riscontrate in un modello di IA". Le scoperte di Anthropic sono confermate da uno studio indipendente condotto da Cisco, che al suo interno ha anche una divisione specializzata in sicurezza. I risultati della ricerca sul modello DeepSeek R1 sottolineano un cosiddetto 'attack success rate" del 100%, il che significa che il sistema non è in grado di bloccare richieste potenzialmente dannose. Questo include la generazione di contenuti utilizzabili per crimini informatici, disinformazione e altre attività illecite.
È importante sottolineare che il problema della sicurezza non è limitato a DeepSeek. Anche altri modelli di IA presentano vulnerabilità significative: secondo Anthropic, l'attack success rate' di ChatGpt 1.5 Pro è dell'86%, mentre quello di Llama 3.1 405b di Meta è pari al 96%. Nonostante le criticità emerse, Amodei non demonizza DeepSeek, riconoscendone il ruolo di primo piano nel panorama dell'IA. Tuttavia, esorta l'azienda a "prendere seriamente in considerazione gli aspetti legati alla sicurezza".
Riproduzione riservata © Copyright ANSA