Anthropic a annoncé que le modèle d’intelligence artificielle Claude 5 Fable sera de nouveau disponible pour les utilisateurs du monde entier à partir de ce mercredi, après une période de restrictions motivée par des préoccupations en matière de cybersécurité soulevées par le gouvernement des États-Unis. La remise à disposition intervient après des négociations entre l’entreprise et les autorités américaines, aboutissant à la mise en œuvre de nouveaux mécanismes pour réduire le risque d’utilisation abusive de la technologie.
Selon l’entreprise, la nouvelle version de Claude 5 Fable arrive équipée d’un ensemble actualisé de classificateurs de sécurité, développés pour identifier et bloquer les demandes liées à des activités de cybersécurité considérées comme sensibles. La mesure fait partie d’un engagement pris par Anthropic pour répondre aux exigences discutées avec le gouvernement des États-Unis.
Durant cette période initiale de retour, certaines tâches routinières, comme la programmation et le débogage de code, pourront être automatiquement redirigées vers le modèle Claude Opus 4.8 lorsque les nouveaux filtres identifieront de possibles risques. L’entreprise a expliqué que cette décision vise à équilibrer la protection contre les abus sans compromettre complètement l’expérience des utilisateurs.
Anthropic a également affirmé qu’elle continuerait à affiner les classificateurs au cours des prochaines semaines afin de réduire les faux positifs et d’améliorer la capacité du système à différencier les demandes légitimes des tentatives réelles d’exploitation de l’IA.
En plus de la réactivation du modèle, l’entreprise a révélé qu’elle avait commencé l’élaboration d’un cadre de consensus axé sur l’évaluation de la gravité des attaques connues sous le nom de "jailbreaks" dans les modèles d’intelligence artificielle. L’initiative est en cours de développement en partenariat avec des géants de la technologie, dont Amazon, Microsoft, Google et d’autres participants de l’alliance Glasswing.
L’objectif est de créer des critères communs pour mesurer les risques et définir comment les entreprises développant de l’IA doivent répondre lorsque des vulnérabilités sont découvertes. Anthropic a également invité d’autres organisations et fournisseurs de modèles d’IA à participer à l’initiative.
Dans le cadre de ce nouvel accord, l’entreprise élargira sa collaboration avec le gouvernement des États-Unis en matière de tests de sécurité et de développement de garde-fous pour de futurs modèles. Le plan comprend l’accès anticipé des autorités à de nouvelles versions de l’IA avant le lancement public, le partage d’informations sur les tentatives d’exploitation et des recherches conjointes pour renforcer les mécanismes de protection.
En annonçant le retour de Claude 5 Fable, Anthropic a remercié les utilisateurs pour leur patience pendant la période d’indisponibilité et a souligné que la reprise du service représente un effort conjoint entre gouvernement, entreprises technologiques et communauté de recherche pour équilibrer innovation et sécurité dans l’avancement de l’intelligence artificielle.

