Anthropic Recrute l'Ancien Responsable de la Sécurité d'OpenAI pour une Nouvelle Équipe "Superalignment"
Anthropic Recrute l'Ancien Responsable de la Sécurité d'OpenAI pour une Nouvelle Équipe "Superalignment"
Anthropic a pris une initiative significative dans l'industrie de l'IA en recrutant Jan Leike, ancien responsable de la sécurité chez OpenAI, pour diriger une nouvelle équipe appelée "superalignment". Leike, qui a récemment démissionné d'OpenAI, avait publiquement critiqué l'approche de l'entreprise en matière de sécurité de l'IA, citant des préoccupations concernant ses méthodes et sa direction. Chez Anthropic, il se concentrera sur des aspects cruciaux de la sécurité de l'IA, y compris la supervision évolutive, la généralisation faible à forte, et la recherche d'alignement automatisée.
L'équipe de Leike chez Anthropic se concentrera sur la garantie que les systèmes d'IA à grande échelle se comportent de manière prévisible et sont alignés sur les résultats souhaités. Cela implique le développement de techniques robustes pour une supervision évolutive et l'avancement de la recherche en alignement automatisé. Ces efforts visent à rendre les systèmes d'IA plus fiables et sécurisés, une mission qui reflète étroitement les objectifs de l'équipe de Superalignment dissoute chez OpenAI, que Leike co-dirigeait .
Rapportant directement au directeur scientifique d'Anthropic, Jared Kaplan, la nomination de Leike souligne l'engagement d'Anthropic à donner la priorité à la sécurité de l'IA par rapport aux intérêts commerciaux. Cette focalisation contraste notablement avec l'orientation de plus en plus commerciale d'OpenAI, un point de contention qui avait précédemment conduit Dario Amodei, PDG d'Anthropic et ancien VP de la recherche chez OpenAI, à quitter l'organisation. Le départ d'Amodei a amené plusieurs anciens employés d'OpenAI chez Anthropic, y compris le responsable des politiques, Jack Clark, soulignant encore l'approche axée sur la sécurité de l'entreprise .
La direction stratégique d'Anthropic sous la leadership de Leike devrait faire avancer de manière significative le domaine de la sécurité de l'IA. En consolidant les efforts sur la supervision évolutive et l'alignement, Anthropic vise à relever les défis pressants de la gestion des systèmes d'IA superintelligents. Cette initiative met en lumière le paysage concurrentiel de la recherche en IA, avec des entreprises comme Anthropic et OpenAI cherchant à établir la norme pour un développement de l'IA sûr et efficace .