17 janvier 2024 jboscher

Faut-il craindre l’IA ? 10/n

Régulation de l'IA

Vous vous souvenez d’Hadopi, la Haute Autorité pour la Diffusion des Oeuvres et la Protection des droits sur Internet?

Plus de 82 millions d’euros d’investissement pour … 87000 € d’amendes !

Hadopi était supposée lutter contre le piratage en ligne.

Le piratage a diminué et même presque disparu. Est-ce Hadopi ou les offres de streaming à des coûts abordables qui l’ont permis ? Avez-vous encore envie de passer un temps fou pour pirater un film ou préférez-vous un abonnement à Netflix ? A posteriori, fallait-il créer Hadopi ?

De même pour la régulation de l’#IA.

La régulation de l’IA a des objectifs compréhensibles comme la lutte contre les #deepfakes, la garantie du #copyright, la protection des mineurs, …), ce qui est tout à fait louable et … vain.

Je vais donner un seul exemple aujourd’hui (avant de développer le sujet plus tard dans d’autres articles) : les NSFW (not safe for work) c’est à dire les contenus qui peuvent heurter, choquer.

MidJourney , DALL.E d’OpenAIi , et la plupart des fournisseurs de contenus générés par IA, interdisent la production de #NSFW. Ils filtrent sur mots-clés (et aussi avec d’autres techniques).

Dans ses Community Guidelines MidJourney écrit : “Midjourney is an open-by-default community. To keep the platform accessible and welcoming to the broadest number of users, content must be PG-13.“, ce qui veut dire que le contenu jugé non approprié pour des enfants de moins de 13 ans est proscrit.

Vous pouvez essayer, à vos risques de bannissement, de créer du contenu NSFW, mais il est très probable que vous échouiez… sauf si vous connaissez l’algorithme SneakyPrompt !

L’équipe qui a créé SneakyPrompt, le présente comme le premier framework d’attaque automatisé pour jailbreaker les modèles génératifs texte-image de telle sorte qu’ils génèrent des images NSFW même si des filtres de sécurité sont adoptés.

Le fournisseur de contenu définit des interdits, d’autres s”amusent à trouver des mécanismes de contournement, et on itère. Rien de nouveau.

Et supposons que vous n’ayez pas l’âme d’un geek mais que vous souhaitiez quand même générer du contenu NSFW, alors rien de plus facile. Il y a des alternatives à Midjourney qui fonctionnent à peu près de la même façon et qui le font sans scrupules. Il a des solutions NSFW.

En bref, la technique n’a qu’une efficacité temporaire, quand elle en a une, et le monde étant vaste, il y aura toujours la possibilité de trouver ailleurs ce qu’on vous interdit ici.

Contactez nous !

Quels que soient vos besoins, s'ils relèvent de l'intelligence artificielle, nous avons une solution.