Comment Level-5 s’aide de l’intelligence artificielle pour créer ses nouveaux jeux.
Alors que les technologies de l’Intelligence Artificielle se développent de plus en plus — génération de textes, d’images, ou encore d’audio — de nombreuses questions sont soulevées quant à l’aspect éthique et légal de leur utilisation. C’est dans ce contexte que le gouvernement japonais a mis en place un Comité d’Étude du Droit de la Propriété Intellectuelle à l’Ère de l’IA (AI時代の知的財産権検討会).
Comme le rapporte ITmedia NEWS, la 4ème réunion de ce comité s’est tenue ce 11 décembre, et parmi la liste des intervenants figurait Level-5, représentée par son président Akihiro Hino, avec une présentation de quelques exemples de l’utilisation de l’IA dans le cadre de leurs différents projets. Vous pouvez retrouver le PDF complet de la présentation sur le site du comité.
On savait déjà que Level-5 utilisait des outils IA dans le cadre du développement d’Inazuma Eleven: Victory Road, notamment pour pouvoir générer facilement des modèles 3D pour les plus de 4500 personnages du jeu à partir d’illustrations et ressources datant de l’époque de la Nintendo DS. On en sait maintenant un peu plus sur les différentes façons dont Level-5 intègre l’IA dans plusieurs aspects du processus de développement de leurs jeux.
Conception et disposition de l’écran-titre
Prenant comme exemple Megaton Musashi: Wired, Hino explique qu’ils utilisent dans un premier temps StableDiffusion pour générer des concepts d’illustrations. Une de ces illustrations est ensuite sélectionnée et sert de référence pour créer une illustration originale, qui sera ensuite animée et utilisée pour l’écran-titre du jeu. Dans ce scénario, l’illustration de l’écran-titre est entièrement originale, l’image générée par l’IA servant uniquement à choisir la disposition des éléments.

Conception d’illustrations 3D
Prenant cette fois-ci le protagoniste Keita Amano (Nate Adams) de Yo-kai Watch comme exemple, Level-5 entraîne StableDiffusion sur des illustrations de leurs propres personnages, et lui fournit une base et des instructions pour générer des illustrations avec un style « 3D » et différents effets de texture, luminosité, atmosphère etc., pouvant ensuite servir de référence.

Conception des environnements 3D
L’IA est également utilisée pour générer des références en 3D. Hino montre l’exemple d’une chambre modélisée en 3D, de manière très simple, sans textures. StableDiffusion est ensuite utilisé pour générer des illustrations, et ces illustrations sont alors « projetées » sur le modèle 3D de la chambre, afin d’obtenir un environnement en 3D pouvant servir de référence.

Conception d’illustrations d’environnements et arrière-plans
Level-5 se sert également de StableDiffusion pour générer des illustrations d’environnements, comme cette ville futuriste. Les illustrations sont ensuite retouchées et modifiées pour intégrer divers éléments pour que le résultat final soit cohérent avec l’univers du jeu.

Inazuma Eleven: Victory Road a également eu droit à un peu d’aide de l’IA. Toujours avec StableDiffusion, Level-5 génère des illustrations de bâtiments et de foules — dans le cas d’Inazuma Eleven, le public d’un stade de football — et les incorpore aux arrière-plans de leurs illustrations. C’est notamment le cas de ces deux illustrations dévoilées dans la 3ème bande-annonce du jeu : si les personnages au premier plan sont bien des illustrations originales, le public dans les gradins est entièrement issu des images générées par l’IA.

Conception de personnages et quêtes
Level-5 utilise ChatGPT pour générer une grande quantité de concepts de personnages ou de quêtes afin de servir de références lors du développement. Le nom du jeu pour cet exemple n’est pas indiqué, mais il s’agit vraisemblablement de Decapolice.
Une fonction « get_explain_aboutcrime » est fournie à ChatGPT, prenant comme arguments un nom de quête et un résumé. À partir de ces deux informations, l’IA imagine le reste : qui sont les personnages, comment le crime a eu lieu, quelles sont les preuves…

Chaque personnage est accompagné d’un nom, d’un âge, d’une brève description, ainsi que de leur rôle (victime, coupable, enquêteur…). Des statistiques (PV, attaque, défense…) pour différents personnages peuvent également être générées.
Génération de voix et dialogues temporaires
Durant le développement, Level-5 utilise des outils maison, combinés à un outil de synthèse vocale appelé VOICEVOX, pour générer des dialogues temporaires (principalement de courtes interjections comme « Ha ! », « Prends ça ! », « Super ! »). Cela leur permet d’obtenir rapidement des fichiers audio en grande quantité pour aider au développement du jeu, le temps que les véritables dialogues soient enregistrés par leurs comédiens.

Utilisation de l’IA à des fins promotionnelles
En dehors du développement des jeux en eux-mêmes, Level-5 incorpore également l’IA à d’autres aspects comme la création de sites web, ou d’illustrations promotionnelles.
La programmation de leurs sites web est assistée par Genie AI (ChatGPT) et GitHub Copilot, qui génèrent du code automatiquement, ou analysent le code afin d’identifier des optimisations possibles.

Du côté des illustrations, StableDiffusion est utilisée pour trouver des idées de compositions, de la même manière que pour les illustrations pour les jeux. C’est par exemple le cas de l’illustration du 15ème anniversaire d’Inazuma Eleven, dont la disposition en cercle est inspirée d’une illustration générée par l’IA.

L’IA est également utilisée pour agrandir des illustrations (upscaling). Afin de pouvoir afficher l’illustration principale d’Inazuma Eleven: Victory Road sur les murs de leur stand au Tokyo Game Show, Level-5 s’est servi de SwinIR pour en augmenter artificiellement la résolution.




Pour finir, même leur stand au Tokyo Game Show a été conçu à l’aide de l’IA ! StableDiffusion a été utilisé pour générer des idées de scènes utilisant 4 écrans LED, ce qui a servi de base pour concevoir la scène que l’on a pu voir lors de l’événement.

En conclusion, Level-5 se sert de l’IA principalement à des fins d’idéation, pour générer des données de base autour desquelles développer leurs jeux, et plus globalement faciliter et améliorer leurs méthodes de développement. Cette présentation donne une bonne idée de la part qu’occupe l’IA dans le processus créatif, et la façon dont Level-5 tente de faire coexister ces technologies avec des compétences artistiques et techniques traditionnelles (illustration, doublage, programmation…).