Avez-vous toujours souhaité pouvoir communiquer avec les dauphins ? Google DeepMind dévoile DolphinGemma : un modèle d’IA qui analyse et traduit le langage des dauphins.
Les dauphins possèdent un système de communication complexe. Chaque clic ou sifflement émis par l’animal a une signification spécifique. Les chercheurs spécialisés dans l’étude des dauphins rêvent de pouvoir déchiffrer ce langage, et avec le tout dernier modèle d’IA de Google Deepmind, ce rêve pourrait devenir réalité. Dans un blog, Deepmind présente DolphinGemma : un modèle d’IA entraîné pour comprendre le langage des dauphins.
DolphinGemma est né d’une collaboration entre Google et des scientifiques spécialistes des dauphins. Le modèle s’appuie sur le modèle Gemma de Google et est spécifiquement conçu pour l’analyse audio. Il a été entraîné sur un ensemble de données unique comprenant des milliers d’heures d’audio sous-marin, associées à des comportements spécifiques et à des dauphins individuels.
Sifflements et clics
Les chercheurs ont consacré des années à documenter différents types de sons émis par les dauphins, tels que les sifflements et les clics, ainsi que les comportements associés à ces sons. En alimentant ces données dans le modèle d’IA, les chercheurs peuvent détecter plus rapidement les structures sonores récurrentes.
Grâce à sa taille ‘modeste’ (400 millions de paramètres), le modèle Dolphin-Gemma peut fonctionner localement sur les smartphones utilisés par les chercheurs sur le terrain. La dernière version fonctionne sur le Pixel 9 et peut exécuter simultanément des modèles d’IA et la reconnaissance de motifs. Un équipement spécial a été développé pour capturer et analyser en temps réel les sons des dauphins.

Converser avec les dauphins
L’objectif est d’utiliser ce modèle pour mieux comprendre les significations possibles derrière la communication naturelle des dauphins. Mais cela peut également fonctionner dans le sens inverse : les chercheurs peuvent, à l’aide de l’IA, développer eux-mêmes des sons de dauphins synthétisés afin de créer un vocabulaire partagé entre l’homme et l’animal.
Avec un ordinateur sous-marin, les chercheurs peuvent créer des signaux de sifflement associés à des objets qui intéressent les animaux, tels que des algues ou des jouets. L’ordinateur écoute quel signal de sifflement l’animal imite et l’associe à l’objet approprié, de sorte que le dauphin obtient ce qu’il ‘demande’. En comprenant mieux les modèles structurels des sons des dauphins, une interaction significative entre l’homme et l’animal devient plus proche.
Google prévoit de publier DolphinGemma en open source cet été, afin que d’autres chercheurs puissent également l’utiliser. Bien que le modèle soit entraîné sur les sons produits par une espèce spécifique de dauphins, il peut être adapté à d’autres espèces grâce à un entraînement supplémentaire.