در روز ملی دلفینها در آمریکا (۱۴ آوریل)، گوگل از پروژهای جالب توجه رونمایی کرد: مدلی مبتنی بر هوش مصنوعی با نام DolphinGemma که هدف آن ایجاد راهی برای ارتباط میان انسان و دلفینهاست. این پروژه حاصل همکاری میان گوگل، مؤسسه فناوری جورجیا (Georgia Tech) و پروژهی تحقیقاتی Wild Dolphin Project است و قصد دارد از قدرت مدلهای زبان بزرگ (LLM) برای درک زبان دلفینها بهره ببرد.
یادگیری ساختارهای زبانی دلفینها با الگوریتمهای پیشرفته
مدل DolphinGemma، نوعی LLM محسوب میشود که بهجای دادههای متنی انسانی، با صداهای دلفینها آموزش دیده است. دلفینها برای برقراری ارتباط، از طیفی از صداها شامل سوت، کلیک، و انواع صداهای کشیده و لرزشی استفاده میکنند.
گوگل با کمک فناوری SoundStream Tokenizer، این صداها را به دادههای قابل پردازش تبدیل کرده و به مدل امکان داده تا الگوها، توالیها و ساختارهای صوتی تکرارشونده را بیاموزد. این فناوری باعث شده که مدل بتواند صداهای دلفینی را با دقت بالا بازتولید کند.
مثالهایی از رفتار صوتی دلفینها
طبق اطلاعات ارائهشده، دلفینها از سوتهای خاصی برای شناسایی مادر و فرزند استفاده میکنند. در مواقع بروز تنش یا دعوا، نوعی فریاد خاص بین آنها شنیده میشود. همچنین هنگام جفتگیری یا مواجهه با شکارچیهایی مانند کوسهها، صداهایی مانند کلیکهای بلند یا وزوز تولید میکنند. این صداها پیشتر تنها با مشاهده و تحلیل انسانی قابل درک بودند، اما اکنون با کمک DolphinGemma، تحلیل آنها بسیار دقیقتر و خودکارتر شده است.
استفاده از مدل روی گوشیهای پیکسل
یکی از نکات قابل توجه این پروژه، اجرای آن روی گوشیهای هوشمند Pixel گوگل است. مدل ۴۰۰ میلیون پارامتر دارد و با وجود پیچیدگیاش، بهگونهای طراحی شده که محققان پروژه WDP بتوانند از آن مستقیماً در میدانی مانند دریاها و اقیانوسها استفاده کنند.
سیستم CHAT: آموزش زبان مشترک به دلفینها
در کنار DolphinGemma، سیستمی به نام CHAT نیز توسعه داده شده است (مخفف: Cetacean Hearing Augmentation Telemetry). این سیستم نوعی رایانهی زیرآبی است که سوتهای مصنوعی تولید میکند و هر سوت به یک شیء خاص نسبت داده میشود—برای مثال، علف دریایی.
دلفینها با شنیدن این صداها، شرطی میشوند که آنها را با اشیاء خاصی مرتبط بدانند. دانشمندان امیدوارند که در آینده، دلفینها خودشان این صداها را بازتولید کنند تا خواستهها یا علایقشان را بیان کنند؛ مثلاً برای بازی با یک جسم خاص، سوت مربوط به آن را بزنند.
انتشار عمومی مدل و کاربرد برای دیگر گونهها
گوگل اعلام کرده که DolphinGemma در تابستان پیشرو بهصورت یک مدل بازمنتشر خواهد شد. گرچه فعلاً این مدل با دادههای صوتی دلفینهای اقیانوس اطلس آموزش دیده، اما قابلیت تطبیق آن برای سایر گونهها نیز در نظر گرفته شده است. این امر با استفاده از فاینتیونینگ (تنظیم جزئی بر پایه گونهی هدف) ممکن میشود.
هدف نهایی گوگل، نزدیکتر کردن ارتباط میان انسان و دیگر گونههاست—نه فقط با دلفینها، بلکه شاید در آینده با سایر جانوران هوشمند.

