Десятилетия сплетен о дельфинах, возможно, наконец-то будут переведены на ваш пиксель
На протяжении большей части истории человечества наши отношения с дельфинами были односторонними: мы разговариваем, они пищат, а мы киваем, как будто понимаем друг друга, прежде чем бросить им рыбу. Но теперь у Google есть план использовать искусственный интеллект для преодоления этого разрыва. В сотрудничестве с технологическим центром Джорджии и проектом Wild Dolphin Project (WDP) Google создала DolphinGemma — новую модель искусственного интеллекта, способную понимать и даже генерировать болтовню дельфинов.
WDP собирает данные об определенной группе диких атлантических пятнистых дельфинов с 1985 года. Базирующийся на Багамах pod предоставил огромное количество аудио-, видео- и поведенческих заметок по мере того, как исследователи наблюдали за ними, документируя каждый крик и жужжание и пытаясь собрать воедино то, что все это означает. Эта сокровищница аудио теперь загружается в DolphinGemma, которая основана на семействе моделей Gemma от Google open. DolphinGemma использует звуки дельфинов в качестве входных данных, обрабатывает их с помощью таких аудио-маркеров, как SoundStream, и предсказывает, какая вокализация может произойти в следующий раз. Представьте себе автозаполнение, но для dolphins.
Модель очень тонкая и может работать на Google Pixel. Этим летом WDP уже внедряет DolphinGemma в полевых условиях, используя Pixel 9 в водонепроницаемых устройствах. Эти модели будут прослушивать, выявлять вокальные паттерны и помогать исследователям отмечать значимые последовательности в режиме реального времени.
Флиппер говорит
Но конечная цель здесь — не просто пассивное слушание. WDP и Georgia Tech также работают над системой под названием CHAT (сокращение от телеметрии для усиления слуха у китообразных), которая, по сути, представляет собой систему двусторонней связи для людей и дельфинов. ЧАТ позволяет исследователям присваивать синтетические звуки объектам, которые нравятся дельфинам, включая водоросли и плавающие шарфы, а затем ждать, будут ли дельфины имитировать эти звуки, чтобы запросить их. Это похоже на изобретение общего языка, только вместо карточек используются подводные микрофоны.
DolphinGemma не просто анализирует звуки, издаваемые дельфинами, постфактум; она помогает предугадать, какие звуки могут раздаться, обеспечивая более быструю реакцию и плавное взаимодействие. По сути, это что-то вроде прогностической клавиатуры для дельфинов. Весь проект все еще находится на ранней стадии, но Google планирует запустить DolphinGemma с открытым исходным кодом позже в этом году, чтобы ускорить прогресс.
Первоначальная модель была разработана на основе вокализации атлантических пятнистых дельфинов, но теоретически ее можно было бы адаптировать к другим видам с некоторой доработкой. Идея состоит в том, чтобы передать другим исследователям ключи к ИИ, чтобы они могли применить его к своим собственным наборам акустических данных. Конечно, это еще далеко от общения с дельфинами о философии или их любимых закусках. Нет никакой гарантии, что звуки, издаваемые дельфинами, точно соответствуют человеческому языку. Но DolphinGemma поможет разобраться в многолетнем аудиозаписях в поисках значимых паттернов.
Дельфины — не единственные животные, с которыми люди могут использовать искусственный интеллект для общения. Другая группа ученых разработала алгоритм искусственного интеллекта для расшифровки эмоций свиней на основе их хрюканья, визга и сопения, чтобы помочь фермерам понять их эмоциональное и физическое состояние. Однако дельфины, несомненно, более харизматичны. Кто знает, может быть, когда-нибудь вы сможете спросить дорогу у дельфина во время плавания, по крайней мере, если не уроните свой телефон в воду.