Сегодня 26 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Угадай мелодию, или Системы идентификации музыкальных композиций

Любителей слушать музыку несть числа. Для одних меломанов она является источником вдохновения и играет важную роль в жизни, другим она позволяет расслабиться и собраться с мыслями, а третьим - увидеть в ней отражение собственных эмоций и переживаний. Немало находится и тех, для кого данный вид искусства является лишь средством развлечения, скрашивающим суровые будни и заставляющим изредка ломать голову над идентификацией той или иной композиции, доносящейся из колонок или наушников. Да что говорить, наверняка, каждый из читателей 3DNews хоть раз да сталкивался с ситуацией, когда по радио звучит красивая мелодия, а вспомнить ее название и исполнителя (для последующего пополнения личной фонотеки, например) не получается. В таких случаях приходится еще долго прокручивать в памяти полюбившееся произведение и сожалеть о том, что ди-джей поскупился на слова и умолчал о том, кто же был автором композиции. Обычные поисковые машины в решении данной задачи не помогут, а вот специальные сервисы, по небольшому записанному отрывку песни определяющие ее название и исполнителя, вполне могут с ней справиться. Обзору таких необычных инструментов мы и посвятим данный материал.

Прежде чем перейти непосредственно к знакомству с героями сегодняшней статьи, позволим себе сделать небольшое лирическое отступление и вкратце рассказать о принципах работы рассматриваемых систем. В самом простом изложении техническая суть работы систем распознавания музыки сводится к использованию метода идентификации композиций с применением технологии акустических отпечатков, представляющих собой компактную цифровую последовательность, которая описывает характерные частотные составляющие звукового сигнала. Для каждой записи аудиоотпечаток уникален и может быть использован для определения треков, записанных с разным качеством, подвергнутых искажениям и преобразованиям. Эта особенность делает упомянутую методику крайне эффективной и обеспечивает высокий уровень распознавания.

Принцип распознавания песни таков: с записанного на скорую руку фрагмента неизвестной мелодии продолжительностью от 15 до 45 секунд снимается отпечаток, который затем отправляется в базу данных используемой системы, где происходит поиск совпадений с аудиоотпечатками уже опознанных композиций. В результате такого распознавания обнаруживаются один или несколько треков-кандидатов, совпадающих с обработанным файлом с той или иной вероятностью.

Для оценки возможностей каждого рассматриваемого сервиса мы подготовили три тестовых аудиофрагмента в формате MP3 продолжительностью по 30 секунд: один из известной всем поклонникам группы The Beatles композиции Michelle, второй из песни Владимира Высоцкого "Кругом пятьсот" (альтернативное название - "Дорожная история") и третий из созданного по книге Эдуарда Успенского "Дядя Федор, Пес и Кот" мультипликационного фильма "Зима в Простоквашино" (помните строчки "А я все чаще замечаю, что меня как будто кто-то подменил"?). Для чистоты эксперимента все информационные теги, содержащиеся в проверочных композициях, были удалены, а сами файлы были переименованы в ни о чем не говорящие объекты с именами track1.mp3, track2.mp3 и track3.mp3.

AudioTag.info. Первый попавший в поле нашего зрения ресурс для распознавания музыки начал свою работу 6 марта 2009 года и умеет общаться с пользователем на русском и английском языках. Несмотря на молодость, проект может похвастаться не только внушительных размеров базой данных, хранящей сведения о более чем 1,3 млн музыкальных треках самых разных жанров, но и универсальным движком, распознающим файлы в форматах WAV, MP3, OGG, FLV, AMR, MP4 и многих других. Регистрации для работы с AudioTag.info не требуется: достаточно открыть браузер, загрузить фрагмент композиции (оптимальная продолжительность 15-45 секунд), ввести проверочный код, и робот, проанализировав доставшийся ему файл, постарается распознать его и выдать о нем подробную информацию. В нашем случае система безошибочно распознала все три отрывка тестовых композиций, что, конечно же, не может не радовать.

Shazam. Мобильный сервис, представляющий собой альтернативу присутствующему в телефонах Sony Ericsson инструментарию TrackID и реализованный с прицелом на широкий спектр портативных устройств, функционирующих на базе Windows Mobile, Symbian, Android, Apple iOS и BlackBerry. Клиентское приложение Shazam записывает отрывок (10-12 секунд) музыкального произведения с помощью встроенного микрофона телефона, формирует аудиоотпечаток и отсылает его на сервер, где он сравнивается с представленными в базе данных образцами треков. В случае успеха, на дисплее смартфона высвечивается информация о песне с обложкой соответствующего альбома и прочими полезными сведениями. Работает мобильная служба на удивление быстро и просто - от пользователя требуется только нажимать клавишу Tag Now и успевать анализировать поступающие от системы сообщения. С нашими тестовыми заданиями установленная на WM-девайс программа справилась на "четверку", оставив инкогнито только произведение Владимира Семеновича. Впрочем, вряд ли стоит записывать в недостатки Shazam отсутствие в базе данных одной из композиций Высоцкого, так как другую взятую для пробы песню отечественного барда заморский сервис распознал на "ура". Согласно предоставленным разработчиками сведениям, музыкальная база данных проекта насчитывает более восьми миллионов треков. Впечатляет.

Midomi. Сервис, предоставляющий любому посетителю сайта возможность вспомнить врезавшуюся в память композицию путем напевания или насвистывания оной в микрофон компьютера или мобильного устройства. Владельцам последних предоставлен также стандартный функционал, подразумевающий запись отрывка музыкального произведения с микрофона телефона и последующую отправку акустических отпечатков на сайт с базой данных аудиофайлов. Клиентские приложения Midomi доступны для портативных устройств под управлением ОС Windows Mobile, Symbian, Android и Apple iOS. Результат сканирования файлов упомянутым сервисом продемонстрировал англоязычную направленность службы, опознавшей только творение британской рок-группы из Ливерпуля. С творчеством отечественных исполнителей заморский музыкальный эксперт оказался не знаком.

Tunatic. Еще одно решение для идентификации музыки, выполненное в виде небольшой утилиты для операционных систем Windows и Mac OS X. Программа перехватывает звуковой поток с аудиокарты, производит анализ акустической информации в онлайновой базе данных и выдает вердикт о проигрываемой композиции. В случае обнаружения совпадения в БД, Tunatic отображает название песни и имя автора вместе со ссылкой на страницу, где указаны интернет-магазины, в которых можно приобрести полюбившееся произведение. Как показала практика, с определением композиций приложение справляется не ахти как, и разработчики продукта открыто предупреждают, что с классической музыкой к программе можно не обращаться. Знаменитую песню ансамбля "Битлз" утилита определила с ходу, а вот песню кота Матроскина в исполнении Олега Табакова и творчество Владимира Высоцкого не признала.

MusicBrainz. Открытая база данных, хранящая акустические отпечатки для самых разных музыкальных композиций, количество которых усилиями энтузиастов медленно, но верно приближается к планке в 10 миллионов треков. Будучи развиваемым на добровольных началах, проект предлагает пользователя внушительную коллекцию клиентских приложений для разных платформ, функциональная начинка которых позволяет работать не только с отдельными аудиофайлами, но и с целыми альбомами, наводя порядок в хранящихся на компьютере медиабиблиотеках. Потенциал MusicBrainz огромен, однако на практике выяснилось, что 30-секундных отрывков песен системе явно недостаточно для определения композиций, и что в ее познаниях русской музыки фигурируют обширные пробелы.

В случае если ни один из рассмотренных выше сервисов не помог в деле опознания неизвестной мелодии, на помощь может прийти музыкальная энциклопедия Musipedia, предлагающая несколько вариантов поиска песен: посредством напевания или насвистывания их в микрофон ПК, "настукивания" произведения с помощью клавиши "пробел", наигрывания мелодии на виртуальном фортепиано или введения кодов Парсонса. Естественно, качество поиска зависит от многих факторов, важнейшим из которых, по сути, является тривиальное наличие у пользователя чувства ритма и слуха. Кому понравилось стучать по клавиатуре и играть с компьютером в "Угадай мелодию", тому мы может порекомендовать сервис SongTapper и его отечественный аналог "Ритмотека". С одной стороны, работа с упомянутыми инструментами может напоминать забавный аттракцион, с другой - их использование может стать последней возможностью найти песню, мелодия которой никак не выходит из головы.

Если у кого-то из уважаемых читателей возникнет желание поделиться своими находками и опытом в данной области, таковых милости просим в наш форум. Не исключено, что совместными усилиями удастся собрать наиболее полную подборку способов определения авторства неизвестных мелодий.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Microsoft получает всё больше выгоды от ИИ — компания показала сильный квартальный отчёт 2 мин.
Газировка с Copilot: Microsoft получила миллиардный контракт на обеспечение Coca-Cola облачными и ИИ-сервисами 5 мин.
Продюсер «Смуты» раскрыл, что добавят в игру с обновлениями, и подтвердил работу над продолжением 23 мин.
ИИ-приложение Google Gemini стало совместимо с Android 10 и Android 11 47 мин.
В США вернули сетевой нейтралитет 2 ч.
Alphabet объявила о первых в своей истории дивидендах, акции выросли в цене на 11,4 % 2 ч.
Младенец-экстрасенс против секретной корпорации: соавторы Before Your Eyes анонсировали сюжетное приключение Goodnight Universe 2 ч.
AMD выпустила драйвер с поддержкой игры Manor Lords и исправлением множества ошибок 8 ч.
Telegram обновился: рекомендованные каналы, дни рождения, трансляция геопозиции и аватарки при пересылке 13 ч.
В Steam и на консолях вышел боевик Another Crab's Treasure в духе Dark Souls, но про краба-отшельника — игроки в восторге 13 ч.
Meta увеличит инвестиции в развитие инфраструктуры ИИ и готовит крупнейшие капиталовложения в истории компании 14 мин.
HPE построила самый мощный в Польше суперкомпьютер Helios производительностью 35 Пфлопс 15 мин.
AWS построит в Индиане кампус ЦОД стоимостью $11 млрд 25 мин.
США усиливают давление на Японию, Южную Корею и Нидерланды, требуя ужесточить антикитайские санкции 30 мин.
Honor вышел в лидеры китайского рынка смартфонов, на втором месте — Huawei 42 мин.
Samsung заключила контракт с AMD на поставку HBM3E на сумму $3 млрд 2 ч.
Процессор HiSilicon Kirin 9010 внутри смартфонов Huawei Pura 70 тоже выпускается SMIC по 7-нм технологии 3 ч.
TSMC не потребуется оборудование High-NA EUV для выпуска чипов по технологии A16 4 ч.
Выручка Intel выросла на 9 %, но прогноз на текущий квартал вызвал падение курса акций на 7,75 % 7 ч.
Honor представила смартфон Honor 200 Lite с Dimensity 6080 и 108-Мп камерой 8 ч.