Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему мы чувствуем упадок сил: 5 возможных причин постоянной усталости Почему мы чувствуем упадок сил: 5 возможных причин постоянной усталости

Вы хорошо спите, правильно питаетесь и все-таки чувствуете упадок сил?

Популярная механика
Твой дорогой блонд: 5 правил для идеального окрашивания Твой дорогой блонд: 5 правил для идеального окрашивания

Что собой представляет дорогой блонд и как можно добиться такого эффекта

VOICE
Как работает автопилот и чем он отличается от круиз-контроля Как работает автопилот и чем он отличается от круиз-контроля

Насколько различаются возможности автопилота и круиз-контроля в автомобиле

Maxim
Ничего не бойся: 13 правил жизни сильной женщины Ничего не бойся: 13 правил жизни сильной женщины

Что действительно важно помнить в те дни, когда опускаются руки

VOICE
Рано списывать: 5 главных преимуществ HDD перед SSD Рано списывать: 5 главных преимуществ HDD перед SSD

Почему в некоторых случаях лучше купить HDD, а не SSD?

CHIP
Химики получили циклический молекулярный узел с 12 перекрестьями Химики получили циклический молекулярный узел с 12 перекрестьями

Как химики синтезировали сложные молекулярные узлы

N+1
Какая у вас роль в семье? Какая у вас роль в семье?

Цель этого теста — помочь вам узнать, каков ваш персонаж в семейной группе

Psychologies
5 выдающихся современных авторов, пишущих серьезную научную фантастику 5 выдающихся современных авторов, пишущих серьезную научную фантастику

Авторы, которые продолжают традиции «твердой» фантастики

Популярная механика
Переменная облачность Переменная облачность

Иногда хочется превратиться в существо-лежащее-на-спине-и-разглядывающее-облака

Вокруг света
Метод «90 минут»: как быстро и безболезненно похудеть, изменив всего одну привычку Метод «90 минут»: как быстро и безболезненно похудеть, изменив всего одну привычку

В интернете обсуждают новый способ похудения. Называется он просто — «90 минут»

VOICE
История пациента Н.М., также известного как История пациента Н.М., также известного как

Как мозг Генри Молисона помог ученым раскрыть тайну памяти

Esquire
Ошибка с библиотекой msvcp140.dll: как от нее избавиться Ошибка с библиотекой msvcp140.dll: как от нее избавиться

Ошибка библиотеки msvcp140.dll: что это за ошибка, и как ее исправить

CHIP
Коляска-противогаз, зимний сочинский солярий и другие редкие исторические фотографии, которых вы еще не видели Коляска-противогаз, зимний сочинский солярий и другие редкие исторические фотографии, которых вы еще не видели

Сегодня же эти снимки можно рассматривать часами, не переставая удивляться

Популярная механика
Как наладить контакт с партнером через прикосновения и интимную близость Как наладить контакт с партнером через прикосновения и интимную близость

Физическое удовольствие играет не последнюю роль в удовлетворенности отношениями

Psychologies
Как Земля создала нас. Отрывок из книги Льюиса Дартнелла «Происхождение» Как Земля создала нас. Отрывок из книги Льюиса Дартнелла «Происхождение»

Отрывок из книги «Происхождение» — о том, как Земля повлияла на цивилизации

СНОБ
«Управляйте стрессом»: как облегчить свое состояние «Управляйте стрессом»: как облегчить свое состояние

Как справиться со стрессом и начать жить?

Psychologies
В чем сила? В чем сила?

Как не опустошить себя до конца и остаться разносторонней личностью?

Psychologies
Мы что-то упускаем Мы что-то упускаем

У тебя бывало ощущение, что все живут интересной жизнью, кроме тебя?

Cosmopolitan
Как «работает» экономика? 8 понятных книг, которые помогут разобраться в происходящем Как «работает» экономика? 8 понятных книг, которые помогут разобраться в происходящем

8 книг, которые помогут узнать и полюбить экономическую науку

Популярная механика
От чего отказаться при повышенном сахаре в крови: 9 запрещенных продуктов, о которых должен знать каждый От чего отказаться при повышенном сахаре в крови: 9 запрещенных продуктов, о которых должен знать каждый

Даже если уровень сахара в норме, от этих продуктов лучше отказаться

Популярная механика
Дроны-спасатели в Сербии: беспилотники, способные предотвращать катастрофы Дроны-спасатели в Сербии: беспилотники, способные предотвращать катастрофы

Съемка с высоты птичьего полета пользуется спросом в разных областях жизни

Популярная механика
Частоту магнонов увеличили в 60 раз Частоту магнонов увеличили в 60 раз

Ученые продемонстрировали генерацию высших гармоник для спиновых волн

N+1
Как перепрошить мозг человека? Как перепрошить мозг человека?

Насколько быстрее было бы загрузить знания прямо в мозг!

Популярная механика
Из жертвы в бунтарку-феминистку: кто заставил принцесс эволюционировать Из жертвы в бунтарку-феминистку: кто заставил принцесс эволюционировать

Как меняются принцессы Disney?

Cosmopolitan
Как советская девушка попала в гарем: удивительная история Клавдии Рыбиной Как советская девушка попала в гарем: удивительная история Клавдии Рыбиной

Брак с иностранцем для многих жительниц СССР был мечтой

Cosmopolitan
Александр Бард: « Люди — это константа, технологии — переменная» Александр Бард: « Люди — это константа, технологии — переменная»

Киберфилософ Александр Бард — как стать нетократом сегодня?

РБК
Часто просыпаетесь среди ночи? Как быстро уснуть и чего не следует делать Часто просыпаетесь среди ночи? Как быстро уснуть и чего не следует делать

Как уснуть, если проснулся среди ночи?

Популярная механика
Как воспитывать мальчиков? Как воспитывать мальчиков?

Что женщина может дать сыну и в какие вопросы ей лучше не встревать

Psychologies
Ламинирование желатином и кое-что еще: топ-альтернатив салонным процедурам Ламинирование желатином и кое-что еще: топ-альтернатив салонным процедурам

Классные домашние методы, которые смогут заменить салонные процедуры

Cosmopolitan
Кто такие ассирийцы: история древнего города Ассирия Кто такие ассирийцы: история древнего города Ассирия

Ассирийцы – один из самых древних народов мира

Популярная механика
Открыть в приложении