Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

7 крутых маринадов для шашлыка, которые вам точно пригодятся на майских праздниках 7 крутых маринадов для шашлыка, которые вам точно пригодятся на майских праздниках

Мясо само себя не приготовит: собрали для вас семь вкусных шашлычных маринадов

Популярная механика
7 факторов, которые резко увеличивают уровень сахара в крови 7 факторов, которые резко увеличивают уровень сахара в крови

Даже если у вас нет диабета, будьте осторожны с этими продуктами и привычками

Популярная механика
Здоров ли сайт: как провести аудит самостоятельно и когда привлекать специалистов Здоров ли сайт: как провести аудит самостоятельно и когда привлекать специалистов

Как самостоятельно выявить слабые места сайта?

Inc.
«Худший человек на свете»: фильм о мнимом выборе и реальной свободе «Худший человек на свете»: фильм о мнимом выборе и реальной свободе

Возможно ли полное принятие себя — и как научиться слышать внутренний голос?

Forbes
Ученые назвали главные факторы того, почему вы чувствуете себя уставшим Ученые назвали главные факторы того, почему вы чувствуете себя уставшим

Почему взрослые люди чувствуют себя постоянно уставшими?

ТехИнсайдер
Вреднее, чем конфеты: 7 привычных продуктов, которые беспощадно портят наши зубы Вреднее, чем конфеты: 7 привычных продуктов, которые беспощадно портят наши зубы

Многие продукты вреднее для зубов, чем сладости

ТехИнсайдер
9 жутких и загадочных водоемов мира 9 жутких и загадочных водоемов мира

Что страшного таят темные воды?

Популярная механика
Не Netflix единым: лучшие программы для домашнего медиасервера Не Netflix единым: лучшие программы для домашнего медиасервера

Список самых популярных приложений для организации медиасервера на домашнем ПК

CHIP
Шутить изволите? Шутить изволите?

О чем говорит твое чувство юмора

Лиза
Менять или ждать: водителям объяснили, когда ехать в шиномонтаж Менять или ждать: водителям объяснили, когда ехать в шиномонтаж

Когда менять зимнюю резину на летнюю и можно ли найти нужные варианты

РБК
Под матрас или в банку? Под матрас или в банку?

Где лучше хранить деньги в доме: изучили основные правила фэншуй

Лиза
Женщина, которая родила кроликов: история Мэри Тофт Женщина, которая родила кроликов: история Мэри Тофт

Мэри Тофт родила кроликов – и об этом знал каждый в Лондоне

Cosmopolitan
Проект Icarus по наблюдению за миграциями животных с борта МКС остановлен по инициативе «Роскосмоса» Проект Icarus по наблюдению за миграциями животных с борта МКС остановлен по инициативе «Роскосмоса»

Работа проекта Icarus, программы по отслеживанию миграций животных с помощью МКС

N+1
Мигрирующие морские слоны определили расстояние до родной колонии Мигрирующие морские слоны определили расстояние до родной колонии

Как морские слоны выбирают оптимальное время для начала миграции

N+1
«Видеть надежду среди безнадежности»: Эдит Эгер о том, как победить страх «Видеть надежду среди безнадежности»: Эдит Эгер о том, как победить страх

В 16 лет Эдит Эгер попала в Освенцим, потеряла там родителей, но выжила

Forbes
Артюр Рембо Артюр Рембо

Цитаты поэта, умершего в 1891 году в Марселе

Esquire
«Если вы идёте сквозь ад — не останавливайтесь». Что говорят руководители своим сотрудникам в начале нового кризиса «Если вы идёте сквозь ад — не останавливайтесь». Что говорят руководители своим сотрудникам в начале нового кризиса

Мы собрали несколько сильных обращений руководителей к своим командам

Inc.
Америку открыл Колумб, но почему это не отразилось в её названии? Америку открыл Колумб, но почему это не отразилось в её названии?

Почему Новый Свет не назван в честь Христофора Колумба?

Популярная механика
На вас напала стая бездомных собак: что важно знать и как себя вести — полезная памятка На вас напала стая бездомных собак: что важно знать и как себя вести — полезная памятка

Почему бродяги набрасываются на людей и что делать, если на вас напали?

Популярная механика
5 аудиокниг от известных психологов и психотерапевтов, которые помогут справиться с тревогой 5 аудиокниг от известных психологов и психотерапевтов, которые помогут справиться с тревогой

Аудиокниги для снижения тревоги, отвлечения от новостей и дурных мыслей

Maxim
Как достойно завершить отношения? Мужской взгляд и мнение психолога Как достойно завершить отношения? Мужской взгляд и мнение психолога

Наш герой прошел через расставание и делится своим опытом

Psychologies
Пазл сложился: как Apple удалось замкнуть логистическую цепочку внутри компании Пазл сложился: как Apple удалось замкнуть логистическую цепочку внутри компании

Почему процессоры Apple — событие последних нескольких лет?

Forbes
Гормон боли и счастья: что такое эндорфин и зачем он нужен Гормон боли и счастья: что такое эндорфин и зачем он нужен

Какую роль эндорфин играет в организме и как повысить его уровень

РБК
Что делать, если дверь авто захлопнулась, а ключи остались в салоне Что делать, если дверь авто захлопнулась, а ключи остались в салоне

Как поступить, если вы заперли машину с ключами внутри

ТехИнсайдер
Страх разоблачения и плата за везение: что такое синдром самозванца Страх разоблачения и плата за везение: что такое синдром самозванца

Рассказываем о причинах, признаках и популярности синдрома самозванца

Forbes
5 советов, как отучить собаку лаять без повода 5 советов, как отучить собаку лаять без повода

Реально ли перевоспитать своего громкого питомца и отучить его постоянно лаять?

Лиза
Детская непосредственность Детская непосредственность

Почему роспись нового храма в Морозовской больнице не доведена до конца

Forbes
«Я потерял смысл жизни»: как быть, если последние события в мире лишили вас чего-то важного «Я потерял смысл жизни»: как быть, если последние события в мире лишили вас чего-то важного

Почему нельзя называть какие-либо утраты — неважными

Psychologies
Сергей Гилев Сергей Гилев

В прошлом журналист, а ныне успешный актер Сергей Гилев

Grazia
Насколько реальна совместимость по знакам зодиака? Насколько реальна совместимость по знакам зодиака?

Наша жизнь и наши отношения могут быть предопределены звездами

Cosmopolitan
Открыть в приложении