Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Зачем азиатский профессор создавал вирусы: сумасшедший или спаситель? Зачем азиатский профессор создавал вирусы: сумасшедший или спаситель?

Труды профессора Каваоки наделали много шума во всем мире

Популярная механика
Держим курс на весну Держим курс на весну

10 свежих идей для преображения дома

Лиза
Домашняя работа: как привести IT в ЖКХ в порядок Домашняя работа: как привести IT в ЖКХ в порядок

О том, что можно сделать с хаосом в жилищно-коммунальном IT

Forbes
Почему фонду с капиталом в $544 млн становится сложно выкупать стартапы Почему фонду с капиталом в $544 млн становится сложно выкупать стартапы

Венчурный инвестор — о том, как меняются правила игры на рынке

Forbes
Никаких шлепок и свадебных платьев: какой дресс-код советуют соблюдать музеи и театры Никаких шлепок и свадебных платьев: какой дресс-код советуют соблюдать музеи и театры

Какие рекомендации по выбору одежды мировые театры и музеи дают посетителям

Forbes
Физиология марафонца: каким должен быть организм бегуна, который хочет установить мировой рекорд Физиология марафонца: каким должен быть организм бегуна, который хочет установить мировой рекорд

Как работает организм на длинных дистанциях

Популярная механика
С чего начать половое воспитание: рассказывает врач-психотерапевт С чего начать половое воспитание: рассказывает врач-психотерапевт

В каком возрасте и что говорить ребенку о половом воспитании?

Psychologies
Пролог к мировым войнам Пролог к мировым войнам

Русско-японская война стала шоком отнюдь не только для России

Дилетант
Эльвира Янковская: «В жизни всё надо делать очень качественно и от сердца Эльвира Янковская: «В жизни всё надо делать очень качественно и от сердца

Эльвира Янковская знает, как из любой девушки сделать королеву

Cosmopolitan
Ученые зря ломали голову над этими технологиями: 9 гениальных изобретений, которые случайно придумали дети Ученые зря ломали голову над этими технологиями: 9 гениальных изобретений, которые случайно придумали дети

Некоторые дети стали настоящими изобретателями и внесли вклад в мир технологий

ТехИнсайдер
Гении маскировки: 7 животных с неповторимым камуфляжем Гении маскировки: 7 животных с неповторимым камуфляжем

Порой, то, что кажется «красивым окрасом», является настоящим охотничьим оружием

Популярная механика
Как нельзя краситься и стричься стюардессам пятизвездочных авиакомпаний Как нельзя краситься и стричься стюардессам пятизвездочных авиакомпаний

Каким бьюти-правилам должны неукоснительно следовать стюардессы

Cosmopolitan
Частоту магнонов увеличили в 60 раз Частоту магнонов увеличили в 60 раз

Ученые продемонстрировали генерацию высших гармоник для спиновых волн

N+1
Физики научились адресно управлять слоями ультрахолодных молекул Физики научились адресно управлять слоями ультрахолодных молекул

Физики учатся исследовать новые фазы молекулярного вещества

N+1
Ничего не бойся: 13 правил жизни сильной женщины Ничего не бойся: 13 правил жизни сильной женщины

Что действительно важно помнить в те дни, когда опускаются руки

VOICE
Ничего лишнего Ничего лишнего

Минималистичный и одновременно функциональный интерьер загородного дома

Идеи Вашего Дома
Отрывок из книги Алексея Иванова «Хребет России» Отрывок из книги Алексея Иванова «Хребет России»

Отрывок из книги Алексея Иванова, куда вошли сто новелл об Урале

СНОБ
Как избавиться от ожирения: бариатрическая хирургия Как избавиться от ожирения: бариатрическая хирургия

Что такое бариатрическая хирургия и в чем её суть?

Популярная механика
Можно ли разогревать пластик в микроволновой печи Можно ли разогревать пластик в микроволновой печи

Можно ли греть еду в пластиковой посуде в микроволновке?

CHIP
Вокруг временщика Вокруг временщика

По мере атрибуции портретов иногда складываются целые группы персонажей

Дилетант
Самолет комсомольцев Самолет комсомольцев

Уникальный авиационный проект, созданный комсомольцами и на деньги комсомола

Популярная механика
Неверное прочтение: почему молитвы не помогут внедрить патриотизм в российскую школу Неверное прочтение: почему молитвы не помогут внедрить патриотизм в российскую школу

Можно ли заставить российских школьников начинать день с молитвы

Forbes
Пластика в 14, анорексия, отказ от мечты: как мать лепила звезд из сестер Хадид Пластика в 14, анорексия, отказ от мечты: как мать лепила звезд из сестер Хадид

Хотели ли сестры Хадид именно такой жизни?

Cosmopolitan
Как великий автомобиль стал жертвой времени: необычные факты о гениальном «Трабанте» Как великий автомобиль стал жертвой времени: необычные факты о гениальном «Трабанте»

«Трабант» никогда не был идеальным, но мало кто знает, что он настоящий уникум

ТехИнсайдер
8 ошибок при составлении списка дел 8 ошибок при составлении списка дел

Составление списка задач — эффективный способ оставаться продуктивным

Psychologies
Диагноз в интернете: чем опасно «гуглить» симптомы при плохом самочувствии Диагноз в интернете: чем опасно «гуглить» симптомы при плохом самочувствии

Gочему не стоит искать симптомы в интернете

Inc.
Кроличьи сказки Кроличьи сказки

Кролик в бабочке готовится к 70-летию: история знаменитого логотипа

Playboy
Вселенная Marvel: в каком порядке смотреть все фильмы франшизы Вселенная Marvel: в каком порядке смотреть все фильмы франшизы

В каком порядке нужно смотреть фильмы Marvel?

Cosmopolitan
Сергей Гилев Сергей Гилев

В прошлом журналист, а ныне успешный актер Сергей Гилев

Grazia
Египтологи нашли в Саккарском некрополе гробницы высокопоставленных чиновников Египтологи нашли в Саккарском некрополе гробницы высокопоставленных чиновников

Египтологи нашли новые памятники, относящиеся к III тысячелетию до нашей эры

N+1
Открыть в приложении