Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

5 космических технологий, которые теперь есть в ваших автомобилях 5 космических технологий, которые теперь есть в ваших автомобилях

Каждому уже удалось увидеть хотя бы частички космической технологии!

Популярная механика
Как работают текстовые психологические консультации Как работают текстовые психологические консультации

Не все из нас готовы общаться с психологом напрямую

Psychologies
Как найти музыку из видео: 7 рабочих способов на все случаи жизни Как найти музыку из видео: 7 рабочих способов на все случаи жизни

Простые способы, как найти музыку из видео на телефоне

CHIP
Топ-10 ошибок при домашнем окрашивании, которые испортят волосы Топ-10 ошибок при домашнем окрашивании, которые испортят волосы

Как избежать ошибок, когда сама красишь волосы?

VOICE
Тихоходкам набили татуировки электронным пучком Тихоходкам набили татуировки электронным пучком

Китайские материаловеды нанесли татуировки живым тихоходкам

N+1
В чем различия мужского и женского мозга В чем различия мужского и женского мозга

Кому легче адаптироваться к переменам? Влияет ли тестостерон на поведение?

Psychologies
Юлия Бордовских: «Женщина не стареет, она взрослеет» Юлия Бордовских: «Женщина не стареет, она взрослеет»

Юлия Бордовских — о новой профессии, отношении к возрасту и идеалах красоты

Здоровье
Побег из теплицы Побег из теплицы

Почему вставать на сторону ребенка нужно не всегда

Maxim
Можно ли разогревать пластик в микроволновой печи Можно ли разогревать пластик в микроволновой печи

Можно ли греть еду в пластиковой посуде в микроволновке?

CHIP
Стоит ли верить гороскопам? 9 каверзных вопросов к астрологам Стоит ли верить гороскопам? 9 каверзных вопросов к астрологам

Три американских астролога комментируют современное отношение к их работе

VOICE
Грязь под крышей мира Грязь под крышей мира

Что ждет Катманду в ближайшем будущем?

Вокруг света
Не опустевшее гнездо Не опустевшее гнездо

Почему иногда подросшие «птенцы» не покидают родительский дом?

Psychologies
Русская усадьба Русская усадьба

Уклад жизни в доме под сенью хвойного леса подчинён идее единения с природой

Идеи Вашего Дома
Что нужно есть на завтрак, чтобы похудеть: рассказывает диетолог Что нужно есть на завтрак, чтобы похудеть: рассказывает диетолог

Составить меню для полезного завтрака проще простого

VOICE
Эпохальные сцены: 12 самых необычных театров мира Эпохальные сцены: 12 самых необычных театров мира

Xтобы быть актуальнее и ближе к зрителю, театр нуждается в свежем взгляде

Вокруг света
Возможна ли дружба между мужчиной и женщиной? Возможна ли дружба между мужчиной и женщиной?

Какое место занимает сексуальность в отношениях друзей разного пола?

Psychologies
Ангельское число 666: что оно означает и почему его не нужно бояться Ангельское число 666: что оно означает и почему его не нужно бояться

Что означает число 666 и как действовать, если ты стала слишком часто его видеть

Cosmopolitan
Кто такие ассирийцы: история древнего города Ассирия Кто такие ассирийцы: история древнего города Ассирия

Ассирийцы – один из самых древних народов мира

Популярная механика
Оттенки зеленого Оттенки зеленого

Электрокары: такие ли они «зеленые», как об этом говорят?

Playboy
Реальность против виртуального мира: как будут расширяться первые метавселенные Реальность против виртуального мира: как будут расширяться первые метавселенные

Метавселенные действительно существуют как технологическое и социальное явление

Популярная механика
Под монголоидной погребальной маской из Хакасии оказался таштыкец-европеоид Под монголоидной погребальной маской из Хакасии оказался таштыкец-европеоид

Антропологи исследовали мумифицированные останки древнего сибиряка

N+1
Альпийская мечта Альпийская мечта

Проект в стиле шале — с террасой, балконами под крышей, мансардой и камином

Идеи Вашего Дома
Как Мария Трубникова открыла первую благотворительную организацию для женщин Как Мария Трубникова открыла первую благотворительную организацию для женщин

Мария Трубникова посвятила свою жизнь борьбе за гендерное равенство

Forbes
В 14 нос, а в 18 — грудь: звезды, которые очень рано сделали пластику В 14 нос, а в 18 — грудь: звезды, которые очень рано сделали пластику

Звездные истории о слишком рано сделанных пластических операциях

Cosmopolitan
Антон Аликов: «В метавселенную мигрируют экономика, культура, образование и даже спорт» Антон Аликов: «В метавселенную мигрируют экономика, культура, образование и даже спорт»

Рискованно ли вкладывать деньги в метавселенные

РБК
Крокодилы: интересные факты и особенности Крокодилы: интересные факты и особенности

Крокодилы - крупные рептилии, обитающие в тропических регионах

Популярная механика
Рыбацкие сети, бумага и яблочная кожура: из чего делают ремешки для часов Рыбацкие сети, бумага и яблочная кожура: из чего делают ремешки для часов

На смену классической натуральной коже приходят нетрадиционные материалы

РБК
Как быстро упаковать вещи: 10 лайфхаков для экстренного переезда Как быстро упаковать вещи: 10 лайфхаков для экстренного переезда

Возьми себя в руки и продумай переезд

Playboy
Мы живем в террариуме, а на Марсе есть жизнь: 6 теорий заговора о космосе, в которые все еще верят Мы живем в террариуме, а на Марсе есть жизнь: 6 теорий заговора о космосе, в которые все еще верят

Может и правда на Луне никто не высаживался

Playboy
Островные сокровища Островные сокровища

Соцсети пестрят красивыми фотографиями туристов, снятыми в Сахалинской области

Отдых в России
Открыть в приложении