Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

8 способов обмануть свой мозг, когда вы на диете 8 способов обмануть свой мозг, когда вы на диете

Может ли ваш мозг саботировать ваши усилия по снижению веса?

Популярная механика
Измени меню: 8 продуктов, которые снижают либидо Измени меню: 8 продуктов, которые снижают либидо

Какие продукты снижают уровень тестостерона?

VOICE
Как снять защиту записи флешки: избавляемся от ошибки «диск защищен» Как снять защиту записи флешки: избавляемся от ошибки «диск защищен»

Как снять защиту записи с флешки usb, если диск защищен?

CHIP
Был ли знаменитый танк «Тигр» действительно таким великим? Был ли знаменитый танк «Тигр» действительно таким великим?

Стоил ли танк «Тигр» затраченных на него ресурсов и денег?

Популярная механика
В Турции братьев приговорили к 45376 годам тюрьмы за онлайн-игру про ферму! В Турции братьев приговорили к 45376 годам тюрьмы за онлайн-игру про ферму!

Как была устроена афера создателей игры Ciftlik Bank

ТехИнсайдер
Движение в жизнь Движение в жизнь

Экзоскелеты, которые помогают ходить людям, утратившим эту способность

Harper's Bazaar
Холст, масло, арест. Как искусство больше 100 лет становится заложником политики и идеологии Холст, масло, арест. Как искусство больше 100 лет становится заложником политики и идеологии

История международных и локальных, музейных и политических арт-дел

Esquire
Лазерное омоложение: мифы и реальность Лазерное омоложение: мифы и реальность

Разбираем самые популярные заблуждения о лазерном омоложении

РБК
Переделкино Переделкино

Я оставила свою семью, обязанности, быт, чтобы поселиться в лесу и писать текст

Seasons of life
Дискомфорт в интимной зоне: 5 вещей, которые категорически нельзя делать Дискомфорт в интимной зоне: 5 вещей, которые категорически нельзя делать

Какие ошибки девушек мешают нормальному лечению интимных заболеваний?

Cosmopolitan
18 фактов об увеличении губ, которые нужно знать до того, как ты примешь решение 18 фактов об увеличении губ, которые нужно знать до того, как ты примешь решение

Увеличение губ может изменить твою внешность, главное — не переборщить

VOICE
Что такое MVP и зачем он нужен: рассказываем о тонкостях создания цифрового продукта Что такое MVP и зачем он нужен: рассказываем о тонкостях создания цифрового продукта

MVP — это готовый к использованию продукт с ограниченным функционалом

Популярная механика
Скромная кудрявая капуста, ставшая модным салатом кейл Скромная кудрявая капуста, ставшая модным салатом кейл

Салатом «кейл» называют листовую капусту без кочана

Наука и жизнь
А взрослые дома есть? А взрослые дома есть?

Мы не всегда замечаем сами, как попадаем в то или иное состояние

Psychologies
Машиноместо Машиноместо

Дом для семьи и коллекции автомобилей

Robb Report
«Происхождение. Как Земля создала нас» «Происхождение. Как Земля создала нас»

Отрывок из книги Льюиса Дартнелла о роли геологических процессов в истории людей

N+1
Другая женщина. Иногда появление соперницы – не трагедия, а выход Другая женщина. Иногда появление соперницы – не трагедия, а выход

Измена – ситуация банальная, но от этого она не становится менее болезненной

Лиза
Насколько вы близки к выгоранию? Насколько вы близки к выгоранию?

Ощущение, что пора отдохнуть, — или упадок сил? Иногда мы не замечаем разницы

Psychologies
Бессмертная Миранда Бессмертная Миранда

Миранда была открыта нидерландским и американским астрономом Джерардом Койпером

Наука и жизнь
10 военных фильмов 10 военных фильмов

Лучшие военные/антивоенные фильмы

Weekend
Сцепление автомобиля: как оно работает и почему ломается Сцепление автомобиля: как оно работает и почему ломается

Сцепление: каким оно бывает и как понять, что оно неисправно

РБК
Типы личности и IT: какую профессию выбрать? Типы личности и IT: какую профессию выбрать?

Как выбрать подходящую специальность в IT-сфере

Psychologies
50 ошибок в общении, которые вы совершаете ежедневно 50 ошибок в общении, которые вы совершаете ежедневно

Как бы ни хотелось закрыться от мира, общаться с людьми все же приходится

Psychologies
В ваших интересах В ваших интересах

Рассматриваем тревел-мифы и разбираемся, так ли все на самом деле

Grazia
20 растений, которые всегда должны расти рядом: идеальная совместимость в саду 20 растений, которые всегда должны расти рядом: идеальная совместимость в саду

Растения-компаньоны или правила совместных посадок

Популярная механика
Знаки приоритета: что это и какие бывают Знаки приоритета: что это и какие бывают

Знаки приоритета являются одними из самых важных на дороге

РБК
Путеводитель по Армении Путеводитель по Армении

Армения: условия въезда и интересные места для посещения в стране

VC.RU
Как сбросить iPhone до заводских настроек перед продажей: подробности и рекомендации Как сбросить iPhone до заводских настроек перед продажей: подробности и рекомендации

Разбираемся, как обнулить свой iPhone

Playboy
8 советов по быстрой уборке: как эффективно и поскорее создать порядок (или его видимость) 8 советов по быстрой уборке: как эффективно и поскорее создать порядок (или его видимость)

Как убраться в последнюю минуту?

Популярная механика
Что делать, если дверь авто захлопнулась, а ключи остались в салоне Что делать, если дверь авто захлопнулась, а ключи остались в салоне

Как поступить, если вы заперли машину с ключами внутри

ТехИнсайдер
Открыть в приложении