Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Календарь огородника: что посадить в начале лета, чтобы успеть собрать урожай осенью Календарь огородника: что посадить в начале лета, чтобы успеть собрать урожай осенью

К счастью, есть растения, которыми не поздно заниматься даже летом

Популярная механика
Как Земля создала нас. Отрывок из книги Льюиса Дартнелла «Происхождение» Как Земля создала нас. Отрывок из книги Льюиса Дартнелла «Происхождение»

Отрывок из книги «Происхождение» — о том, как Земля повлияла на цивилизации

СНОБ
Стеклоочистители, Wi-Fi и посудомоечные машины: 10 изобретений, которые придумали женщины Стеклоочистители, Wi-Fi и посудомоечные машины: 10 изобретений, которые придумали женщины

«Большинство изобретений — заслуга мужчин», — распространенное заблуждение

ТехИнсайдер
Как привести себя в ресурсное состояние прямо сейчас Как привести себя в ресурсное состояние прямо сейчас

Где взять ресурсы, когда одолевает тревога?

Psychologies
20 способов держать мозг в тонусе 20 способов держать мозг в тонусе

Полезные привычки для улучшения когнитивных способностей

Psychologies
WayRay Holograktor для метавселенной: первый в мире автомобиль с голографическим остеклением WayRay Holograktor для метавселенной: первый в мире автомобиль с голографическим остеклением

Первый в мире автомобиль с голографическим AR-остеклением

Популярная механика
Своя игра Своя игра

Актриса о том, почему ей интересно бросать себе вызов, а еще о любви и правде

Grazia
«Юмор из моей жизни никуда не делся» «Юмор из моей жизни никуда не делся»

Интервью с актрисой Марией Кравченко, звездой сериала «Полярный 2»

OK!
Коричневые пауки-отшельники: интересные факты об этом невероятно опасном членистоногом Коричневые пауки-отшельники: интересные факты об этом невероятно опасном членистоногом

Как распознать этот опасный вид пауков, и что делать, если вас все же укусили

Популярная механика
Неверное прочтение: почему молитвы не помогут внедрить патриотизм в российскую школу Неверное прочтение: почему молитвы не помогут внедрить патриотизм в российскую школу

Можно ли заставить российских школьников начинать день с молитвы

Forbes
Что мешает тебе стать богатой: объясняет Михаил Лабковский Что мешает тебе стать богатой: объясняет Михаил Лабковский

Симптомы "врожденной бедности"

VOICE
Что такое 5 языков любви? Всё, что тебе нужно об этом знать Что такое 5 языков любви? Всё, что тебе нужно об этом знать

Как можно выражать и получать любовь?

Cosmopolitan
10 признаков того, что в отношениях пора ставить точку 10 признаков того, что в отношениях пора ставить точку

По каким именно признакам можно понять, что отношения пора завершать?

Psychologies
Мама и папа в стиле дзен Мама и папа в стиле дзен

Несколько советов, чтобы сделать повседневную жизнь родителя более безмятежной

Psychologies
Хочется, но колется: все, что ты хотела знать о ботоксе Хочется, но колется: все, что ты хотела знать о ботоксе

Делать уколы ботокса или нет? Но как не стать «куклой» и не потерять мимику?

VOICE
6 привычек, которые повышают уровень сахара в крови 6 привычек, которые повышают уровень сахара в крови

Какие наши ежедневные действия могут повысить уровень сахара в крови?

Популярная механика
Знаки приоритета: что это и какие бывают Знаки приоритета: что это и какие бывают

Знаки приоритета являются одними из самых важных на дороге

РБК
«Я родилась рабыней» — отрывок из книги Харриет Джейкобс «Я родилась рабыней» — отрывок из книги Харриет Джейкобс

Отрывок из автобиографии рабыни Харриет Джейкобс

СНОБ
Почему у животных разные формы зрачков Почему у животных разные формы зрачков

Как объяснить разнообразие зрачков у животных?

Популярная механика
Как будет работать интернет на Луне: готовимся к масштабной эмиграции в космос Как будет работать интернет на Луне: готовимся к масштабной эмиграции в космос

Andromeda обеспечит связью абонентов, которые будут жить и работать на Луне

Популярная механика
Как Аль Капоне во время Великой депрессии заправлял бесплатной столовой Как Аль Капоне во время Великой депрессии заправлял бесплатной столовой

Почему гангстер Аль Капоне открыл бесплатную столовую?

Популярная механика
Так ли безобидны? Когда капли для глаз могут навредить Так ли безобидны? Когда капли для глаз могут навредить

Многие используют капли при любом дискомфорте глаз. А безопасно ли это?

Лиза
Талант можно пропить: 10 гениев, которые страдали алкоголизмом Талант можно пропить: 10 гениев, которые страдали алкоголизмом

Люди, которые внесли огромный вклад в историю, но страдали от алкоголизма

ТехИнсайдер
Удар, еще удар: пять актеров, которые не прочь подраться вне съемочной площадки Удар, еще удар: пять актеров, которые не прочь подраться вне съемочной площадки

Актеры, известные своей любовью подраться

Playboy
Блеск и нищета Америки сороковых в фильме «Аллея кошмаров» Блеск и нищета Америки сороковых в фильме «Аллея кошмаров»

Как художник Луис Секейра работал над костюмами к фильму «Аллея кошмаров»

Esquire
Камера, способная уловить ядерный взрыв: 580 000 000 000 кадров в секунду Камера, способная уловить ядерный взрыв: 580 000 000 000 кадров в секунду

Три знаменитые камеры для высокоскоростной съемки

ТехИнсайдер
Лампочка, которая не гаснет уже больше века Лампочка, которая не гаснет уже больше века

В Ливерморе, штат Калифорния, есть лампочка, которая не гаснет

Популярная механика
10 лучших дорам 10 лучших дорам

Современные сериалы – это праздник для любительниц растянуть удовольствие

VOICE
Родной, но чужой Родной, но чужой

Как организму женщины удается сохранить иммунную толерантность к плоду?

Здоровье
Как мультики помогают говорить с детьми на сложные темы Как мультики помогают говорить с детьми на сложные темы

Как поддерживающая анимация помогает детям не бояться болезни

СНОБ
Открыть в приложении