Jump to content

Вырезать слова из песни


DivMan
 Share

Recommended Posts

А ведь наверно теоретически можно полностью убрать слова из песни и оставить только чистую музыку, перекодировав трек в двоичную систему счисления и удалять ненужные цифры, а потом обратно перекодировать?

Link to comment
Share on other sites

6 минут назад, DivMan сказал:

А ведь наверно теоретически можно полностью убрать слова из песни и оставить только чистую музыку, перекодировав трек в двоичную систему счисления и удалять ненужные цифры, а потом обратно перекодировать?

В двоичной системе счисление используется всего две цифры для записи это 0 и 1, оттого она и двоичная. так какие ненужные цифры ты предлагаешь удалить?

Link to comment
Share on other sites

Насколько я понимаю, это возможно, только если голос выведен в отдельную дорожку. Если этого нет, то с точки зрения аналогового звука, как и тембр любого инструмента имеет огромное количество обертонов, то есть, это не чистый синус, это очень сложный и многоаспектный спектр, имеющий свой неповторимый рисунок. Соответственно когда инструментов и голосов много, они сливаются в полифонию и ты слышишь их в совокупности. Конечно, если говорить предельно абстрактно, то звуковые волны накладываются по принципу суперпозиции, но я сомневаюсь что наложений не происходит. Поэтому когда ты слушаешь ту или иную полифонию, то у тебя идёт огромное количество звуковой информации и общая звуковая картина возникает от сочетания неповторимых оттенков каждого инструмента. Соответственно, когда она оцифровывается твои 0011110001100 кодируется не звук арфы или звук барабана, а их сочетание, на фоне гобоя... и убрав что-то от арфы, возможно уберётся что-то и трамбона. Практически уверен, что любые алгоритмы по вырезанию голоса не совершенны.

Link to comment
Share on other sites

47 минут назад, DivMan сказал:

Но там же будет много цифр, например, 

1) звук - 0111111

2) звук - 00010101111

3) звук - 11100000

 

И так удалять ненужное 

У тебя в кармане 50 разноцветных стеклянных шариков одинакового размера, как не вытаскивая шарики из кармана и не заглядывая туда вытащить шарики только красного цвета? Правильно либо никак либо тебе повезет и ты угадаешь. Чтобы решать такие проблемы недостаточно просто взять и убрать всё лишнее, нужно разработать систему как отличить это лишнее от нужного, и для этого не обязательно перевозить что-либо в двоичную систему. Кстати сказать все данные в электронном виде уже содержаться в двоичном виде на носителе =)

 

ЗЫ ах да "0111111, 00010101111, 11100000" это не цифры, это числа.

Link to comment
Share on other sites

Вот, кстати, пользуясь аналогией с шариками. Кто сказал что конкретный шарик относится, к арфе или трубе? Допустим у нас есть синус (или не синус) громкостью 30дБ, может 20дБ из них задаётся арфой, а остальное - трубой. Вы скажите - но ведь звук у них отличается, а значит и спектр отличается. Но ведь шарик показывает не ВЕСЬ спектр, а только маленькую часть спектра(в определённый момент), и она, как раз может совпадать или быть близкой, а раз она близка, а в процессе записи может слиться воедино. И как их различить? Да и вообще, как образуется звуковая картина, полагаю, отдельная, большая тема.

Link to comment
Share on other sites

Песня и так в двоичном виде, но для удобства человека, её можно рассматривать хоть в десятичном, хоть в шестнадцатеричном, сути это не меняет, только внешний вид.

Объясняю очень схематично.
Мы имеем порядок чисел, которые представляют собой, очень грубо говоря, отдельнные звуки, каждый из которых звучит в выбранный момент времени. Звук — это колебания среды, воздуха (или мембраны  динамика). И сколько бы там инструментов и голосов не звучало, воздух просто колеблется, у него нет разных колебаний для каждого инструмента, они все просуммированы, а число в файле — это та самая сумма. Чтобы это представить, можно представить молекулы воздуха — шарики, соединённые эластичными нитками. Мы дёргаем шарик вперёд (а колеблется он только вперёд-назад вдоль нитки), он за нитку тянет соседний шарик, потом дёргаем его назад, и так далее, так мы делаем ему колебания разной амплитуды и частоты. Мы не можем один и тот же шарик дёргать одновременно и вперёд и назад или на 10 и на 20 см в один и тот же момент, мы должны сперва найти суммарный вектор всех наших звуковых воздействий. То есть, если кто-то втягивает воздух, а рядом двое дуют, то шарик будет двигаться туда, куда дуют, потому что дуют сильнее.
Итак, идут у тебя числа 10 40 12 70, если ты уберёшь "ненужную" 12, потеряешь, скажем, один удар барабана, и вообще, собьёшь ритм, потом учто эти числа — это протяжённость песни по времени. А нам нужно удалить так, чтобы звук во времени остался, но изменился. Это можно было бы попытаться сделать, если бы у нас была дорожка с голосом, мы бы инвертировали её фазу и сложили с полной дорожкой, в теории это даст только минусовку. Ещё можно вырезать некие частоты, в которых сконцентрирован человеческий голос, это оставит низы и верхи, но какую-нибудь бас-гитару может и выпилить вместе с голосом.

Есть хитрые алгоритмы, которые как-то находят голос в песне, составляют шаблон и по этому шаблону убирают его, у меня такая была 14 лет назад, худо-бедно работала. Однажды она как-то странно сглючила и у меня получилась не музыка без голоса, а голос без музыки, я даже этот файл сохранил и до сих пор храню, потому что очень смешно получилось. Конечно, сейчас алгоритмы шагнули дальше вперёд, но это далеко не простое убирание нулей и единичек, этому процессу сопутствует хардкорный анализ.

Один раз я записывал песню и сделал голос в разных каналах с сильным сдвигом фаз, чтобы достичь стереоэффекта. И потом, когда слушал эту песню в моно, которое получалось суммированием двух каналов (на усилке забыл переключатель выключить, который включил, чтоб посмотреть тупое видео, где звук был только слева), то получил песню почти без слов, потому что, как я писал выше, звук в противофазе наложился на себя в фазе. С небольшой погрешностью, конечно, но похоже.
Впоследствии я наоборот, делал голос по центру, а всякие там гитары раскидывал по ушам. На основе этого тоже можно проводить анализ, то есть искать звук, который звучит одновременно в обоих каналах, а потом частотным фильтром из всех (там ещё обычно будут барабаны и что-нибудь ещё) вырезать только диапазон голоса, но это зависит от песни, и так просто всё равно не получится сделать.

Это я к тому, что прежде, чем выдвигать странные идеи, основанные на поверхностном знании темы, стоит углубиться в вопрос, а то получится архиватор Бабушкина. Я сам не претендую на сильное погружение в алгоритмы, но нам на радиотехнике за 5 лет много раз рассказывлаи и про ряд Фурье, и про модуляцию, и про фазы сигналов, и много чего ещё, что мне никогда так и не пригодилось. Ну, разве что, я чуть лучше некоторых понимаю как работает звуковой микшер.

  • Like 1
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

 Share

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue. See more about our Guidelines and Privacy Policy