построение психоакустической модели в програмном виде)
#1

открываю бо нужно где-то писать.
мысля неоконченная и неразрешимая)) не рекомендуется к чтению/принятию как чего-то правильного или даже намек на онное))

****дисклеймер:****
не призываю к действию. даже к обсуждению не призываю) просто тему открыл где можно фигню такую писать, типа бложик по совместительству с блокнотиком. мож и сразу помрет как маразм...
*******************

мотивация:
- Занятно было-бы не ушами слушать, а все-же програмкой-микрофоном(ацпшкой). притом именно слушать, а не измерять измеряемое.
как сфотать и посмотреть фотку, а не исследовать абберации оптики и передаточную функцию матрицы.
только заменить орган слуха на орган зрения))

для этого...
нужно построить более-менее простую модель слушания, заложить в нее всякие слушательные способы которыми моск работает, и результат представить в трехмерном-многомерном пространстве. каждым способом уточняя местоположение и прочие характеристики аудиообразов.
чтобы нарисовать картинку/видео на какую-то песенку, например)


проблемы, вернее те которые на самом деле не проблемы сегодня:
- померять ачх, импульс, искажения, переотражения. каким-то специальным сигнальчиком. оно дает харатеристики, но не рисует картинку которую можно помацать глазом. вернее все эти измеряшки рисуют много разных красивых картинок, но они плохо переносятся например в пространственные характеристики системы.
и зачастую требуют специальных сигнальчиков а не музыки с образами)) (образы - не религиозного характера, прим. редактора).

а хочется такой себе визуалайзер)

модель обработки
- два канала на входе, постоянный ффт на каждый канал, в памяти лежит ффт отцентрованный на каждом сэмпле каждого канала.
таким образом получаем плавающее окно ффт по каждому каналу. зачем? можно ффтшки двух каналов сравнить между собой и при определенном совпадении ффтшек решить, что это совпадение - результат какого-то происшествия в аудиодорожке. по разности времени между найденными соответствиями можно определить местоположение КИЗ этого происшествия.
теперь если добавить еще и поиск совпадений ффт и на тот-же канал, то можно получить реверб тайм этого совпадения на самого себя, т.е. расстояния до стенок-отражателей комнаты прослушивания.
имея размеры стенок и расстояние до них, а так-же направление сигнала - можно его уже рисовать в двухмерном пространстве, т.е. на картинке)))
добавь сюда всяких плюшек типа цвета прозрачности и размера, нарисуй их побольше с низким разрешением - можно получить(попытаться) какую-то звуковую картинку)))

в эту модель местоположения можно будет добавлять всяких дополнительных алгоритмов, дающих свои оценки местоположения и прочего. дабы в итоге оно становилось все точней и точней (или не точней, главное чтоб плавненько рисовалось и все было правильно с т.з. размеров, физики и математики).

****
вот такой вот маразм. не призываю к действию. даже к обсуждению не призываю) просто тему открыл где можно фигню такую писать, типа бложик по совместительству с блокнотиком. мож и сразу помрет как маразм...
****

Аминь.
Ответ
#2

Тема интересная, но не думаю, что на ша решаемая. Этим занимаются давно и институтами.
s3t Написал:каждым способом уточняя местоположение и прочие характеристики аудиообразов.
Разделить на аудиообразы - задача весьма сложная. Это мы мозгами понимаем, что это - голос, это -гитара/бабаран/скрипка/... . А попробуй электронному разуму объяснить, где что... . Это надо какой-то суперскаляр, который будет корелляции с "базой" считать. А база - ого-го какая. Надо какие-то критерии вычленить, чтобы понять, какому инструменту принадлежит даже отдельный звук. Это тоже сложно.
Т.е. смысл в чем? Сначала надо звуковой поток поделить на отдельные звуки, потом считать, откель они.
Такие штуки сделаны, но они именно для одиночных звуков с четким фронтом - выстрелов. Определяют направление и вроде даже, дальность (НЧ в воздухе передаются чутка быстрее, ВЧ сильнее ослабляются, потому фронт выстрела "разбегается" с расстоянием и становится менее резким ).
Можно даже не с микрофона начинать, а с анализа стереосигнала. Но вряд-ли этот путь перспективен.
s3t Написал:мотивация: Занятно было-бы не ушами слушать, а все-же програмкой-микрофоном(ацпшкой). притом именно слушать, а не измерять измеряемое. Как сфотать и посмотреть фотку,
Полагаю, что для этого нужно просто адекватный микрофон (с адекватной импульсной х-кой). Причем, без особых изысков и даже особо ровной АЧХ - РАЗНИЦУ он запишет.
Можно проанализировать исходный стереосигнал и записанный стереомикрофоном.
Можно попробовать посчитать преобразование, которое надо накласть на исходный сигнал, чтобы получился записанный.

Хочу уточнить: для чего это всё? Что хочется увидеть и зачем?

В принципе, хорошо делится на несколько задач:
- адекватная запись
- определение отражений (ревербераций)
- распознавание звуков
- определение места происхождения звуков
Первым - надо заняться*. Второе - наверное, реально. Третье, четвертое - мало реально осилить в одному.

*) Записать так, как слышат ухи - уже достойная задача. Микрофоны "слышат" напрочь по-другому.
Ответ
#3

цель - чтобы нарисовать что-то красивое графическое) чтобы можно было на это посмотреть глазами. глаза видят немножко по особому, и находят всякие закономерности скрытые.

адекватную запись можно поначалу не использовать, а генерировать нечто сухое в вакууме - постепенно усложняя генерилку и соответственно просчеты чтоб информация могла извлекаться.
распознавание звуков совсем не нужно. фотик ведь не распознает что он фоткает. нужно лишь распознать местоположение всех звучков, их частей, призвуков. только местоположение и интенсивность. не точно. нарисовать это в двухмерном/трехмерном пространстве и по пятнам звуков уже дать человеческому глазу судить где находится киз) чем там большее скопление точек, тем больше вероятность что оттуда дует звук)

такой себе костыль для глухих)
правда его можно будет потом продать армии за немерянный баблос как очередное устройство ночного виденья)) хм, нужно будет порыться на предмет исследований существующих данной тематики)

потом уже по картинке можно будет пройтись всякими фильтрами а-ля фотошоп для поднятия контрастности, выравнивания гаммы и разкрашивания во все цвета радуги)

Аминь.
Ответ
#4

s3t Написал:распознавание звуков совсем не нужно. фотик ведь не распознает что он фоткает. нужно лишь распознать местоположение всех звучков, их частей, призвуков.
Чтобы определить местоположение - надо сначала разделить на звуки, звучки и призвучки. Хрен с ним, с распознаванием - это самое простое.
На фотографию тоже смотрим МЫ и что-то там определяем. Так что аналог фото - просто адекватная запись. Анализируем мы. Методика анализа - хороший вопрос.
То, что хотите вы, скорее всего, надо реализовать так: делим спектр на полосы, смотрим где-что-когда появилось (этакий мгновенный на сколько это возможно эквалайзер), далее почастотно строим точки излучения. Т.е. делим не на звуки, делим на спектр - согласитесь, это гораздо более осуществимо.

Далее. Определение 3-мерных координат академически возможно только 3мя микрофонами (как и сделано в описанных армейских приборах). Как это делается 2мя неподвижными ушами - загадка мозга человеческого (можно обсудить). Как эхолокатят летучие мыши и дельфины - вообще убитьсяапстену.

Из визуализаций много информации дают ватерфолы и сонограммы.
Ответ
#5

Пора заменить слепое прослушивание глухим просматриванием.
Ответ
#6

праильна. не верь слуху, верь програмке. и глазам. таки глухое просматривание дает результаты гораздо стабильней слепого прослушивания :)

ы.
а еще можно тестовый сигнал построить так, чтобы он был идеальным и ходил по всему пространству виртуального помещения. затем его "замерить" в цифре и чтоб он построил например какой-то массив-решетку образов в пространстве.
потом его пропустить через аналоговую среду и посмотреть, сохранилась ли решетка. пропустить через комнату и опять посмотреть.
как-то так)
применений масса, нужно бы да написать такую-вот фихню)


ы2. тут столько в ветке написанно, будто космические корабли уже бороздят космос.
но все это на данный момент - фантазия больного воображения и только))

Аминь.
Ответ
#7

Решил дельфинью эхолокацию программно замутить? Ню-ню.
Ответ


Перейти к форуму:


Пользователи, просматривающие эту тему: 1 Гость(ей)