Акустическое эхо в системах телеконференций

Акустическое эхо - явление, возникающее в системах телеконференций.

Телеконференция (teleconference) - совещание, участники которого территориально удалены друг от друга, и которое осуществляется с использованием телекоммуникационных средств. Телеконференции подразделяются на аудио конференции (с использованием средств передачи голоса) и видео конференции (с использованием средств видеосвязи).

Проявляется акустическое эхо в следующем: вы, находясь в помещении, говорите в микрофон и спустя непродолжительное время (единицы секунд) слышите свой голос из громкоговорителя. Спустя короткое время вновь слышен голос, затем все это может перерасти в вой, бульканье, гудение и прочие неприятности. Для устранения эффекта возникновения эха используются специальные устройства – эхокомпенсаторы (Acoustic Echo Cancellation - AEC).

Схема, проясняющая эффект возникновения эха изображена на рисунке 1. Две территориально удаленные комнаты (ближняя и дальняя) объединены системой телеконференции. В каждой комнате установлен микрофон для передачи речи на другую сторону и громкоговоритель, воспроизводящий речь другой стороны. Системы телеконференций изначально построены таким образом, что не предусматривается воспроизведение сигнала с микрофона громкоговорителем, установленным в этом же помещении!
 

Рис.1. Возникновение акустического эха.

Рис.1. Возникновение акустического эха.

 

Данное явление (возникновение эха в системах телеконференций) не следует путать с обратной акустической связью (“завывание”, или эффект Ларсена). Явление обратной акустической связи возникает в помещениях, оборудованных системой звукоусиления, в результате самовозбуждения акустической системы, например, при повторном усилении микрофоном сигнала от громкоговорителя (обычно в диапазоне высоких частот) в маленьких помещениях за счет отражения. Таким образом, возникает петля обратной связи.

Данная проблема решается включением в тракт звукоусиления подавителя обратной акустической связи - многоканального заграждающего фильтра. Подавитель обратной связи не может использоваться для решения задач эхо подавления.

Сигнал громкоговорителя, принимаемый микрофоном на дальней стороне, является паразитным сигналом для системы телеконференций. Работа эхокомпенсатора заключается в подавлении такого паразитного сигнала. Важно отметить, на рисунке 1 видно, что эхо слышно на ближней стороне, а причина возникновения эха находится на дальней стороне.

Как отдельное электронное устройство эхокомпенсатор в номенклатуре аудио оборудования встречается достаточно редко. Эхокомпенсатор является функцией такого оборудования, как кодеки ВКС, цифровые звуковые процессоры и т.п., и реализуются на основе DSP.

На рисунке 2 приведена функциональная схема эхокомпенсатора. Идея работы эхокомпенсатора состоит в следующем:

  1. Эхокомпенсатор устанавливается на дальней стороне;
  2. Эхокомпенсатор имеет два входа. На первый вход поступает сигнал с микрофона телеконференции, на другой вход поступает сигнал, принимаемый из линии связи, с дальней стороны;
  3. Эхокомпенсатор вычитает сигнал, принятый от удаленной стороны, из сигала, полученного от микрофона телеконференции. Теоретически на выходе эхокомпенсатора должна быть чистая речь, без паразитного сигнала.

 

Рис.2. Функциональная схема эхокомпенсатора.

Рис.2. Функциональная схема эхокомпенсатора.

Реальные сложности, возникающие при реализации схемы эхокомпенсатора, видны на рисунке:

  1. Эхокомпенсатор должен рассчитать и учесть время задержки прихода отраженного паразитного сигнала;
  2. Если в помещении несколько громкоговорителей, задача сильно усложняется, эхокомпенсатор должен подавлять эхо от всех громкоговорителей;
  3. Большая сложность для работы – реверберация помещения. Микрофон принимает не только прямой сигнал громкоговорителя, но и все отражения. Эхокоменсатор должен рассчитать и учесть время задержки прихода всех отражений;
  4. АЧХ сигнала, принимаемого громкоговорителем, отличается от АЧХ сигнала из линии, необходима коррекция АЧХ.

Эхокомпенсатор работает таким образом, что он ничего не делает, чтобы устранить эхо в помещении, в котором он установлен. Эхокомпенсатор улучшает звук (устраняет эхо) исключительно для другого (дальнего помещения). Вы можете использовать на своей стороне очень совершенный эхокомпенсатор, но будете слышать свое эхо. Чтобы у вас не было эха, об этом должна позаботься дальняя сторона.

 
Основой эхокомпенсатора является адаптивный цифровой фильтр. При отсутствии речи оратора на входе микрофона, эхокомпенсатор должен настроиться таким образом, чтобы на выходе сигнал отсутствовал (свести сигнал ошибки к нулю!). Для удаления в выходном сигнале паразитных низкоуровневых сигналов, оставшихся после работы адаптивного фильтра, на выходе устанавливается нелинейный процессор (Non-Linear Processor, NLP), для двухстороннего ограничения околонулевого уровня сигнала (center-clipping). Передаточная характеристика нелинейного процессора приведена на рисунке 3.

Рис.3. Передаточная характеристика NLP.

Рис.3. Передаточная характеристика NLP.

 

В тракте передачи звука не должно быть нелинейных искажений. Эхокомпенсатор не сможет их обработать.


Эхокомпенсация – рекомендации

 

Рис. 4. Эхокомпенсатор, функциональные точки.

Рис. 4. Эхокомпенсатор, функциональные точки.

 

  1. Для успешной работы эхокомпенсатора необходимо, чтобы АЧХ сигналов в точках A и C были одинаковы (близкими). Если в трактах звукоусиления включены устройства обработки звука, существенно изменяющие АЧХ сигналов, экокомпенсатор не может их компенсировать, т.к. будет считать эти сигналы различными. Если устройства обработки необходимы, то следует использовать внешний (не встроенный в кодек) эхокомпенсатор, и устройства обработки следует включать между кодеком и эхокомпенсатором.
  2. Необходимо, что все аудиооборудование работало без перегрузок. Перегрузки вносят нелинейные искажения, которые эхокомпенсатор не может удалить.
  3. Реверберация существенно усложняют работу эхокомпенсатора, необходимо стремиться к уменьшению времени реверберации помещения
  4. Если в системе используется внешний эхокомпенсатор, рекомендуется отключать микрофоны (Mute) в точки D. Если микрофон включен, эхокомпенсатор активен, и система подстроена под акустическую обстановку помещения. Отключения микрофона и последующее включение требует определенного времени для выхода эхокомпенсатора на рабочий режим. В течение этого времени на другой стороне возможны проблемы со звуком.
  5. Если в существующей системе наблюдаются проблемы с эхом, выход один – уменьшить уровень громкости на другой стороне.

 


Характеристики эхокомпенсаторов

Время эхоподавления (Tail Time, Tail length)

Микрофон принимает прямой звук громкоговорителя через время задержки, которое определяется расстоянием от громкоговорителя до микрофона. Затем в микрофон попадает первое отражение, затем второе и т.д. Время прихода отражений зависит от помещения и может составлять сотни миллисекунд.

Время, в течение которого эхокомпенсатор принимает и обрабатывает (удаляет) эти сигналы ограничено. Термин данного параметра в русской документации четко не определен, в английском это Tail Time, или Tail Length.
Время эхоподавления реальных приборов составляет от 128 до 500 мсек.

Рис.5. Возникновение отраженных сигналов (реверберация).

Рис.5. Возникновение отраженных сигналов (реверберация).

Уровень эхоподавления

Эхокомпенсатор не может полностью подавить эхо. Естественным путем уменьшить эхо возможно разнесением громкоговорителя и микрофона (увеличить расстояние от микрофона до громкоговорителя). Такое естественное сокращение эха называют echo return loss (ERL) и измеряют в дБ:

ERL = 10 Log (A/B)

Типовое значение ERL лежит в пределах от 0 до 10 дБ, где значение 0 дБ не имеет смысла, значение 10 дБ – минимальное значение, необходимое значение для функционирования системы.
Разнесением микрофона и громкоговорителя нельзя добиться полного исчезновения эха. Увеличения глубины подавления эхо обеспечивает эхокомпенсатор. Такое искусственное сокращение эха называют echo return loss enhancement (ERLE)

ERLE = 10 Log (B/C)

Значение ERLE больше, чем ERL. Типовое значение ERLE лежит в пределах от 15 до 25 дБ. Нелинейное подавление (NLP) в данном случае в расчет не принимается.
 

Рис. 6. Эхокомпенсатор, контрольные точки.

Рис. 6. Эхокомпенсатор, контрольные точки.

 
Некоторые производители эхокомпенсаторов вместо термина ERL используют противоположный термин conferencing room gain, определенный как 10 Log (B/A).

Многоканальные системы эхоподавления.

Все рассмотренное выше касалось лишь одного микрофона. В системах телеконференций, как правило, используется более чем один микрофон.

Каждый микрофон, установленный в конкретном месте помещения, имеет свою “картину эха”. Эта картина зависит от конкретного места установки микрофона и является достаточно стабильной (расстояния от микрофона до громкоговорителей неизменно, отражения звуковых волн от стен помещений так же неизменны). Эхоподавитель система адаптивная (автоматически настраиваемая).

Если сигнал от нескольких микрофонов предварительно суммировать, а затем сумму направить на эхоподавитель то:

  1. Соотношение сигнал/шум уменьшиться;
  2. Эхоподавитель будет работать в более сложных условиях (“картина шума” будет очень сложной)

Оптимальным вариантом является использование индивидуального эхоподавителя для каждого микрофона.

В случае использования микрофонов конференц системы установка индивидуального эхоподавителя для каждого микрофона невозможна. Эхоподавитель для микрофонов конференц-системы работает в очень сложных условиях. Чтобы облегчить работу эхоподавителя, один из микрофонов желательно всегда держать включенным, чтобы система всегда была активной.

Области применения систем эхоподавления.

Все системы телеконференций (и видео, и аудио), как правило, имеют достаточно мощные встроенные системы эхоподавления. Использование дополнительного внешнего эхоподавителя редко является целесообразным. Можно выделить два основных случая использования внешних эхоподавителей:

  1. Подключение большого числа микрофонов к системе телеконференц-связи. В этом случае используется DSP прибор, который имеет микшер с многоканальной системой эхоподавления (цифровая платформа или подобное). Микшер подключается к входу системы телеконференц-связи, эхоподавитель на данном входе отключается. Эхоподавление осуществляется средствами микшера.
  2. Использование в качестве системы групповой телеконференц-связи персонального программного кодека, установленного на ПК (Skype, Spirit и т.п.). В этом случае использование внешнего эхоподавителя является обязательным даже при использовании одного микрофона, т.к. программный кодек не имеет эффективных систем эхоподавления.

 

Рис.7. Вариант функциональной схема звукового тракта системы ВКС.

Рис.7. Вариант функциональной схема звукового тракта системы ВКС.

 

На рисунке изображена схема подключения большого количества микрофонов к кодеку системы ВКС. Звуковой процессор обеспечивает необходимую схему подключения. Реально микшер и звуковой процессор объединяются в одном приборе, например Tendzone TYCHO.