пятница, 6 декабря 2013 г.

Голосовые кодеки - краткое описание

Для передачи голоса по IP-сети, человеческий голос оцифровывается при помощи импульсно-кодовой модуляции, сжимается (кодируется) и разбивается на пакеты. На принимающей стороне, происходит обратная процедура — данные извлекаются из пакетов, декодируются и преобразуются обратно в аналоговый сигнал.


Проведённый в различных исследовательских группах анализ качества передачи речевых данных через Интернет показывает, что основным источником возникновения искажений, снижения качества и разборчивости синтезированной речи является прерывание потока речевых данных, вызванное:
потерями пакетов при передаче по сети связи;
превышением допустимого времени доставки пакета с речевыми данными.

Применяемые алгоритмы сжатия голоса при передаче по IP-сети довольно разнообразны. Некоторые практически не сжимают голос, оставляя его на уровне импульсно-кодовой модуляции (то есть 64 килобит/с), другие кодеки позволяют сжимать цифровой голосовой поток в 8 и более раз за счёт эффективных алгоритмов кодирования. Существует немало хороших свободных кодеков, использование которых не требует лицензирования. Для других же требуется достижения соответствующей лицензионной сертификации между производителем оборудования (программного обеспечения) и авторами метода сжатия.



Распространенные кодеки с характеристиками:

Открытые кодеки:
  • G.711 - 64 Кбит/с (с учетом всех заголовков 80 Кбит/с) - практически не осуществляет сжатия - задержка в 20 миллисекунд.
  • G.726 - 32 или 24 или 16 Кбит/с (с учетом всех заголовков 43-35-27 Кбит/с), зависит от реализации - задержка в 20 миллисекунд.
Проприетарные кодеки:
  • G.729 - 8 или 6.4 Кбит/с (с учетом всех заголовков 19-17 Кбит/с), зависит от реализации - задержка в 25 миллисекунд.
  • G.723 - 7 или 5 Кбит/с (с учетом всех заголовков 17-16 Кбит/с), зависит от реализации - самый ресурсоемкий для обсчета, накладывает задержку в 38 миллисекунд.
Источник - wikipedia

Комментариев нет: