АЛМАТИНСКИЙ УНИВЕРСИТЕТ ЭНЕРГЕТИКИ И СВЯЗИ

Кафедра радиотехники

 

 

В.В. Артюхин 

ЦИФРОВОЕ ТЕЛЕВИДЕНИЕ, РАДИОВЕЩАНИЕ И

СИСТЕМЫ ВИДЕОНАБЛЮДЕНИЯ

 

 

Конспект лекций

 для магистрантов специальности 6М071900 – Радиотехника,

электроника и телекоммуникации

 

 

  

 

Алматы 2012 

СОСТАВИТЕЛЬ: Артюхин В.В.  Цифровое телевидение, радиовещание и системы видеонаблюдения. Конспект лекций для студентов специальности 6М071900 – Радиотехника, электроника и телекоммуникации. – Алматы: АУЭС, 2012.–30 с.

 

Конспект лекций предназначен для  самостоятельного изучения курса «Цифровое телевидение, радиовещание и системы видеонаблюдения». В конспекте приведен  обзор основных принципов формирования цифрового видеоизображения и  звука, сжатия сигналов,  видов модуляции для всех типов каналов связи – эфирного, кабельного и спутникового. Необходимость самого конспекта лекций обусловлена потребностью  более глубокого понимания процессов, происходящих в области цифровых систем телевидения. Конспект лекций предназначен для студентов  специальности 6М071900 – Радиотехника, электроника и телекоммуникации.

 

Ил.  7, табл. 1,  библиогр. – 6  назв. 

 

Рецензент: канд.техн.наук. проф., Коньшин С.В., АУЭС 

 

Печатается по плану издания Некоммерческого акционерного общества «Алматинский университет энергетики и связи» на 2012 г.

 

 

 

© НАО «Алматинский университет энергетики и связи», 2012 г.

 

1 Лекция. Особенности цифрового телевидения

 

История возникновения и развития цифрового телевидения содержит несколько этапов. На каждом этапе сначала выполнялись научно-исследовательские и опытно-конструкторские работы, создавались экспериментальные устройства и системы, а затем принимались международные стандарты, которые должны поддерживаться всеми организациями, ведущими телевизионное вещание и выпускающими видеопрограммы, и всеми фирмами производителями аппаратуры.

 Следует подчеркнуть важнейшую роль стандартов в развитии телевидения как и любой другой технологии. Главным в мировом масштабе органом, принимающим и утверждающим стандарты в различных областях деятельности людей, является ISO - International Standart Organization (Международная организация по стандартизации), объединяющая национальные комитеты по стандартизации более 100 стран мира. ISO создает комитеты, подкомитеты и рабочие группы, которые разрабатывают проекты стандартов, утверждаемые затем ISO. При этом стандарты в области информационных технологий принимаются созданным ISO и Международной Электротехнической Комиссией (International Electrotechnical Comission - IEC) совместным комитетом ISO/IEC JTS1, название которого присутствует в названиях принятых им стандартов.

Еще один международный орган, занимающийся стандартизацией в области телекоммуникаций - это Международный Союз Электросвязи (International Telecommunication Union - ITU). Стандартизацией в телевидении занимается сектор ITU-R (R - radio). До 1993 года эти функции выполнял Международный Консультативный Комитет по радио (МККР или CCIR). Документы, выпускаемые ITU, называются Рекомендациями, но фактически они являются стандартами.

  Первый этап истории цифрового телевидения характеризовался использованием цифровой техники в отдельных частях телевизионных систем при сохранении обычного стандарта разложения и аналоговых каналов связи. Наиболее важным достижением данного этапа было создание цифрового студийного оборудования. На современных телестудиях сигналы с передающих камер преобразуются в цифровую форму, и вся их дальнейшая обработка и хранение в пределах телецентра осуществляются цифровыми средствами. Это позволяет реализовать многие из указанных выше преимуществ цифрового телевидения. На выходе студийного оборудования телевизионный сигнал преобразуется в аналоговую форму и передается по обычным каналам связи. Результаты работы специалистов разных стран были закреплены в Рекомендации ITU-R ВТ 601 (старое название - Рекомендация 601 МККР или CCIR-601). Данный документ был принят в 1982 году и определяет до сих пор основные параметры цифровой студийной аппаратуры. Другое направление, характерное для первого этапа развития цифрового телевидения, - введение цифровых блоков в телевизионные приемники с целью повышения качества изображения или расширения функциональных возможностей. Примерами таких блоков могут служить цифровые фильтры для разделения яркостного и цветоразностных сигналов, для уменьшения влияния шумов на изображение и для подавления эхо-сигналов, возникающих при отражении радиоволн от поверхности Земли и различных объектов, т.е. при наличии многолучевого приема. Широко известны также устройства перехода от чересстрочной развертки к квазипрогрессивной, повышения частоты полей до 100 Гц, реализации функций «стоп-кадр» и «кадр в кадре» и т.д. Отметим, что все эти усовершенствования не затрагивали стандарт разложения и принципы передачи телевизионного сигнала по каналу связи.

 Второй этап развития цифрового телевидения - создание гибридных аналого-цифровых телевизионных систем с параметрами, отличающимися от принятых в обычных стандартах телевидения. Можно выделить два основных направления изменений телевизионного стандарта: переход от одновременной

передачи яркостного и цветоразностных сигналов к последовательной их передаче и увеличение количества строк в кадре и элементов изображения в строке. Реализация второго направления связана с необходимостью сжатия спектра телевизионных сигналов для обеспечения возможности их передачи по каналам связи с приемлемой полосой частот.

          Примерами гибридных телевизионных систем могут служить японская система телевидения высокой четкости (ТВЧ) MUSE и западно-европейские системы семейства MAC. В передающей и приемной частях всех этих систем сигналы обрабатываются цифровыми средствами, а в канале связи сигналы передаются в аналоговой форме. Системы ТВЧ MUSE и HD-MAC имеют формат изображения 16:9, количество строк в кадре 1125 и 1250, частоту кадров 30 и 25 Гц, соответственно. С помощью цифрового кодирования исходная полоса частот сигналов этих систем, превышающая 20 МГц, сжимается до величины порядка 8 МГц. Это позволяет передавать эти сигналы с частотной модуляцией (ЧМ) по спутниковым каналам связи, имеющим ширину полосы 27 МГц. В то же время, широко развитая сеть наземного телевизионного вещания, включающая УКВ-передатчики, кабельную сеть и другую технику, не позволяет передавать и принимать сигналы указанных систем телевидения, так как рассчитана на ширину полосы частот одного канала, равную 6...8 МГц.

Третьим этапом развития цифрового телевидения можно считать создание полностью цифровых телевизионных систем. После появления в Японии и Европе упомянутых выше систем телевидения высокого разрешения MUSE и HD-MAC, в США в 1987 году был объявлен конкурс на лучший проект системы телевидения высокого разрешения для утверждения в качестве национального стандарта.

          В первые годы на этот конкурс были выдвинуты различные аналоговые системы. Система MUSE и другие системы, предусматривающие передачу только по спутниковым каналам, вскоре были сняты с рассмотрения. Это объяснялось тем, что в США около 1400 компаний осуществляют наземное телевизионное вещание, и очень широко развита сеть кабельных линий. Вся эта инфраструктура рассчитана на ширину полосы частот телевизионного канала 6 МГц.

          Рассматривались проекты аналоговых телевизионных систем высокого разрешения, в которых по одному стандартному каналу передается обычный сигнал NTSC, а по другому – дополнительный сигнал, который в приемнике с соответствующим декодером позволяет получить изображение с большим количеством строк и элементов разложения в строке. В то время никто не мог предположить, что уже через несколько лет удастся по стандартному каналу с шириной полосы 6 или 8 МГц передавать сигналы полностью цифровой системы телевидения как обычного, так и ТВЧ.

Задача сжатия изображений для хранения и передачи была настолько актуальной, что Международная организация стандартизации ISO взяла на себя функции координации усилий по ее решению. В ISO была создана рабочая группа JPEG (Joint Picture Expert Group - объединенная группа экспертов по изображениям), которая занимается разработкой методов сжатия неподвижных изображений, а затем - рабочая группа MPEG (Motion Picture Expert Group -группа экспертов по движущимся изображениям), занимающаяся методами сжатия движущихся изображений и звукового сопровождения. Эти рабочие группы включают специалистов из разных стран. Результатами деятельности этих групп являются утверждаемые ISO стандарты. Именно разработки группы MPEG стали основой создания современных систем цифрового телевидения.

Стандарт MPEG-1, ориентированный в основном на запись кинофильмов и видеопрограмм на компьютерные лазерные диски с возможностью воспроизведения изображения и звука с помощью обычного персонального компьютера (ПК), был окончательно утвержден к декабрю 1993 года. Стандарт MPEG-2, предназначенный для систем телевизионного вещания как с обычным стандартом разложения, так и с увеличенным числом строк (ТВЧ), был утвержден в ноябре 1994 года. Дальнейшее развитие привело к появлению формата сжатия MPEG-4. Стандарт MPEG-2 устанавливает 4 уровня (Levels) разрешения кадра:

- LL- низкий уровень с разрешением 352 х 288;

          - ML - основной уровень - 720 х 576;

          - HL-1440 - высокий уровень - 1440 х 1152;

-VHL-1920 – очень высокий уровень - 1920 х 1152 и 5 базовых профилей (Profiles) кодирования сигналов яркости и цветности (SP - простой, МР - основной, 2 масштабируемых профиля и HP - высокий).

 В Европе уже в 1993 году, как только стало ясно, что за цифровыми телевизионными системами будущее, был принят проект DVB (Digital Video Broadcasting - Цифровое Видео Вещание), основанный на MPEG-2. В настоящее время системы цифрового телевидения быстро распространяются во многих странах. При этом в первую очередь решается задача значительного увеличения количества передаваемых программ телевидения обычного разрешения, так как это дает быстрый коммерческий эффект. В развитых странах поставлен вопрос о прекращении в первом десятилетии 21-го века аналогового телевизионного вещания и, следовательно, полном переходе к цифровому телевидению.

Цифровое телевидение приходит и в Казахстан, и в Россию. В 1999 году Госкомсвязи Российской Федерации одобрил «Концепцию внедрения цифровых наземных систем звукового и телевизионного вещания в России».      

Минкультинформ РК, Минэконом, Минфин, АО «НИХ Арна Медиа» приняли  Концепцию внедрения и развития цифрового телерадиовещания в Республике Казахстан на 2009-2015 годы.

В основе концепции лежит принцип создания в сетях вещания интегрированного транспортного потока для передачи как вещательных программ, так мультимедийной и другой информации. Внедрение цифрового телевидения предполагается осуществить в два этапа. На первом этапе создаются несколько опытных участков со смешанным (аналоговым и цифровым) вещанием для практической проверки и выбора методов и параметров. Результатом первого этапа должны стать адаптация международных стандартов и выработка временных норм на цифровое вещание. На втором этапе должны быть утверждены стандарты на цифровое ТВ- и звуковое вещание, после чего может начаться их массовое внедрение. Полный переход на цифровое телевизионное вещание планируется завершить к 2015 году.

Теперь можно дать определение: цифровое телевидение - это отрасль телевизионной техники, в которой передача, обработка и хранение телевизионного сигнала осуществляются хотя бы частично в цифровой форме. Цифровое телевидение - это новая ступень развития телевизионной техники, обеспечивающая многие преимущества по сравнению с аналоговым телевидением, в том числе:

- повышение помехоустойчивости систем телевизионного вещания;

- повышение качества изображения в телевизионных приемниках с обычным стандартом разложения;

- создание новых телевизионных систем, обеспечивающих существенное повышение качества изображения телевизионных изображения (телевидение высокой четкости - ТВЧ);

- увеличение количества передаваемых телевизионных программ, так как по стандартному телевизионному каналу с шириной полосы частот 6...8 МГц оказывается возможным передавать 4 и более программ телевидения обычной четкости или 1-2 программы ТВЧ;

- интеграция телевизионного вещания с Интернет;

- обеспечение защиты передаваемых телевизионных программ и другой информации от несанкционированного доступа, что дает возможность создавать системы платного ТВ-вещания;

- создание интерактивных телевизионных систем, при пользовании которыми зритель получает возможность воздействовать на передаваемую программу.

 

         2 Лекция. Преобразование телевизионного изображения в цифровую форму

 

Преобразование аналогового видеосигнала в цифровую форму содержит как элемент сканирование изображения или кадра строка за строкой и выборку значений содержимого строки. Для сохранения качества изображения число выбранных значений в строке должно равняться числу пикселов; каждое выбранное значение (отсчет) представляет один пиксел. Общее число пикселов в телевизионном изображении представляет один кадр. Число пикселов в телевизионном изображении определяется числом строк в изображении и форматом изображения. Система SECAM использует 625 строк, 576 из которых являются «активными» в том смысле, что их можно использовать для передачи видеоинформации. Формат изображения выбирается равным 5:4, это соотношение наиболее приемлемо для операции декодирования видеосигнала, которая включает организацию элементов изображения в блоки и микроблоки.

Разрешающие способности по вертикали и по горизонтали должны быть одинаковыми, а число пикселов в строке можно вычислить следующим образом:

                                                  576 5 = 720.

 

Таким образом, каждая строка будет представлена 720 отсчетами, причем каждый отсчет будет представлять один пиксел: отсчет 1 - пиксел 1, отсчет 2 - пиксел 2 и т. д. Процесс повторяется для второй, третьей и т. д. строки до конца кадра, а затем снова для следующего кадра и т. д. Чтобы отсчеты осуществлялись точно в одних и тех же точках строки в пределах каждого кадра, частота выборки должна быть синхронна с частотой строк. Поэтому частота выборки должна быть в точности кратна частоте строк. Если каждый отсчет или группа отсчетов идентифицируется как пиксел или группа пикселов, то отсчеты можно реструктурировать, перегруппировывать или манипулировать ими по своему усмотрению, а потом обрабатывать и вновь собирать в исходном порядке. Полный период одной строки полного видеосигнала составляет 64 мкс. Из них 12 мкс используются для импульса синхронизации, его передней и задней площадок; для передачи видеоинформации остаются 52 мкс. Для 720 пикселов в строке частота выборки составляет:

 

          Однако, поскольку частота выборки должна быть целым кратным частоты строк, Международный консультативный комитет по радиосвязи (МККР) рекомендует частоту выборки 13,5 МГц (864-строчная частота). Частота выборки должна быть не менее чем вдвое больше максимальной частоты в спектре аналогового входного сигнала во избежания наложения спектров и других искажений. Для видеосигнала, имеющего в своем спектре максимальную частоту 6 МГц, необходима частота выборки не менее 12 МГц. Следовательно, выбранная частота 13,5 МГц достаточна.  

 Требования к полосе частот. Цветное телевизионное вещание связано с передачей трех сигналов: сигнала яркости Y и двух цветоразностных сигналов Y—R ( обозначается CR) и Y—В ( СB). В системе аналогового телевидения эти сигналы передаются непосредственно с использованием амплитудной модуляции (наземное вещание) или частотной модуляции (спутниковое вещание). В цифровом телевизионном вещании эти три сигнала сначала преобразуются в потоки цифровых данных, а затем модулируются и передаются.

            Для сигнала яркости, который содержит наибольшие видеочастоты, используется максимальная частота выборки 13,5 МГц. Для сигналов цветности CR и СB, которые содержат меньшие частоты, можно использовать и меньшую частоту выборки. МККР рекомендует применять половину частоты, используемой для сигнала яркости, т. е. 6,75 МГц.  Таким образом, для составляющих цветности выборке подвергается только половина пикселов. Общее число отсчетов в секунду составляет

 

13,5 + 6,75 + 6,75 = 27(МГц).

 

         За узлом выборки следует узел квантования, в котором каждый отсчет преобразуется в многобитовый код. Кодом минимального размера для адекватного представления изображения считается 8- битовый код, который дает 28 = 256 дискретных уровней сигнала. Скорость передачи битов при таком кодировании составит

 

u = 27 × 106  × 8 = 216 ×106 бит/с.

           

Для столь высокой битовой скорости нужна очень широкая полоса. Точная ширина полосы зависит от типа модуляции, используемой в передатчике. Например, в случае импульсно-кодовой модуляции (ИКМ) требуется полоса

Δf = 0,5 × 216 =108 МГц.

            

Ширину полосы можно уменьшить, применяя сложные способы модуляции, в частности, квадратурную фазовую манипуляцию (КФМн) и квадратурную амплитудную модуляцию (КАМ). Необходимо применять средства сжатия данных и уменьшения числа битов. Эти средства позволяют уменьшить число битов, необходимое для кодирования изображения при сохранении его качества.

         Качество изображения. Качество изображения при цифровом телевизионном вещании ограничивают два фактора: полоса видеосигнала (или число пикселов на один кадр) и битовая скорость. При 720 пикселах на строку и 576 активных строках на кадр общее число пикселов на кадр составит

 

720 × 576 = 414 720.

 

        Для каждой пары пикселов требуется один период полного видеосигнала, поэтому максимальная частота аналогового видеосигнала составляет

fmax = 414720 ×  = 5,18 МГц.

            

При такой частоте сохраняется то же качество изображения, что и в традиционном аналоговом вещании.

Вторым ограничением на качество изображения является битовая скорость. При сжатии данных в соответствии со стандартом MPEG-2 для цифрового телевизионного вещания хорошего качества требуется битовая скорость на входе модулятора 15 Мбит/с. Меньшая битовая скорость приведет к ухудшению качества изображения. Для телевизионного вещания высокой четкости, использующего 1152 строки, требуется битовая скорость 60 Мбит/с для 1440 пикселов на строку и 80 Мбит/с для 1920 пикселов на строку.

 

3 Лекция.  Общая характеристика системы

 

Программы, содержащие сжатую видеоинформацию и звук, вместе с пакетами служебных данных мультиплексируются (уплотняются) в один битовый поток, называемый элементарным программным потоком (program elementary stream - PES). Элементарный поток каждой программы мультиплексируется еще раз в общий битовый поток, называемый транспортным потоком. Элементарный программный поток содержит идентификационные данные, временную метку и специфическую программную информацию; эти составляющие потока позволяют распаковывать пакеты данных на стороне приемника по программам и кадрам для восстановления исходного изображения. Транспортный поток поступает в модулятор и затем передается по одному ВЧ-каналу частотой 8МГц.

Кодирование программ. Аналоговые видео- и звуковые сигналы подвергаются дискретизации на соответствующей частоте (13,5 МГц для Y и 6,75 МГц для CR и СB), а затем передаются на свои кодирующие устройства. Кодирующие устройства удаляют несущественные или избыточные детали видео- и звуковых сигналов и выполняют операции уменьшения числа битов, формируя индивидуальные пакеты данных. Индивидуальные пакеты данных вместе со служебными пакетами данных передаются на мультиплексор, который формирует элементарный программный поток. Поскольку объем видеоинформации превышает объем звуковой или служебной информации, элементарный программный поток содержит больше пакетов видеоданных, чем пакетов звуковых или служебных данных. Затем элементарные программные потоки объединяются в мультиплексоре и поступают в модулятор для передачи. Тип применяемой модуляции определяется типом вещания (наземное, спутниковое или кабельное).

          Кодирование видеоинформации. Кодирование видеоинформации состоит из трех основных этапов: подготовка видеоданных, их сжатие и квантование (см. рисунок 1). На этапе подготовки данных исходные кодированные данные кадров организуются так, чтобы их было удобно сжимать. Сжатие видеоданных осуществляется в соответствии с международными стандартами, установленными системой MPEG-2. По стандарту MPEG-2 выполняются две основные операции сжатия: удаление временной избыточности и удаление пространственной избыточности.

 

          

А - удаление пространственной избыточности на основе ДКП

Рисунок 1 - Кодирование видеоданных по стандарту MPEG-2

 

Удаление временной избыточности представляет собой межкадровое сжатие данных, при котором происходит сравнение двух последовательных видеокадров, удаление одинаковых областей и формирование разностей кадров для обработки. Удаление пространственной избыточности, называемое также внутрикадровым сжатием, исключает ненужные повторения содержимого конкретного видеокадра. Операции удаления выполняются на основе сложных математических выражений, называемых дискретным косинусным преобразованием (ДКП); отсюда происходит название этого способа: « сжатие данных на основе ДКП». За блоком сжатия данных стоит блок квантования, который обеспечивает дальнейшее битовое сжатие. Блок квантования преобразует коэффициенты ДКП в 8-битовые коды, образующие битовый поток данных.

 Подготовка видеоданных. Видеоинформация, поступающая на вход видеокодера, представлена последовательностью кодированных отсчетов сигнала яркости Y и сигналов цветности CR и CB, затем кадры этих сигналов перегруппировываются в блоки, макроблоки и вырезки. Сначала кадры Y, CR и CB делятся на ряд блоков пикселов. Каждый блок представляет собой матрицу 8x8 закодированных в цифровом виде отсчетов пикселов. Три компонента, представленных базовыми блоками, объединяются и образуют макроблок. Каждый макроблок состоит из четырех блоков яркости и двух блоков каждой составляющей цветности - CR и СВ. Это дает так называемый формат 4:2:0. Затем макроблоки выстраиваются в том порядке, в каком они появляются на изображении, чтобы получить вырезку. Вырезка может состоять из одного или нескольких макроблоков. На этом этапе к каждой вырезке добавляются биты обнаружения ошибки. Если в ступени декодирования приемника обнаруживаются ошибки, то декодер игнорирует информацию, содержащуюся в данной вырезке, и переходит к следующей. Последовательность вырезок восстанавливает полный видеокадр, содержащий все три составляющие изображения (Y, CR, CB), готовые к следующему этапу кодирования видеоданных.

Удаление временной избыточности. Рассматриваемый способ основан

на том обстоятельстве, что различие между двумя последовательными изображениями очень мало. Таким образом, нет необходимости передавать содержание каждого видеокадра полностью, поскольку большая часть текущего кадра просто повторяет предыдущий кадр. Временное сжатие выполняется на группе изображений (group of pictures - GOP), состоящей из 12 нечетных кадров. Содержимое первого кадра группы, называемого кадром Э, сохраняется в памяти и используется как эталонный кадр для последующих кадров (см. рисунок 2).

Рисунок 2 -  Кадры Э, P и В

 

 Содержимое кадра, следующего сразу же за эталонным кадром, сравнивается с кадром Э для образования разностного кадра, называемого кадром Р (от predicted — предсказываемый), который используется для обработки. Затем с первым кадром после кадра Э сравнивается второй кадр после кадра Э, третий кадр со вторым и т. д. до конца группы из 12 видеокадров. Затем для следующей группы из 12 кадров образуется новый эталонный кадр Э и т.д. Величина сжатия кадров Э ограничена; максимальное битовое сжатие получается в кадрах Р. Повышенное сжатие можно получить, используя два других способа: прямое предсказание и предсказание с компенсацией движения. Прямое предсказание — это метод, который используется для создания кадров Р; он включает в себя предсказание ожидаемой разности между макроблоками последовательных кадров и передачей предсказанных кадров на обработку. Для этого требуется хранение более одного видеокадра. В прямом предсказании в качестве эталонного можно использовать кадр Э или ранее восстановленный кадр Р. Недостатком этого способа является то, что возникающие в кадре Р ошибки будут передаваться в последующие кадры до поступления очередного кадра.

Предсказание с компенсацией движения заключается в сравнении содержимого предыдущего кадра и последующего кадра для конструирования текущего кадра. Конструируемый кадр называется кадром В (от backward-prediction — обратное предсказание, или от bidirectional — двунаправленный, поскольку его содержимое зависит как от предыдущего кадра, так и от последующего).

 В отличие от кадров Э и Р кадры В нельзя использовать как эталоны. Они также требуют хранения двух кадров в памяти изображения . На рисунке 7 показана типовая последовательность из 12 кадров Э, P и В (0—11). Поток данных MPEG-2 содержит, таким образом, непрерывную последовательность кодированных кадров, состоящих из комбинации предсказываемых кадров и эталонных кадров. Поскольку предсказываемые кадры Р и В обеспечивают более эффективное сжатие данных, желательно, чтобы предсказываемые кадры передавались гораздо чаще.

Компенсация движения. Компенсация движения используется для того, чтобы корректировать ошибки, которые могут появиться в предсказываемых кадрах. Сравнивая положение объекта в последовательных кадрах, можно точно вычислить скорость и направление движения объекта. На основе этих вычислений можно предсказать положение объекта в последовательных кадрах (обычно в кадрах яркости).

Чтобы описать вектор скорости и направления движения, требуется относительно малый объем данных; эти данные поступают на генераторы кадров Р и В. Как только вектор движения определен, он используется для формирования трех составляющих изображения - Y, CR И СВ.

 

4 Лекция.  Общая характеристика системы (продолжение – удаление избыточности, квантование)

 

Удаление пространственной избыточности ДКП. Основное устройство кодирования видеоинформации — процессор дискретного косинусного преобразования (ДКП). Процессор ДКП получает кадры изображения Э, P и В в виде потока блоков 8x8, организованных в макроблоки и вырезки, образующие один видеокадр. Блоки могут являться частью кадра яркости (Y) или кадра цветности (CR и СB). Данные, представляющие отсчеты в каждом блоке, поступают затем в процессор ДКП (см. рисунок 3), который переводит их в матрицу коэффициентов 8x8, представляющих видеообраз блока.

 

Рисунок 3 - Удаление пространственной избыточности на основе ДКП

 

Перед ДКП каждое число в блоке 8x8 представляет значение соответствующего отсчета, т. е. яркость пиксела, представленного этим отсчетом. Процессор ДКП проверяет пространственные частотные компоненты блока в целом и переводит матрицу временной области в матрицу частотной области. Эта операция связана с созданием нового набора коэффициентов в матрице 8x8, начиная с верхней левой ячейки, представляющей постоянную составляющую, т. е. составляющую с частотой 0 Гц. Коэффициент в этой ячейке представляет среднюю яркость блока. Каждая из остальных ячеек представляет составляющую блока с возрастающей частотой. Значения коэффициентов в других ячейках определяются количеством деталей изображения в блоке. Следовательно, блок, содержащий везде одинаковую яркость (или цвет), например, представляющий участок чистого неба, будет иметь только постоянную составляющую; коэффициенты в других ячейках будут нулевыми. Блок, содержащий деталь изображения, будет иметь ненулевые коэффициенты в соответствующих ячейках. Грубая деталь изображения представляется малыми коэффициентами, и всего несколько ячеек будут содержать ненулевые коэффициенты; тонкая деталь изображения представляется коэффициентами большей величины, и много ячеек будут содержать ненулевые коэффициенты. Тонкие горизонтальные детали изображения (высокая горизонтальная частота) представляются перемещением по горизонтали вправо; более крупные вертикальные детали (более высокая вертикальная частота) представляются движением по вертикали вниз. Самая тонкая деталь изображения, т. е. самая высокая видеочастота, представляется нижней правой ячейкой матрицы.

Зигзагообразное сканирование матрицы ДКП. До квантования матрица ДКП каждого блока переводится в последовательную форму путем сканирования по зигзагообразному пути, начиная с верхнего левого элемента, представляющего  постоянную составляющую. Конец блока обозначается специальным кодом (ЕОВ — end-of-block), который присоединяется к последовательности коэффициентов в конце сканирования. Иногда среди последовательности нулей может встретиться существенный коэффициент, в этом случае используется другой специальный код для обозначения длинной последовательности нулей.

Квантование с переменной длиной. Квантование коэффициентов ДКП

не носит линейного характера. На практике используется энтропийное кодирование. В способе энтропийного кодирования каждому коэффициенту присваивается индивидуальный уровень квантования в соответствии с его положением в матрице. Каждому коэффициенту присваивается весовой, или масштабный, множитель для указания его относительной значимости. Самый высокий уровень квантования присваивается верхнему левому элементу матрицы, который представляет постоянную составляющую.

          Коэффициент постоянной составляющей кодируется с наивысшим уровнем точности, поскольку видимость шумов максимальна на низкочастотной видеоинформации. Высокочастотная информация может допускать более высокий уровень ошибок квантования, поэтому ей присваиваются более низкие уровни квантования. Весовые (масштабные) множители квантования затем модифицируются, чтобы учесть битовую скорость на выходе процессора ДКП. Если имеется грубая деталь изображения и большинство коэффициентов ДКП равны или близки к нулю, т. е. несущественны, процессор ДКП формирует короткую строку коэффициентов, что вызывает минимальные требования к битовой скорости и полосе. Однако блок с более тонкими деталями изображения будет представлен длинной строкой коэффициентов, а это предъявляет более высокие требования к битовой скорости и полосе, которые могут выйти за установленные границы. Чтобы избежать этого, используется кодирование с переменной длиной.

Такое кодирование обеспечивает динамическое изменение весовых коэффициентов квантования в зависимости от битовой скорости, возникающей в самом процессоре ДКП. Квантованные биты поступают сначала в буферную память, а затем передаются с постоянной скоростью в кодирующее устройство передачи. Если битовая скорость увеличивается и буфер начинает переполняться, то запускается блок управления битовой скоростью, уровень квантования уменьшается, и битовая скорость данных снижается. Другими словами, выходная битовая скорость поддерживается постоянной.

Сравнение векторов. Действительное число битов, требуемое для представления каждого отсчета, можно дополнительно уменьшить, используя кодированные двоичные последовательности, такие, например, как при неравномерном кодировании или векторном кодировании. При неравномерном кодировании укорачиваются длинные последовательности одинаковых чисел, например, последовательность 3, 3, 3, 3, 3, 3 заменяется на 6, 3 (число 3, повторенное шесть раз). Векторное кодирование является разновидностью кодирования с предсказанием, при котором квантованная группа пикселов, например матрица 8x8, представляется кодовым вектором. Вектор, математически представляющий блок пикселов, сравнивается с набором векторов, заранее загруженных в ПЗУ. Выбирается вектор с наилучшим соответствием, который и передается должным образом. На приемной стороне переданный вектор вновь преобразуется в первоначальный блок на основе таблицы преобразования, которая содержит тот же набор векторов и соответствующие им изображения.

 5 Лекция. Общая характеристика системы (продолжение - устройство кодирования звука, пакет служебных данных, мультиплексирование программ)

 

Кодирование звука заключается в расщеплении звуковой полосы на 32 поддиапазона равной ширины. Частоты звукового сигнала, попадающие внутрь каждого поддиапазона, подвергаются дискретизации и преобразуются в многобитовый код. Возможны три частоты выборки: 32, 44,1 и 48 кГц. Информация о принятой частоте выборки включается в управляющую часть звукового пакета.

Сжатие звуковой информации осуществляется с помощью специальных алгоритмов, которые удаляют часть звуковых данных, не снижая качества звука, эта операция называется маскированием. При маскировании используются две особенности слуха человека:

- слабый звук становится неслышимым из-за громкого звука на близкой частоте;

-  слабые высокие частоты маскируются более громкими низкими частотами.

Кроме того, человеческий слух имеет конечную разрешающую способность по частоте, вследствие чего звуки в некотором диапазоне частот воспринимаются как одинаковые. Звуковое маскирование выполняется с помощью преобразования Фурье. Звуковые сигналы поступают на процессор быстрого преобразования Фурье (БПФ), который раскладывает звуковой спектр по частотным коэффициентам, используемым для определения уровней квантования различных поддиапазонов. Квантованные поддиапазоны вместе с необходимой информацией управления и обнаружения ошибок поступают на мультиплексор для формирования звукового пакета MPEG-2.

Отсчетам в поддиапазонах предшествуют заголовок, циклический избыточный код (ЦИК), данные о размещении битов и масштабировании. Заголовок несет информацию о синхронизации и системе; биты ЦИК используются для коррекции ошибок; данные о размещении битов определяют разрешающую способность выборки, а биты масштабирования несут информацию о масштабных коэффициентах.

Вспомогательные данные относятся к центральному и окружающему звуку Долби. Кодирование по стандарту MPEG-2 обеспечивает двухканальное стереозвучание, а также до пяти каналов видеовещания с битовой скоростью 64 – 256 кбит/с.

Пакет служебных данных. Пакет служебных данных является третьей составляющей элементарного программного потока (programmer elementary stream - PES) цифрового телевидения. Он содержит служебные и программные данные. Называемый также частным пакетом данных, он содержит среди других управляющих данных специфическую информацию о программе, необходимую для идентификации канала и выбора соответствующих видео- и звуковых пакетов из числа других мультиплексированных программ.

 

Структура элементарного программного потока. Элементарный программный поток содержит заголовок и пакет видео -, звуковых или служебных данных. Длина пакета данных обычно равна 2 кб (2048 байтов), но может достигать и 64 кб. Заголовок содержит информацию, необходимую для идентификации и определения пакета, включая:

-стартовый код (24 бита), в частности, 000001 (шестнадцатеричный);

- идентификационный код PES (8 битов), например, видео-, звукового или частного пакета;

-код длины пакета (16 битов);

-код управления скремблированием (2 бита).

Заголовок может содержать метку времени представления, которая сообщает информацию о времени, когда кадр должен быть отображен, звуковой фрагмент — услышан или титр — вставлен. Эти временные метки важны для синхронизации звуковых и видеоданных.

Мультиплексирование программ. Сначала пакеты видео-, звуковых и служебных данных каждой программы мультиплексируются для образования элементарных программных потоков PES1 и PES2. Затем два элементарных программных потока мультиплексируются, чтобы получился транспортный поток.

Таким образом, транспортный поток содержит индивидуальные пакеты каждой программы, которые идентифицируются по специальной информации о программе, содержащейся в пакете служебных данных.

Затем транспортный поток поступает в кодирующее устройство канала, где вводится прямая коррекция ошибок, и далее в модулятор и передатчик, который может быть передатчиком линии связи «земля-спутник» для спутникового телевидения, передатчиком для наземного телевидения или усилителем для кабельного телевидения.

Модулируемому транспортному потоку, как и в случае одного аналогового канала, отводится полоса 8 МГц. В одном транспортном потоке  для MPEG-2 может содержаться до четырех различных программ без ущерба качеству изображения.

 

6 Лекция. Структура пакетов транспортного потока

 

Транспортный поток MPEG-2 состоит из последовательности 188- байтовых пакетов данных. Каждый пакет содержит 4- байтовый заголовок, за которым следуют 184 байта видео-, звуковой или служебной информации, называемой полезной нагрузкой. Заголовок начинается со стандартного 1- байтового слова синхронизации (шестнадцатеричный код 47), которое определяет для пакета последовательность вхождения в синхронизм. Заголовок (см. таблицу 1) предоставляет необходимую информацию для распаковки различных программ и воспроизведения выбранного элементарного программного потока на приемной стороне.

 

Т а б л и ц а 1 – Содержание заголовка транспортного потока MPEG-2

Поле

Биты

Назначение

Слово синхронизации

8

Sync Byte - байт синхронизации = 0100 0111. Стартовая последовательность заголовка, шестнадцатеричный код 47

Индикатор ошибки

1

Transport error indicator - флаг ошибки передачи, Указывает ошибки на предыдущих этапах. Устанавливается в состояние "1" при наличии в пакете хотя бы одной некорректируемой ошибки.   Обычно управляется внешними устройствами

Индикатор начала блока полезной

нагрузки

 

1

Payload start indicator - флаг начала передачи, устанавливаемый в состояние "1", если полезная нагрузка начинается с начала ПЭП пакета или с первого байта программно- зависимой информации (PSI). Указывает начало полезной нагрузки

Приоритет

1

Transport priority - флаг приоритетной передачи, устанавливаемый в состояние "1" с целью обозначения более высокого приоритета данного пакета по сравнению с другими пакетами с таким же значением PID. Указывает транспортный приоритет

Идентификатор пакета

13

Packet Identifier (PID) - уникальный 13-битовый идентификатор типа пакета. Указывает содержимое пакета

Управление скремблированием

2

Transport Scrambling Control - Указывает на способ скремблирования данных полезной нагрузки. Значение "00" указывает на отсутствие скремблирования, три другие значения - наскремблирование, определяемое пользователем

Флаг поля адаптации и флаг полезной нагрузки

 

2

Adaption Field Control - Указывает на наличие полей адаптации в нагрузке пакета. Возможны три варианта: полезная нагрузка не содержит дополнительных полей адаптации, состоит только из полей адаптации, содержит смесь полей адаптации с обычными видео- или звукоданными

Счетчик связности

4

Continuity Counter - 4-битный счетчик непрерывности пакетов. Возрастает на "1" при каждой передаче полезной нагрузки с определенным значением PID. Ведет счет сокращенных порций PES

Транспортные пакеты короче пакетов элементарного программного потока,  длина которых обычно составляет 2 кб, поэтому пакеты PES следует делить на блоки данных по 184 байта для обеспечения соответствия с пакетом транспортного потока.

Один пакет PES распределяется по нескольким пакетам транспортного потока. Поскольку длина пакета PES в байтах не кратна 184, последний транспортный пакет (который содержит остаток пакета PES) будет только частично заполнен. Незаполненная часть транспортного пакета занимается полем адаптации, длина которого равна разности между 184 байтами и остатком PES. Кроме выполнения этой функции заполнения, поле адаптации служит эталоном программной синхронизации (programmer clock reference - PCR), который используется на приемной стороне для синхронизации базовых синхроимпульсов 90 кГц и является средством для измерения временных меток программы (PTS — programmer time stamp).

Прямая коррекция ошибок. Цифровые сигналы, особенно сигналы с высоким уровнем сжатия, нуждаются в эффективном обнаружении и исправлении ошибок. В цифровом телевизионном вещании интенсивность ошибок в битах должна быть порядка 10-10 – 10-12, что эквивалентно 0,1-10 ошибочным битам за один час передачи. Канал передачи со столь низкой интенсивностью ошибок в битах называют квазибезошибочным каналом. Чтобы выполнить столь строгие условия, приходится предпринимать определенные предупредительные меры, которые гарантируют, что ошибки, вызванные физической средой передачи, будут обнаружены и, если это возможно, скорректированы. В этом заключается назначение блока прямой коррекции ошибок (ПКО).

Перед использованием прямой коррекции ошибок ИС ПКО выполняет так называемое рассредоточение энергии, которое заключается в скремблировании данных для достижения равномерного распределения энергии по каналу. Чтобы обеспечить дескремблирование данных в исходную форму, используют псевдослучайное двоичное скремблирование, аналогичное скремблированию при передаче стереозвука по системе NICAM. ПКО имеет три этапа:

- внешнее кодирование (код Рида-Соломона);

- сверточное перемежение;

- внутреннее кодирование (сверточное).

Внутреннее кодирование (третий этап) не требуется для кабельного телевидения. На приемной стороне все эти три этапа обращаются (см. рисунок 4). Внешнее кодирование использует код обнаружения и исправления ошибок Рида-Соломона (PC). При этом кодировании не корректируются пакеты ошибок, т. е. ошибки в смежных битах. Перемежение позволяет преодолеть это ограничение; оно удаляет друг от друга смежные биты перед передачей. Если среда передачи вносит длинные пакеты ошибок, то на приемной стороне ошибки удаляются друг от друга путем обращения перемежения до поступления  на декодер внешнего кода. Код PC, выбранный для цифровой телевизионной передачи, — это код 204:188, в котором к пакетам транспортного потока добавлены 16 дополнительных байтов.

                          Рисунок 4 -  Этапы ПКО

 

Внешний кодер PC может обнаруживать и исправлять 16 байтов ошибок в 204-байтовом пакете. Наконец, уже упомянутое ранее внутреннее кодирование представляет собой иной тип сверхточного кодирования, который обладает большей способностью исправления ошибок. Полное (100%) устройство сверхточного внутреннего кодирования формирует два одновременных выходных битовых потока, X и Y, каждый из которых повторяет исходный поток данных. Битовые потоки X и Y модулируются и передаются. Хотя этот способ обеспечивает очень эффективное исправление ошибок, он, по существу, удваивает требования к ширине полосы канала.

 

7 Лекция.  Модуляция

 

Избыточность можно снизить, используя способ, называемый прокалыванием, в соответствии с которым из двух одновременных битов потоков X и Y один выбирается для модуляции. Используется чередование битов X и Y в пределах определенного соотношения, называемого отношением прокалывания. Высокое отношение прокалывания увеличивает эффективность коррекции ошибок ценой уменьшения пропускной способности канала.

Вещательная компания в зависимости от мощности передатчика, размера антенны и желаемого качества может выбрать отношение прокалывания 3/4 или 2/3.

Конечное уменьшение битовой скорости осуществляется с помощью современных способов модуляции. Обычная частотная модуляция, при которой логический 0 и логическая 1 представляются двумя различными частотами, крайне неэффективна в отношении требований к битовой скорости и диапазону рабочих частот.

В цифровом телевизионном вещании используются три типа модуляции:

-  относительная квадратурная фазовая манипуляция (ОКФМн) для спутникового телевидения (DVB-S);

-  квадратурная амплитудная модуляция (КАМ)  для кабельного телевидения (DVB-С);

- кодированное ортогональное частотное уплотнение (coded orthogonal frequency division multiplexing - COFDM) для наземного цифрового телевидения (DVB-Т).

Относительная квадратурная фазовая манипуляция. В спутниковом цифровом телевещании применяется тот же вид модуляции, что и в системе NICAM. Четыре значения фазы, 45°, 135°, 225° и 315°, формируются двумя несущими с одинаковой частотой, расположенными под прямыми углами друг к другу. Каждая фаза используется для представления комбинации из двух битов. Для работы обычной квадратурной фазовой манипуляции (КФМн) требуется эталонный фазовый угол. В ОКФМн в качестве эталонного фазового угла используется предыдущая фаза, причем каждое изменение фазы представляется 2-битовой комбинацией.

Квадратурная амплитудная модуляция. Фазовую манипуляцию можно улучшить путем увеличения числа фазовых углов от 4 для КФМн, или 4-ФМн, до 8 или 16 для 8-ФМн и 16-ФМн соответственно. В случае кодирования 8- ФМн несущая может иметь один из восьми различных фазовых углов (см. рисунок 5), причем каждый вектор будет представлять одну из восьми 3- битовых комбинаций. Квадратурная амплитудная модуляция (КАМ) является расширением ФМн в том смысле, что несущая для увеличения числа битов в представлении изменяется как по амплитуде, так и по фазе. Например, кодирование 16 - КАМ увеличивает битовую ширину модуляции до 4. Используются 12 различных фазовых векторов несущей, четыре из которых имеют по две амплитуды, что делает возможным 4-битовое представление.

На рисунке 6 изображены все возможные фазовые углы и амплитуды несущей для 16-ФМн; такую диаграмму называют звездной картой.

В кабельном цифровом телевещании используется цифровая модуляция более высокого порядка, 64- КАМ, в которой каждое сочетание значений фазы и амплитуды несущей представляет одну из 64 возможных 6 - битовых комбинаций.

Кодированное ортогональное частотное уплотнение. Несмотря на свою высокую эффективность, кодирование 64-КАМ при использовании для наземного вещания страдает от замираний и многолучевой интерференции. В аналоговых системах замирание и многолучевая интерференция вызывают ухудшение изображения. В цифровых системах, особенно когда изменение фазы на отраженном пути составляет 180° по отношению к прямому пути, возможно серьезное ухудшение и даже полное исчезновение изображения. Этого можно избежать, используя модуляцию с несколькими несущими, называемую ортогональным частотным уплотнением (OFDM).

 

                

           Рисунок 5 - Векторная диаграмма для 8-ФМн

 

                                   

               Рисунок 6 - Звездная карта для 16-ФМн

 

Звездная карта для кодирования порядка 64-КАМ показана на рисунке 20.                                                                            

 

 

Рисунок 7 - Звездная карта для 64 -КАМ

Поскольку цифровой сигнал кодируется с применением прямой коррекции ошибок, этот процесс модуляции называют кодированным ортогональным частотным уплотнением (COFDM). Способ COFDM включает в себя распределение высокоскоростного последовательного битового потока по большому числу близкорасположенных индивидуальных несущих, разнесенных по доступной полосе частот. Каждая несущая передает только часть общего битового потока. Несущие обрабатываются (или модулируются) одновременно в течение регулярных интервалов времени. Набор несущих, обрабатываемых на каждом интервале, называют символом COFDM.

Вследствие большого числа несущих, длительность символа COFDM существенно больше, чем длительность одного бита в исходном битовом потоке. Пусть, например, число модулирующих битов равно 500, причем каждый из них используется в течение 0,1 мкс для обработки (модуляции) 500 несущих с целью формирования символа COFDM. Тогда длительность символа COFDM составит приблизительно 0,1×10- 6 × 500 = 50 мкс.

Большая длительность символа позволяет приемнику ждать, пока не придут все отраженные сигналы, и только после этого произвести оценку и обработку сигнала. Таким образом, отраженные колебания, приходящие в этот период времени, будут улучшать путь прямой передачи. Возможно дальнейшее его улучшение посредством введения перед символом защитного интервала (называемого также защитной полосой), во время которого приемник ждет перед тем, как начать оценку несущих.

При использовании всех несущих получается плоский частотный спектр с паразитными боковыми лепестками на каждом его крае. Введение защитного интервала улучшает частотный спектр, уменьшая вторичные боковые лепестки.

Быстрое преобразование Фурье. Набор несущих, формируемых OFDM,

очень напоминает то, что получается в алгоритме БПФ, которое производит разложение непрерывного колебания на частотные составляющие. Для получения непрерывного колебания, которое можно применить для модуляции УВЧ-несущей, над несущими COFDM выполняется обратное быстрое преобразование Фурье (ОБПФ). На приемной стороне сигнал от УВЧ- демодулятора поступает на кристалл БПФ для получения исходных несущих COFDM.

  Мощность эквивалентного изотропного излучателя. Плоский частотный спектр уменьшает требования к мощности эквивалентного изотропного излучателя (МЭИИ) цифрового телевизионного приемника примерно на 20 дБ (в 100 раз) по сравнению с аналоговым наземным вещанием, при котором мощность несущей концентрируется в узкой полосе вокруг несущей изображения, поднесущих цвета, ЧМ-звука и звука NICAM. Энергия, передаваемая несущими COFDM, более равномерно распределена по всему спектру.

           Одночастотная сеть. Кроме улучшения качества приема, имеется дополнительное преимущество, которое заключается в высокой устойчивости по отношению к замираниям и многолучевой интерференции. Это дает основание вещательным компаниям использовать одночастотную сеть по всей стране. При аналоговом телевещании идентичный сигнал от соседнего передатчика вызовет повторное изображение. Но при цифровом наземном телевещании его невозможно будет отличить от сигнала, передаваемого другим передатчиком, так же, как и отраженные колебания. Если посторонние сигналы поступят во время защитного интервала, то будут отвергнуты.

 Режимы COFDM 8k/2k. Для цифрового наземного телевидения европейская система DVB базируется на модуляции COFDM с 8 кб или 2 кб несущими с длительностью символа (ts) 896 и 224 мкс соответственно. Эффективное число несущих, т. е. фактическое число несущих, которые можно использовать для модуляции COFDM, составляет 6818 для режима 8кб и 1706 для режима 2 кб. Остальные несущие используются для защитного интервала и как непрерывные и рассеянные пилот-несущие. Непрерывные пилот-несущие передают параметры конкретной передачи, а рассеянные пилот-несущие используются как эталонные несущие.

Управление цифровым мультиплексором. Мультиплекс транспортного потока передает две или более программы, каждая из которых содержит несколько элементарных программных потоков.

 Информация о различных компонентах программы и о том, как они соотносятся друг с другом, содержится в битах данных специальной программной информации (СПИ) внутри пакета служебных данных. СПИ состоит из нескольких таблиц, которые содержат всю информацию, необходимую для настройки и выбора программы.

Существуют четыре основные таблицы:

- таблица размещения программ (programme allocation table - PAT) устанавливает  связь между программой и программным идентификатором (PID) пакетов, несущих карту программ;

-таблица карты программ (programme map table - РМТ) указывает программные идентификаторы элементарных потоков, составляющих программу;

- таблица условного доступа (conditional access table - CAT) содержит данные управления доступом;

-  частная таблица содержит частную информацию.

Изменение программ, или заппинг (быстрая смена телезрителем просматриваемой программы с помощью пульта дистанционного управления), является намного более длительной операцией по сравнению с аналоговым телевидением; процесс синхронизации и идентификации занимает более одной секунды в зависимости от того, где происходит изменение: внутри или снаружи канала.  

 

8 Лекция.  Стандарт кодирования видео- и звуковой информации MPEG-4

 

Следующим проектом группы MPEG является стандарт MPEG-4. Стандарт MPEG-4 охватывает видеосвязь, цифровое телевидение, интерактивную графику, синтез изображений и позволяет передавать видео- и звуковую информацию с очень большими коэффициентами сжатия по узкополосным каналам связи. Этот стандарт необходим как в системах видеосвязи при использовании обычных телефонных сетей и относительно низкоскоростных каналов, так и для передачи движущихся изображений и звукового сопровождения через Интернет. Кроме того, стандарт MPEG-4 обеспечивает интерактивность, возможность пользователя управлять процессом передачи ему информации путем запросов, выбора вариантов и других действий.

Основной особенностью MPEG-4 является объектно-ориентированный подход, сущность которого заключается в том, что передаваемое изображение со звуковым сопровождением представляется как совокупность видео- и аудиообъектов.  Видеообъектами (VО) могут быть изображения людей и предметов, перемещающихся перед неподвижным фоном, и сам неподвижный фон, а аудиообъектами (АО) – голоса людей, музыка другие звуки. Связанные видео и аудиообъекты образуют аудио–визуальный объект (AVO), например, передача изображения человека и его голоса. Совокупность видео и аудиообъектов составляют сцену. Для передачи сцен в MPEG-4 используется специальный язык для описания сцен BIFS (двоичный формат для сцен). Описание сцены представляет собой иерархическую структуру. Например, в сцене на лесной полянке присутствуют два персонажа: серый волк и Красная Шапочка, каждый из которых является аудио–визуальным объектом, состоящим из видеообъекта – движущееся изображение персонажа, и аудиообъекта – голоса этого персонажа. Верхний уровень структуры определяется сценой в целом. Сцена содержит неподвижный ФОН, состоящий из голубого неба, стволов и крон деревьев, зеленой травы, цветов и т.д. Кроме того, в сцене присутствует поющая птичка, которая также является аудио–визуальным объектом, включающим видеообъект – изображение, перелетающее с ветки на ветку, и аудиообъект – звуки, исходящие от птички. Описание каждой сцены включает данные о координатах объектов в пространстве и их привязки ко времени. Видеообъекты могут размещаться в разных плоскостях видеообъектов (VOP), так что видеообъекты, находящиеся в более близких к зрителю плоскостях сцены, перекрывают при движении видеообъекты, находящиеся в более дальних плоскостях.

Сцена, представляемая пользователю, может содержать все аудио-, видеообъекты или только часть этих объектов. Состав сцены может определяться поставщиком мультимедийной продукции. В интерактивном режиме пользователь может влиять на развитие сцены, подавая отсутствующие команды. Для реализации интерактивных возможностей стандарта MPEG-4 необходим не обычный телевизор, а персональный компьютер, подключенный к сети.

Стандарт MPEG-4 использует целый набор методов кодирования, включая алгоритмы сходные с MPEG-2, так и принципиально новые основанные на понятии видеообъекта. Выбор метода кодирования в конкретном случае определяется характером изображения и требуемым коэффициентом сжатия информации. MPEG-4 эффективно сжимает как натуральные, так и синтетические изображения и объединяет их при воспроизведении.

Упрощенная структурная схема видеодекодера для натуральных изображений состоит:

ДКП – процессор прямого дискретно-косинусного преобразования;

ДКП-1 – процессор обратного дискретно-косинусного преобразования;

Кв – квантователь;

Кв-1 – деквантователь;

ЗУ – запоминающее устройство;

Пред.1, Пред.2 – блоки формирующие предсказанные изображения в разных режимах кодирования;

ОД – блок оценки движения и формирования векторов движения;

Mп – мультиплексор.

В состав кодера также входят: кодер текстуры, кодер формы, вычитающее и суммирующее устройства и переключатель «Выбор» методов кодирования. На вход кодера поступают исходные видеоданные в цифровой форме, а на выходе формируется элементарный поток видеоданных.

 Основные методы кодирования натуральных изображений в стандарте MPEG-4.

1. Видеообъекты, представляющие собой прямоугольные изображения (обычные ТВ кадры), кодируются методом, аналогичным применяемому в MPEG-2, т.е. с использованием гибридного кодирования. Метод включает предсказания с оценкой и компенсацией движения для макроблоков 16x16 пикселов и ДКП ошибки предсказания в блоках 8x8 пикселов. Предсказания в этом случае выполняется в блоке «Пред.1». Этот вид кодирования имеет два уровня скорости передачи двоичных символов в потоке данных. Уровень очень низкой скорости передачи (VLBV) предназначен для передачи изображений с низким пространственным разрешением (форматы QCIF и SQCIF), частотой кадров 10÷15 Гц и со скоростями передачи двоичных символов 5 ÷ 64 кбит/с. Этот уровень можно использовать в видеотелефонной связи. Уровень высокой скорости передачи (HBV) предназначен для передачи изображений с высоким пространственным разрешением со скоростями передачи двоичных символов 64 кбит/с ÷ 10 Мбит/с. Этот уровень может использоваться для передачи телевизионных программ.

2. Кодирование, основанное на содержании сцены, позволяет получить существенно большее сжатие изображений за счет учета свойств видео- объектов, присутствующих в сцене. Одной из возможностей, создаваемых этими методами, является кодирование видеообъектов сложной формы. Например, в качестве видеообъекта может быть взята область изображения, отличающаяся от окружения яркостью или цветом. Эта область может перемещаться и деформироваться. При формировании предсказанного изображения с компенсацией движения смещаются не прямоугольные макроблоки, а выделенные области, которые к тому же могут изменять свою форму. При этом ошибка предсказания оказывается значительно меньше, и объем информации, содержащийся в разности предсказанного и настоящего изображений очередного кадра, существенно уменьшается. В кодере такой вариант выполняется в блоке «Пред.2». В то же время, вместо векторов движения, показывающих перемещение прямоугольного макроблока как целого, необходимо передавать параметры, характеризующие изменение координат и формы объекта. Эти параметры определяются и кодируются в кодере формы,  после чего они через мультиплексор поступают в выходной поток данных. Данные о форме видеообъекта занимают значительно больше бит, чем простой вектор движения. Например, если граница области, выделенной как видеообъект, представляется многоугольником, то для описания смещения и деформации этой области необходимо передать изменение координат всех углов многоугольника. Тем не менее, общий выигрыш в уменьшении передаваемой информации по сравнению с MPEG-2 оказывается существенным.

3. Для сжатия изображения неподвижного фона и текстур протяженных объектов используется метод кодирования, основанный на «вэйвлет»- преобразовании. Этот метод обеспечивает высокие степени сжатия и многоступенчатую масштабируемость по пространственному разрешению. Синтетические видеообъекты, создаваемые с помощью компьютерной графики, могут кодироваться рассмотренными ранее методами для натуральных изображений. Однако эффективнее использовать их параметрическое описание. В стандарте MPEG-4 используются модель человеческого лица, построенная на основе сетки из треугольных ячеек, которые заполняются текстурой, и трехмерная модель человеческого тела в виде трехмерной сетки. Двумерные изображения человека получаются с помощью построения проекции трехмерной модели на нужную плоскость. Форма, текстура и выражение лица в статистике описываются параметрами FDP (Facial Definition Parameters) и в динамике – параметрами FAP (Facial Animation Parameters). Для тела в статике задаются параметры BDP (Body Definition Parameters), а в динамике BAP (Body Animation Parameters). Статические параметры FDP и BDP обычно передаются в начале сеанса связи. Для воспроизведения мимики лица и движения тела в процессе разговора передаются параметры FAP и BAP. Синтетические изображения могут использоваться в системах видеосвязи вместо настоящих изображений, при этом скорость передачи становится меньше, чем скорость передачи реального изображения. В некоторых случаях можно в приемной части системы получить информацию об изменениях изображения объекта на основе другой информации. Например, передача изображения лица говорящего человека. Движения рта и мимика во многом определяется произносимыми словами, и могут быть синтезированы на основе принятого звукового сигнала, содержащего голос собеседника. В этом случае требуемая скорость цифровой передачи для осуществления видеосвязи еще более уменьшается. Помимо лица и тела могут синтезироваться произвольные двумерные изображения в виде сеток с треугольными ячейками, заполняемыми текстурой.

Кодирование звуковой информации. Для кодирования звуковой информации в MPEG-4 предусмотрено три уровня кодирования.

1. Кодирование музыки с обеспечением высокого и среднего качества выполняется такими же методами, что и в стандарте MPEG-2. При этом обеспечивается передача восьми каналов звука при скорости 16 ÷64 кбит/с на канал.

2.  Для передачи речи с высоким и средним качеством применяется метод

– кодирование возбуждений с линейным предсказанием, который обеспечивает скорости передачи 6÷24 кбит/с при частотах дискретизации 8 кГц или 16 кГц.

3. Параметрическое кодирование речи, которое обеспечивает сжатие при

сохранении разборчивости до скоростей 2÷4 кбит/с при частоте дискретизации

8 кГц.

Самые низкие скорости передачи 0,2 ÷1,2 кбит/с используются для искусственно синтезированной речи и синтезированной в соответствии со стандартом MIDI музыки.

Кодирование аудиообъектов также обладает свойством масштабируемости. Например, на основном уровне потока данных может использоваться метод кодирования CELP, а дополнительный уровень обеспечивает качество звука, соответствующее кодированию по MPEG-4.

Передача данных в стандарте MPEG-4.  Элементарные потоки ES с видео- и аудиодекодеров поступают на уровень синхронизации (SL – Syns Layer) и преобразуются в пакетизированные SL- потоки, в которые введены метки времени и данные о тактовых частотах для привязки к единой шкале времени различных видео- и аудиообъектов. Далее пакетизированные SL- потоки поступают на уровень DMIF (Delivery Multimedia Integration Framework – интегрированная система доставки мультимедиа) – это протокол, обеспечивающий управление потоками данных для мультимедиа. Протокол DMIF обеспечивает посылку запросов от пользователя к источнику информации и пересылку запрошенных данных пользователю. Кроме того, DMIF дает пользователю средства управления в виде интерфейса пользователя DMIF – Application Interface (DAI), позволяя подавать команды для выбора информации (например, фильма) и формируя сообщения о получении доступа к этой информации или о возникших при этом трудностях. DMIF охватывает три основные сферы применения MPEG-4:

- передачу по интерактивным сетям (Интернет);

-  передачу по обычным вещательным каналам;

-  видеозапись программ на компакт диски.

На уровне DMIF возможно объединение в блоках FlexMUX пакетизированных SL- потоков во FlexMUX- потоки. Эта операция является не

обязательной, так как под управлением DMIF могут передаваться и пакетизированные SL-потоки.

Далее данные переходят на уровень TransMUX, где SL- или FlexMUX- потоки объединяются и преобразуются в транспортный поток (TransMUX- поток). В стандарте MPEG-4 этот поток не определен. В качестве его можно использовать, например, транспортный поток (TS) MPEG-2. Возможны и другие транспортные протоколы.

Декодирование информации по стандарту MPEG-4  осуществляется декодирующей частью. На вход устройства поступает транспортный поток, из которого в демультиплексоре выделяются элементарные потоки (ES), данные каждого ES записываются в соответствующие БЗУ1. Назначение БЗУ1 – накапливать неравномерно поступающие по каналам связи данные и по мере необходимости передавать их на декодер. Элементарные потоки, относящиеся к одному объекту, могут декодироваться совместно. При этом обеспечивается синхронизация всех видео - и аудиообъектов.

 

Список литературы 

1. Телевидение / Под ред. В.Е. Джакония.- М.: Радио и связь, 2004.

2. Звуковое, телевизионное вещание / Выходец А.В., Коваленко В.И., Кохно М.Т. – М.: Радио и связь, 1987.

3. Современные телекоммуникации./ Под общей редакцией С.А. Довгого, - М.: Эко – Трендз, 2003.

4.  Смирнов А.В. Основы цифрового телевидения: Учебное пособие. – М.: «Горячая линия - Телеком», 2001. – 224 с.

5. Ибрагим, К.Ф. Телевизионные приемники: пер. с англ. / К.Ф. Ибрагим. – М.: Мир, 2000.

6. Птачек, М. Цифровое телевидение. Теория и техника: пер. с чеш. под

ред. Л.С.Виленчика / М. Птачек. – М.: Радио и связь, 1998.

 

 

Содержание

1 Лекция.  Особенности цифрового телевидения                                   

3

2 Лекция.   Преобразование телевизионного изображения в цифровую форму

8

3 Лекция.   Общая характеристика системы                                                

11

4 Лекция.  Общая характеристика системы (продолжение – удаление избыточности, квантование)  

12

5 Лекция.  Общая характеристика системы (продолжение – устройство кодирования звука, пакет служебных данных, мультиплексирование программ) 

15

6 Лекция.  Структура пакетов транспортного потока                           

16

7 Лекция.  Модуляция                                                                               

19

8 Лекция.  Стандарт кодирования видео- и звуковой информации MPEG-

24

 Список литературы                                                                                   

29

 

 

 

 

 

 

   

                                                                                  Св. план 2012г., поз. 326