• 134.00 KB
  • 2022-09-27 发布

运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南(暂行)

  • 25页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
中华人民共和国广播电影电视行业技术要求国家广播电影电视总局发布运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南(暂行)151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南目次前言……………………………………………………………………………1291.范围……………………………………………………………………..…...1312.规范性引用文件………………………………………………….…………1312.1引用标准………………………………………………….……………1312.2参考文献………………………………………………….……………1313.定义和缩略语……………………………………………….………………1323.1定义……………………………………………………….……………1323.2缩略语……………………………………………………….…………1324.系统层…………………………………………………………….…………1334.1广播码流和基本解码………………………………………….………1334.2来自存储应用和数字接口的码流…………………………….………1415.视频………………………………………………………………….………1425.1SDTV码流和解码………………..………………………………..……1425.2HDTV码流和解码………………………………………………..…….1456.音频…………………………………………………………………….……1486.1音频模式………………………………………………………….……1486.2层…………………………………………………………………...…..1496.3比特率………………………………………………………..……...…1496.4取样频率……………………………………………………..……...…1496.5加重…………………………………………………………………….1496.6循环冗余码……………………………………………………….....…1496.7预测………………………………………………………………...…..1506.8扩展流……………………………………………………………...…..1506.9辅助数据………………………………..………………………………150151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南前言本文件提供包括对使用GB/T17975.1-2000,GB/T17975.2-2000,GB/T17975.3-2002规定的运动图像及其伴音信号的通用编码系统、视频和音频部分进行编码和解码的实施指南。本文件对码流解码的实施指南只是提出解码的最低功能要求,所有种类的解码器应满足或超过这些要求。码流解码的分类:· SDTV解码和HDTV解码:依据对解码图像传统电视分辨率的限定进行划分。SDTV解码是HDTV解码的子集。· 基本解码和部分传送流解码:依据是否与数字码流存储设备(如数字VCR)一起使用进行划分。基本解码是部分传送流解码的子集。为给出码流解码的完整定义,需要对所有类型的码流解码进行规定。如,SDTV基本解码。应注意在数字电视广播系统,源图像格式、编码图像格式和显示图像格式不需要相同。例如,HDTV源图像可以在下变换到SDTV分辨率之后,以主型主级编码,然后作为SDTV码流广播。解码器接收码流后进行上变换,并以HDTV分辨率显示解码图像。利用适当的下变换和上变换,得到的HDTV图像质量可以接近HDTV原图像的质量。数字电视广播的另一个重要特性是一个传送流可以含有用于多种码流解码的节目素材。典型的事例是SDTV和HDTV视频素材的同播。在这种情况,从同一个传送流中SDTV解码器解码并显示SDTV图像,而HDTV解码器则解码和显示HDTV图像。对这些基本特性的规定决不是要阻止解码器制造商增加其它的功能,也不要理解为是对性能的某种上限规定。实施指南未包含的特性,如解码器上取样滤波器,会影响显示图像的质量,而不会影响是否能够解码图像。此类问题留给市场。码流解码的实施指南遵循以下原则:· 实际上,码流解码的设计应允许对未来码流句法的兼容扩展;· 码流解码应忽略其设计未使用的所有运动图像及其伴音信号的通用编码系统、视频、音频部分中的“保留”和“私有”位。编码器操作规则的特性和限定应使编码系统保证所传输内容能够被正确解码,这些限定是强制的或可选的。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南第四章到第六章,分别为数字电视广播系统、视频和音频编解码提供实施指南。某些重要特性归纳如下,但所有定义都应参考第四章到第六章。系统:· 使用MPEG-2传送流;· 业务信息(SI)基于MPEG-2节目特定信息;· 条件接收使用MPEG-2条件接收CA_descriptor;· 部分传送流用于数字VCR应用。视频:· MPEG-2主型主级用于SDTV;· MPEG-2主型高级用于HDTV;· SDTV图像可以具有4:3和16:9的幅型比,解码支持4:3和16:9的幅型比;· HDTV图像具有16:9的幅型比,解码支持16:9的幅型比;· 解码器支持使用平移矢量,允许4:3监视器全屏幕显示16:9编码的SDTV分辨率的图像。音频:· 解码器支持32kHz,44.1kHz和48kHz采样率;· 编码码流不使用加重;· 所有解码器支持GB/T17191.3-1997或GB/T17975.3-2002立体声层I和层II;· 解码器支持单声道、双声道、联合立体声、立体声;· 解码支持GB/T17975.3-2002层II多声道或其它多声道编码方式是可选的;· 对于GB/T17191.3-1997音频码流,建议使用层II编码;· 解码器支持其它音频解码是可选的;· 解码器支持包含辅助数据的音频流是可选的。151151\n中华人民共和国广播电影电视行业技术要求运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南1范围本文件为在卫星、有线、地面数字广播分配系统中使用GB/T17975音视频编码提供实施指南,包括标准清晰度电视(SDTV)和高清晰度电视(HDTV)。对于数字VCR应用的配有数字接口的设备,本文件也给出了实施指南。本文件不涵盖涉及业务馈送的业务。编码器操作规则的特性和限制应该使编码系统保证所传输的内容可以正确解码。这些限制可以是强制性的、建议性的和可选性的。2规范性引用文件2.1引用标准下列文件中的条款通过本文件的引用而成为本实施指南的条款。凡是注明日期的引用文件,其随后修改版本均不适用于本文件;凡是不注明日期的引用文件,其最新版本适用于本文件。[1]GB/T17975.1-2000信息技术运动图像及其伴音信号的通用编码第1部分系统[2]GB/T17975.2-2000信息技术运动图像及其伴音信号的通用编码第2部分视频[3]GB/T17975.3-2002信息技术运动图像及其伴音信号的通用编码第3部分音频[4]GB/T17191.1-1997信息技术具有1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码第1部分系统[5]GB/T17191.3-1997信息技术具有1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码第3部分音频[6]GY/Z175-2001数字电视广播条件接收系统规范[7]GY/Z174-2001数字电视广播业务信息规范[8]GB3174-1995PAL-D制电视广播技术规范[9]GY/T155-2000高清晰度电视节目制作及交换用视频参数2.2参考文献下列文件是本实施指南的的参考文献:151\n[1]ITU-TRecommendationJ.17(1988):"Pre-emphasisusedonsound-programmecircuits"[2]EBURecommendationR.68:"Alignmentlevelindigitalaudioproductionequipmentandindigitalaudiorecorders"[3]ISO/IEC13818-9(1996):"Informationtechnology-Genericcodingofmovingpicturesandassociatedaudioinformation-Part9:Extensionforrealtimeinterfaceforsystemsdecoders"3定义和缩略语3.1定义下列术语和定义适用于本文件:●SDTV解码SDTVDecoding能够对本文件规定的主型主级码流进行解码并显示图像。●SDTV码流SDTVBitstream只含有本文件规定的主型主级码流。●HDTV解码HDTVDecoding能够对本文件规定的主型高级码流进行解码并显示图像。●HDTV码流HDTVBitstream只含有本文件规定的主型高级码流。●基本解码BaselineDecoding提供对发送的码流进行基本功能的解码,这些码流是遵循本文件建议的。不要求能够对部分传送流解码,部分传送流来自与数字码流存储设备(如,数字VCR)相连的数字接口。●部分传送流解码PartialTSDecoding除提供基本解码的功能外,还能够对部分传送流进行解码。按照本文件的规定,部分传送流来自与数字码流存储设备(如,数字VCR)相连的数字接口。●部分传送流PartialTransportStream从一个传送流中去除与选定的一个或多个节目无关的TS包而得到的码流。●平移矢量PanVector在视频码流中frame_centre_horizontal_offset字段中指定的视频帧中心位置偏移的非零值。3.2缩略语下列缩略语适用于本文件:151运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南CAConditionalAccess条件接收DABDigitalAudioBroadcasting数字音频广播151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南DVBDigitalVideoBroadcasting数字视频广播DVDDigitalVersatileDisc数字通用光盘ESElementaryStream基本流ESCRElementaryStreamClockReference基本流时钟基准I帧Intra-codedFrame内编码的帧HDTVHighDefinitionTelevision高清晰度电视NITNetworkInformationTable网络信息表PATProgramAssociationTable节目相关表PCRProgramClockReference节目时钟基准PESPacketizedElementaryStream打包的基本流PIDPacketIdentifier包标识符PMTProgramMapTable节目映射表PSIProgramSpecificInformation节目特定信息SIServiceInformation业务信息SDTVStandardDefinitionTelevision标准清晰度电视STDSystemTargetDecoder系统目标解码器TSTransportStream传送流TSDTTransportStreamDescriptionTable传送流描述表T-STDTransportstreamSystemTargetDecoder传送流系统目标解码器VCRVideoCassetteRecorder录像机4系统层本章描述了对数字电视广播码流中的系统层进行编码以及在解码器中对该层解码的实施指南。源码流可以通过卫星、电缆、地面广播通道、或者数字接口进行传输。4.1节适用于所有源码流的编码和基本解码。4.2节给出了有关VCR应用环境中通过数字接口传输的码流以及配有数字接口的解码器的解码过程的相关信息。4.1广播码流和基本解码基带信号与相关数据的复用规则遵循GB/T17975.1-2000。一些参数和字段在数字电视广播系统中并没有使用,以下说明这些限制。为了提供与GB/T17975.1-2000的完全兼容以及对未来增强版本的向上支持,数字电视广播解码器应能够跳过那些目前设为“保留”151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南、或者其对应功能并非由解码器实现的数据结构。举个例子来说,一个在数字电视广播系统中没有定义的描述符标志可以被解释成非操作性标志,其长度字段可以解出,并跳过相应的数据。由于同样的原因,解码器的设计必须基于这样一个假设:任何GB/T17975.1-2000所允许的合法(数据)结构都可能在广播码流中出现,即使它们目前设定为“保留”或“未使用”。因此,有以下假设:· 私有数据只可以由具有该功能的解码器操作;· 码流填充要使用常规的填充机制,保留字段不可以用于这个目的。保留字段的数据应设为0xFF。本章中的标题是基于GB/T17975.1-2000,标题后面括号中的数字是GB/T17975.1-2000相应章节。4.1.1前言(GB/T17975.1-2000第0节)GB/T17975.1-2000规定了两种类型的复用码流:传送流和节目流。编码:传输的复用流应使用传送流。解码:基本解码要能够对GB/T17975.1-2000传送流解复用。对节目流(如GB/T17975.1-2000第0.2和0.3节所描述的)的解复用操作是可选的。4.1.2PES流(GB/T17975.1-2000第0.4节)编码:不要求编码器生成物理的PES流,ESCR字段和ES码率字段无须编码。解码:ESCR字段和ES码率字段无须解码。4.1.3传送流系统目标解码器(GB/T17975.1-2000第2.4.2节)编码:系统时钟频率要遵循GB/T17975.1-2000(2.4.2.1节)规定的容限。建议容限在5ppm以内。解码:解码器要能够在GB/T17975.1-2000(2.4.2.1节)规定的全部系统时钟频率容限范围内工作。4.1.4传送包层(GB/T17975.1-2000第2.4.3.2节)4.1.4.1空包编码:空包(PID值为0x1FFF)的编码要遵循GB/T17975.1-2000。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南4.1.4.2传送包数据头4.1.4.2.1transport_error_indicator编码:建议传输通路上的任何误码检测设备都要在检测到不可纠正错误的时候对transport_error_indicator置位。解码:一旦传输码流中的transport_error_indicator标志被置位,建议解码器要启动适当的掩盖或者误码恢复机制。4.1.4.2.2transport_priority解码:transport_priority位对解码没有意义,可以忽略。4.1.4.2.3transport_scrambling_control编码:根据GY/Z175-2001,transport_scrambling_control要按照表1来设定。表1transport_scrambling_control位的编码值说明00TS包载荷没有加扰01为数字电视广播未来的应用保留10TS包用偶数密钥加扰11TS包用奇数密钥加扰解码:解码器应能够读出这些数据,并依据表1作出响应。4.1.4.2.4SI表所使用的PID值编码:有关SI的PID分配见GY/Z174-2001。4.1.5自适应字段(GB/T17975.1-2000第2.4.3.4节)4.1.5.1random_access_indicator编码:建议视频流中一旦出现随机访问点(也就是视频序列数据头后紧跟着一个I帧)就要对random_access_indicator置位。4.1.5.2elementary_stream_priority_indicator解码:解码可以忽略elementary_stream_priority_indicator。4.1.5.3节目时钟基准PCR编码:按照GB/T17975.1-2000第2.7.3节的规定,同一节目里两个连续PCR的时间间隔不能超过100毫秒。在数字电视广播应用中,PCR的时间间隔不大于40毫秒。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南解码:解码器要能够对PCR间隔在100毫秒以内的节目正确操作。4.1.5.4其它字段本节包含了以下字段:· original_program_clock_reference_base· original_program_clock_reference_extension· splice_countdown· private_data_byte· adaption_field_extension(包括其中的字段)编码:这些字段在数字电视广播码流中是可选的。标识这些字段是否存在的每一个标志位应该恰当地设定。解码:解码器应能够接受包含这些字段的码流,但可以忽略字段内的数据。4.1.6PES包(GB/T17975.1-2000第2.4.3.6节)4.1.6.1stream_id和stream_type编码:基本流应遵循GB/T17975.1-2000的表2-18来设定stream_id。基本流应遵循GB/T17975.1-2000的表2-29来设定stream_type,0×80—0×83可用于其它音频编码方式。4.1.6.2PES_scrambling_control编码:遵循GY/Z175-2001,PES_scrambling_control应按照表2来设定。表2PES_scrambling_control数据的编码值说明00TS包载荷没有加扰01为DVB未来的应用保留10TS包用偶数密钥加扰11TS包用奇数密钥加扰解码:解码器应能够读出PES_scrambling_control数据,并依据表2作出响应。4.1.6.3PES_priority解码:解码器可以忽略PES_priority。4.1.6.4版权和original_or_copy编码:版权和original_or_copy可以按需要设定。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南解码:解码器无须解释这些数据,但不可以改动解码器数字输出中的这些数据。4.1.6.5特技模式字段本节包括以下字段:· trick_mode_control· field_id· intra_slice_refresh· frequency_truncation· field_rep_cntrl编码:在广播码流中不应传输特技模式字段。其它应用(也就是非广播交互业务、存储应用等)可以使用这些字段。解码:如果解码器不支持特技模式字段,可以跳过任何标志为用于特技模式的数据。如果解码器具有用于数字VCR应用的数字接口,建议要支持特技模式的解码。4.1.6.6additional_copy_info编码:该字段按需要使用。解码:解码无须解释该字段。在解码器数字输出中,不能更改该字段的编码。4.1.6.7可选字段本节包含以下字段:· ESCR· ESCR_extension· ES_rate· Previous_PES_packet_CRC· PES_private_data· Pack_header()· Program_packet_sequence_counter· MPEG1_MPEG2_identifier· Original_stuff_length· P-STD_buffer_scale· P-STD_buffer_size151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南编码:这些字段在数字电视广播码流中是可选的。标识这些字段是否存在的标志位要恰当设定。解码:解码器应能够接受包含这些字段的码流,但可以忽略字段内的数据。4.1.6.8PES_extension_fieldPES_extension_field数据字段目前为“保留”。编码:除非将来对该字段进行规定,否则不得使用该扩展字段。解码:解码器应能够接受包含这些字段的码流,但可以忽略字段内的数据。4.1.7PSI(GB/T17975.1-2000第2.4.4节)数字电视广播码流中的网络信息表(NIT)的数据格式参见GY/Z174-2001。本文件也为使用由GB/T17975.1-2000定义的PSI_private_section的业务信息定义了额外的表。建议PAT和PMT重复发送的最大时间间隔为100毫秒,而TSDT的最大重复间隔为10秒。4.1.8节目和基本流描述符(GB/T17975.1-2000第2.6节)4.1.8.1video_stream_descriptor和audio_stream_descriptor编码:video_stream_decriptor用于指示视频流中含有静止图像数据,否则必须在合适的情况下使用。如果没有profile_and_level_indication,那么视频流就要遵循MP@ML的限制。对于MP@ML以外的型和类,必须要传输适宜的profile_and_level_indication。如果没有audio_stream_descriptor,音频流就不能使用16kHz、22.05kHz、24kHz采样频率,而且码流中所有的音频帧都使用同一码率。解码:如果这些描述符存在,解码器可以利用它们来判定是否能够对码流解码。4.1.8.2hierarchy_descriptor编码:当且仅当音频按照多层编码时,才可以使用hierarchy_descriptor。4.1.8.3registration_descriptor编码:registration_descriptor可以在适当的时候使用。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南4.1.8.4data_stream_alignment-descriptor编码:data_stream_alignment-descriptor可以在适当的时候使用。解码:解码无须使用该描述符。4.1.8.5target_background_grid_descriptor编码:水平或垂直分辨率不是720×576时,要使用target_background_grid_descriptor,否则它是可选的。解码:如果该描述符不出现,栅格缺省值为720×576。对于SDTV解码器,在非720×576像素栅格背景上显示正确的窗口视频是可选的。在该描述符存在时,HDTV解码器应读出该描述符并覆盖缺省值。4.1.8.6video_window_descriptor编码:video_window_descriptor可以在适当的时候使用,以标出视频窗口在屏幕上要求的位置。解码:在该描述符出现时,解码器应读出该描述符,并定位视频窗口。4.1.8.7条件接收CA_descriptor编码:CA_descriptor要按照GY/Z175-2001来编码。解码:解码器要按照GY/Z175-2001对该描述符的定义来解释。4.1.8.8ISO_639_Language_descriptor编码:如果一个节目中出现了多个使用不同语言的音频(视频)流,应使用ISO_639_Language_descriptor,否则它是可选的。建议对于所有的音频、视频和码流使用ISO_639_Language_descriptor。解码:如果有多个流存在,解码器要利用该描述符的数据帮助从节目中选择需要的音频(视频)流。4.1.8.9system_clock_descriptor编码:建议在每个节目的PMT中的program_info部分包含system_clock_descriptor。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南解码:解码无须该描述符。4.1.8.10multiplex_buffer_utilization_descriptor编码:multiplex_buffer_utilization_descriptor可以适当使用。解码:解码无须该描述符。4.1.8.11copyright_descriptor编码:copyright_descriptor可以适当使用。解码:解码无须该描述符。4.1.8.12maximum_bitrate_descriptor编码:maximum_bitrate_descriptor可以适当使用。解码:解码无须该描述符。4.1.8.13STD_descriptor编码:STD_descriptor可以适当使用。解码:解码无须该描述符。4.1.8.14IBP_descriptor编码:IBP_descriptor可以适当使用。解码:解码无须该描述符。4.1.8.15smoothing_buffer_descriptor编码:。建议在每个节目的PMT的program_info部分包含smoothing_buffer_descriptor解码:解码利用该描述符,但该信息可能对数字VCR应用有帮助。4.1.9与GB/T17191.1-1997(GB/T17975.1-2000第2.8节)的兼容性解码:与GB/T17191.1-1997的兼容性是可选的。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南4.1.10存储媒体交互操作性对于用户录制的SDTV业务,建议组件、相关的PMT和PCR包的总码率不超过bit/s;对于HDTV业务,建议总码率不超过bit/s。建议smoothing_buffer_descriptor中sb_size和sb_leak_rate的值在一个事件的持续时间段内保持不变。sb_leak_rate的值应该是该事件持续时间段内所获得的峰值。GY/Z174-2001定义smoothing_buffer_descriptor。4.2来自存储应用和数字接口的码流本节包括了对于外部节目选择形成的部分传送流,以及对于从存储设备接收到的特技播放信息的处理方法。PSI和SI在存储应用中的特殊使用方法见GY/Z174-2001。4.2.1部分传送流IECCD–100C/1883为数字接口间的传输定义了部分传送流。从一个或多个节目中选择TS包,以及PSI包,生成部分传送流。编码:部分传送流必须与“系统解码器实时接口的扩展”(“ExtensionforReal-Time-Interfaceforsystemdecoders”,ISO/IEC13818-9)完全兼容。解码:由于部分传送流的TS包之间的间隔是变长的,所以用于数字VCR应用的具有数字接口的设备要能够接受部分传送流的突发特性。4.2.2特技播放数据的解码(GB/T17975.1-2000第2.4.3.7节)编码:特技模式的操作要通过视频PES包头中的DSM_trick_mode标志位来标识。在特技模式回放期间,存储设备要生成句法和语意都正确的码流,除非以下的“注意”部分概括的情况。解码:建议设备要对DSM_trick_mode_flag和8比特特技模式字段解码。对特技模式数据解码的设备要遵循GB/T17975.1-2000、GB/T17975.2-2000中详细规定的对于trick_mode_control字段所有值的一致性要求。注意:特技模式的句法限制。在特技模式过程中传输给解码器的码流要符合GB/T17975定义的句法。但是,以下的视频句法元素在DSM_trick_mode字段出现的时候句法有例外:· field;· bit_rate;· vbv_delay;· repeat_first_field;· v_axis_positive;· field_sequence;151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南· subcarrier;· burst_amplitude;· subcarrier_phase。在特技模式中,解码器不能根据这些字段的编码值工作。类似的,对于系统层,以下句法在DSM_trick_mode字段出现的时候也有例外:· PSI信息的最大间隔可以超过400毫秒;· PTS或DTS的重复间隔可以超过700毫秒;· PES包可以没有视频数据来说明特技模式字节发生变化;· 没有视频数据的PES包可能包含指示新的特技模式控制的有效显示时间的PTS;· 当trick_mode为“真”时,T-STD的基本流缓存可能已下溢。5视频本章是关于数字电视广播码流中视频编码和解码器码流解码的实施指南。5.1节适用于SDTV解码以及用此类解码器接收的广播。5.2节适用于HDTV解码以及用此类解码器接收的广播。视频编码应遵循GB/T17975.2-2000。一些参数和字段在数字电视广播中并没有使用,下面说明这些限制。解码器的设计必须基于这样一个假设:任何GB/T17975.2-2000所允许的合法结构都可能在广播流中出现,即使现在未使用或保留。为了提供对GB/T17975.1-2000的完全兼容以及对未来增强版本的向上兼容,数字电视广播解码器要能跳过那些目前设为“保留”、或者其对应功能并非由解码器实现的数据结构。本章基于GB/T17975.2-2000。5.1SDTV码流和解码5.1.1型和类编码:编码码流要遵循GB/T17975.2-2000第8.2节对MP@ML的限制。Profile_and_level_indication为“”,或者型和级表示为“0nnnnnnn”。此处,“0nnnnnnn”>“”,表明比主型、主级简单的型、类。解码:SDTV解码要支持MP@ML码流的解码。对主型、主类以外的型和类的支持是可选的。如果解码器遇到不能解码的扩展,比如其标识码是保留的、图像序列可分级的、图像空间可分级的或图像时间可分级的,解码器应跳过后面的数据直到下一个开始码出现(以允许未来加入后向兼容扩展)。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南5.1.2帧频编码:帧频应为25Hz,也就是frame_rate_code为“0011”。可以利用由内编码图像构成的视频序列对静止图像进行编码(见GB/T17975.1-2000第2.1.48节对静止图像的定义)。解码:SDTV解码要支持帧频为25Hz的隔行视频图像的解码和显示(也就是frame_rate_code为“0011”),对于其它的帧频和场频的支持是可选的。SDTV解码要能够支持静止图像的解码和显示,也就是由内编码图像构成的视频序列。5.1.3幅型比编码:SDTV码流中的信源幅型比是4:3或16:9。SDTV解码支持4:3和16:9幅型比。序列头中aspect_ration_information的取值应为下面两个中的一个:4:3幅型比的信源:“0010”16:9幅型比的信源:“0011”建议在源幅型比为16:9时,4:3窗口的平移矢量要包含在传送的码流中。所传送的平移矢量的垂直分量应该是0。如果传送了平移矢量,码流中就应该有sequence_display_extension,而且aspect_ration_information要置为“0010”(4:3显示)。display_vertical_size应该等于vertical_size。display_horizontal_size要包含目标4:3显示的分辨率。display_horizontal_size字段的值可以按照下面等式计算:表3给出了一些典型的例子。表3display_horizontal_size的值horizontal_size×vertical_sizesource_aspect_ratiodisplay_horizontal_size720×57616:9540544×57616:9408480×57616:9360352×57616:9264352×28816:9264解码:SDTV解码要能够对aspect_ratio_information为“0010”和“0011”,依次对应4:3和16:9的幅型比的码流解码。如果解码器有数字接口,它就应该可以输出幅型比不被此IRD支持的码流,以使其通过外部单元来解码和显示。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南SDTV解码都要支持平移矢量和上采样的使用,以便4:3的监视器把16:9的图像中的所选部分以正确的幅型比全屏显示出来。支持具有非零垂直分量的平移矢量是可选的。在传送码流中没有平移矢量时,要显示宽银幕图像的中心部分。利用垂直再采样得到在4:3监视器上以信箱方式显示16:9编码图像的正确幅型比,对此支持是可选的。5.1.4亮度分辨率编码:编码图像的全屏亮度分辨率只能是下列数值之一:720×576;544×576;480×576;352×576;352×288。此外,非全屏图像的编码是为了以非全屏的大小来显示图像(解码器中使用一个制式上变换比例系数)。解码:SDTV解码要能够对具有表4中亮度分辨率的图像进行解码,并且利用上采样使解码的图像能以全屏尺寸显示。此外,解码器要能够对较低分辨率的图像解码,并通过一个制式上变换以非全屏显示。比如,水平分辨率为704像素的图像在720像素的全屏上显示。表4全屏显示的分辨率编码图像显示图像水平上变换亮度分辨率(水平×垂直)幅型比4:3监视器16:9监视器720×5764:316:9×1×4/3(见注2)×3/4(见注1)×1544×5764:316:9×4/3×16/9(见注2)×1×4/3480×5764:316:9×3/2×2(见注2)×9/8(见注1)×3/2352×5764:316:9×2×8/3(见注2)×3/2(见注1)×2352×2884:316:9×2×8/3(并且垂直上采样×2)×3/2(见注1)×2(并且垂直上采样×2)注1:将4:3图像上采样以便在16:9监视器上显示是可选的,因为16:9监视器可以切换成工作在4:3状态。注2:以此值对16:9图像的像素进行上采样是为了在4:3监视器上显示。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南5.1.5色度参数编码:建议在码流中通过sequence_display_extension()中的3个参数colour_primaries、transfer_characteristics和matrix_coefficients来依次清晰标明理想显示的色度坐标、理想显示的光电转换特性、以及将红、绿、蓝基色转换成亮度和色度信号的矩阵系数。在SDTV码流中,如果不存在sequence_display_extension,或者colour_primaries为0,那么色度就对应于colour_primaries为5时的数值,转换特性对应于transfer_characteristics为5时的数值,矩阵系数对应于matrix_coefficients为5时的数值。有关参数值应遵循GB3174-1995。5.1.6色度编码:从4:2:2到4:2:0色度信息下采样操作应由图像编码扩展中的参数chroma_420_type来指示。值为0表明这些场独立地完成了下采样,值为1表明在下采样之前两场合为一帧。建议使用场独立下采样(即chroma_420_type=0),以使解码器在图像重建过程中使用较少的内存。解码:从4:2:0到4:2:2的上采样操作应依据图像编码扩展中的参数chroma_420_type。5.1.7视频序列数据头编码:建议视频序列头,其后面就是I帧,至少每500毫秒要编码一次。如果量化矩阵使用了缺省值以外的数值,建议在每个序列头中都要有适宜的intra_quantizer_matrix和non_intra_quantizer_matrix。注1:增加视频序列头和I帧的出现频率会减少频道的切换时间,但会降低视频压缩的效率。注2:I帧之间保持正常的时间间隔可以提高特技模式的性能,但是会减少视频压缩的效率。5.2HDTV码流和解码5.2.1型和级编码:编码的HDTV码流要遵循GB/T17975.2-2000第8.2节对MP@HL规定的限制。Profile_and_level_indication为“”,或者型和级表示为“0nnnnnnn”。此处,“0nnnnnnn”>“”,表明比主型、高级简单的型或类。解码:151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南HDTV解码要支持MP@HL的解码。这个要求包括对于“更简单”的型和级的支持,包括MP@ML在内。对于主型、高级之上的型或级的支持是可选的。如果IRD遇到不能解码的扩展,比如标识码是保留的、图像序列可分级的、图像空间可分级的或图像时间可分级的,解码应跳过后面的数据直到下一个开始码出现(以允许未来加入后向兼容扩展)。5.2.2帧频编码:帧频应为25Hz或者50Hz,也就是frame_rate_code为“0011”或“0110”。50Hz帧频的源视频格式为逐行扫描,25Hz帧频的源视频格式可以是逐行扫描,也可以是隔行扫描。利用全部由内编码图像构成的视频序列(见GB/T17975.2-2000第2.1.48节对静止图像的定义),对静止图像进行编码。解码:所有的HDTV解码要支持MP@HL限定范围内的25Hz逐行、25Hz隔行、或者50Hz逐行扫描(也就是frame_rate_code为“0011”和“0110”)的视频图像的解码和显示。对其它帧频和场频的支持是可选的。HDTV解码要能够支持静止图像的解码和显示,即全部由内编码图像构成的视频序列。5.2.3幅型比编码:HDTV码流的信源幅型比是16:9。序列头中aspect_ratio_information的值应为“0011”。解码:HDTV解码要能够对aspect_ratio_information为“0011”,对应16:9幅型比的码流进行解码。如果解码器有数字接口,它就应该可以输出幅型比不被此解码器支持的流,以使其通过外部单元来解码和显示。5.2.4亮度分辨率编码:编码的图像要具有MP@HL所限定的全屏亮度分辨率,也就是说它不可能超过:每帧1152行;每条扫描线1920个亮度采样;每秒个亮度采样。建议HDTV码流的源图像具有如下亮度分辨率:151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南每帧1080行,每行1920个亮度样点,帧频为25Hz,每帧包括两个隔行扫描的场。源图像在编码前可以进行、也可以不进行下采样。也允许使用MP@HL规定的其它视频编码分辨率。注1:MP@HL中每秒个亮度采样的限制排除了在50Hz帧频下使用最大允许的图像分辨率的可能。注2:如果建议的源图像格式不采用下采样编码,那么它每秒会有个亮度采样,因此就进入了MP@HL所允许的范围之内。解码:HDTV解码要能够对MP@HL限定的亮度分辨率进行解码和显示。5.2.5色度参数编码:在HDTV码流中通过sequence_display_extension()中的3个参数colour_primaries、transfer_characteristics和matrix_coefficients来依次清晰表明理想显示的色度坐标、理想显示的光电转换特性、以及将红、绿、蓝基色转换成亮度和色度信号的矩阵系数。建议在HDTV码流中使用GY/T155-2000色度,通过把colour_primaries、transfer_characteristics和matrix_coefficients的值都置为1来标明。解码:HDTV解码应能够对具有colour_primarie,transfer_characterstics和matrix_coefficient任何允许值的码流进行解码。5.2.6色度编码:色度信息4:2:2到4:2:0的下采样操作由图像编码扩展中的参数chroma_420_type来标明。值为0表明这些场独立地完成下采样,值为1表明在下采样之前两场已经合一帧。希望使用场独立下采样(也就是chroma_420_type=0),以使解码器在图像重建中会使用较少的内存。解码:4:2:0到4:2:2上采样操作要依赖于图像编码扩展中的参数chroma_420_type。5.2.7视频序列头编码:建议视频序列数据头,其后是I帧,至少每500毫秒要编码一次。如果量化矩阵使用了缺省值以外的数值,建议在每个序列数据头中都要适宜的intra_quantizer_matrix和non_intra_quantizer_matrix。注1:增加视频序列头和I帧的出现频率会减少频道的切换时间,但是会降低视频压缩的效率。注2:I帧之间保持正常的时间间隔可以提高特技模式的性能,但是会减少视频压缩的效率。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南5.2.8后向兼容性解码:除了以上的内容以外,HDTV解码要能对SDTV码流进行解码。6音频本章说明在数字电视广播中的音频编码和解码。根据EBUR.68建议,建议传输的基准声音电平比削波电平低18dB。音频编码应符合GB/T17191.3-1997或GB/T17975.3-2002,除非要求解码器支持其它音频编码标准。GB/T17191.3-1997和GB/T17975.3-2002中的某些参数和字段在数字电视广播系统中没有使用,这些限制在下面说明。解码器设计应在这样的假设的情况进行,即假设任何GB/T17191.3-1997或GB/T17975.3-2002允许的合法结构都会出现在广播流中,即使目前保留的或不使用的。为了能够完全依从GB/T17191.3-1997和GB/T17975.3-2002,并与未来的增强版兼容,数字电视广播IRD应能够跳过目前“保留”的结构,或者响应为解码器未实现功能。例如,设计不使用辅助数据字段的解码器应跳过这部分码流。本章基于GB/T17191.3-1997和GB/T17975.3-2002。6.1音频模式编码:音频应按照下列模式之一进行编码:· GB/T17191.3-1997单声道;· GB/T17191.3-1997双声道;· GB/T17191.3-1997联合立体声;· GB/T17191.3-1997立体声;· GB/T17975.3-2002多声道音频(可选),与GB/T17191.3-1997后向兼容(dematrixprocedure=0,1,2);· 其它音频编码模式(可选)。在使用两声道及以上编码模式时,各声道的音频信号必须属于同一业务。对于同一业务使用不同语言音频的情况,各语言音频要使用不同PID的基本流。解码:解码器应能够对下列音频模式解码:· GB/T17191.3-1997单声道;· GB/T17191.3-1997双声道;· GB/T17191.3-1997联合立体声;· GB/T17191.3-1997立体声。对GB/T17975.3-2002多声道音频码流的解码是可选的。对其它音频编码码流的解码是可选的。151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南6.2层编码:GB/T17191.3-1997编码码流应使用层I和层II编码(layer=“11”或“10”)。GB/T17975.3-2002多声道编码码流应使用层II编码(layer=“10”)。解码:解码器应能够对层I和层II进行解码。6.3比特率编码:码流中bitrate_index的值是"0001"至"1110"(含)14个值中的一个。对于层I,相应的比特率为:32、64、96、128、160、192、224、288、320、352、384、416、448kb/s。对于层II,相应的比特率为:32、64、96、128、160、192、224、288、320、352、384、416、448kb/s。对于总比特率大于384kb/s的GB/T17975.3-2002编码码流,应使用扩展码流。扩展码流的比特率在0至682kb/s之间。解码:IRD应能够对bitrate_index值为"0001"到"1110"(含)的码流进行解码。支持自由格式比特率(bitrate_index=“0000”)是可选的。6.4取样频率编码:主声音业务的音频取样率是32kHz、44.1kHz、48kHz。取样率16kHz,、22.05kHz、24kHz、32kHz、44.1kHz、48kHz用于副声音业务。解码:解码器应能够对32kHz、44.1kHz、48kHz取样率的音频进行解码。支持16kHz,、22.05kHz、24kHz取样率是可选的。6.5加重编码:编码码流不应该加重(emphasis=“00”)。解码:解码器应能够对没有加重的音频进行解码。支持50/15ms去加重和ITU-TJ.17去加重(emphasis=“01”或“11”)是可选的。6.6循环冗余码编码:151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南在编码码流中应有奇偶校验字(crc_check)。解码:建议解码器利用crc_check检测误码,以及调用适当的掩盖或静音机制。6.7预测编码:GB/T17975.3-2002多声道编码码流不使用mc_prediction(mc_prediction_on=“0”)。解码:IRD应能够对不使用mc_prediction的GB/T17975.3-2002多声道编码码流进行解码。6.8扩展流编码:当GB/T17975.3-2002编码码流使用扩展流时,建议在节目期间扩展帧的连续码流是持续的,即使小于384kb/s的总比特率足以编码成帧。这防止音频解码器出现不希望的重新设置。6.9辅助数据编码:GB/T17975.3-2002编码码流包含辅助数据字段。该辅助数据字段由一个或多个数据字段组成,如图1所示。辅助数据帧头音频填充‥‥‥数据域2数据域1音频帧图1辅助数据字段的使用数据字段的插入必须从音频帧的尾部开始。在两个数据字段之间不允许有间隔。立体声或多声道编码码流可以包含视频DVD或扩展辅助数据字段。建议把该数据放在码流中。为了防止音频比例因子误码,特别在移动环境,辅助数据字段可以嵌入一个比例因子CRC。如果使用依从视频DVD、扩展辅助数据的数据字段,或者依从DAB规范的辅助数据。为了后向兼容的原因,它们必须是音频帧的最后一个数据字段,即图1中的数据域1。这意味者不能一起使用DVD和DAB数据。解码:151\n运动图像及其伴音信号的通用编码系统、视频和音频部分的实施指南解码器可以解释GB/T17975.3-2002码流中的辅助数据字段。151

相关文档