MPEG-4

MPEG-4 é um grupo de padrões internacionais para compressão de áudio digital e dados visuais, sistemas multimídia e formatos de armazenamento de arquivos. Foi originalmente introduzido no final de 1998 como um grupo de formatos de codificação de áudio e vídeo e tecnologias relacionadas acordadas pelo ISO/IEC Moving Picture Experts Group (MPEG) (ISO/IEC JTC 1 /SC29/WG11) sob o padrão formal ISO/IEC 14496 – Codificação de objetos audiovisuais. Os usos do MPEG-4 incluem compactação de dados audiovisuais para vídeo na Internet e distribuição de CD, voz (telefone, videofone) e aplicações de televisão aberta. O padrão MPEG-4 foi desenvolvido por um grupo liderado por Touradj Ebrahimi (mais tarde presidente do JPEG) e Fernando Pereira.[1]

Background

O MPEG-4 absorve muitos dos recursos do MPEG-1 e MPEG-2 e outros padrões relacionados, adicionando novos recursos, como suporte VRML (estendido) para renderização 3D, arquivos compostos orientados a objetos (incluindo objetos de áudio, vídeo e VRML), suporte para gerenciamento de direitos digitais especificado externamente e vários tipos de interatividade. O AAC (Advanced Audio Coding) foi padronizado como um complemento do MPEG-2 (como Part 1) antes que o MPEG-4 fosse lançado.

O MPEG-4 ainda é um padrão em evolução e está dividido em várias partes. As empresas que promovem a compatibilidade com MPEG-4 nem sempre declaram claramente a que nível de compatibilidade de "parte" se referem. As principais partes a serem observadas são MPEG-4 Part 2 (incluindo Advanced Simple Profile, usado por codecs como DivX, Xvid, Nero Digital e 3ivx e pelo QuickTime 6) e MPEG-4 parte 10 (MPEG-4 AVC/H .264 ou Advanced Video Coding, usado pelo codificador x264, Nero Digital AVC, QuickTime 7 e mídia de vídeo de alta definição como Blu-ray Disc).

A maioria dos recursos incluídos no MPEG-4 são deixados para desenvolvedores individuais decidirem se implementam ou não. Isso significa que provavelmente não há implementações completas de todo o conjunto de padrões MPEG-4. Para lidar com isso, o padrão inclui o conceito de "perfis" e "níveis", permitindo que um conjunto específico de capacidades seja definido de forma apropriada para um subconjunto de aplicações.

Inicialmente, o MPEG-4 destinava-se principalmente a comunicações de vídeo de baixa taxa de bits; no entanto, seu escopo como padrão de codificação multimídia foi posteriormente expandido. O MPEG-4 é eficiente em uma variedade de taxas de bits, variando de alguns kilobits por segundo a dezenas de megabits por segundo. O MPEG-4 oferece as seguintes funções:

  • Eficiência de codificação melhorada em MPEG-2[2]
  • Capacidade de codificar dados de mídia mista (vídeo, áudio, fala)
  • Resiliência a erros para permitir uma transmissão robusta
  • Capacidade de interagir com a cena audiovisual gerada no receptor

Visão geral

O MPEG-4 fornece uma série de tecnologias para desenvolvedores, para vários provedores de serviços e para usuários finais:

  • O MPEG-4 permite que diferentes desenvolvedores de software e hardware criem objetos multimídia com melhores habilidades de adaptabilidade e flexibilidade para melhorar a qualidade de serviços e tecnologias como televisão digital, gráficos de animação, World Wide Web e suas extensões.
  • Provedores de rede de dados podem usar MPEG-4 para transparência de dados. Com a ajuda de procedimentos padrão, os dados MPEG-4 podem ser interpretados e transformados em outros tipos de sinais compatíveis com qualquer rede disponível.
  • O formato MPEG-4 oferece aos usuários finais uma ampla gama de interação com vários objetos animados.
  • Sinalização padronizada de gerenciamento de direitos digitais, também conhecida na comunidade MPEG como gerenciamento e proteção de propriedade intelectual (IPMP).

O formato MPEG-4 pode executar várias funções, entre as quais podem ser as seguintes:

  • Multiplexação e sincronização de dados, associados a objetos de mídia, de forma que eles possam ser transportados de forma eficiente através de canais de rede.
  • Interação com a cena audiovisual, que se forma na lateral do receptor.

Perfis e Níveis

O MPEG-4 fornece um amplo e rico conjunto de ferramentas para codificação. Subconjuntos dos conjuntos de ferramentas MPEG-4 foram fornecidos para uso em aplicações específicas. Esses subconjuntos, chamados de 'Perfis', limitam o tamanho do conjunto de ferramentas que um decodificador deve implementar.[3] A fim de restringir a complexidade computacional, um ou mais 'níveis' são definidos para cada perfil.[3] Uma combinação de Perfil e Nível permite:[3]

  • Um construtor de codecs para implementar apenas o subconjunto do padrão necessário, mantendo a interoperabilidade com outros dispositivos MPEG-4 que implementam a mesma combinação.[3]
  • Verificar se os dispositivos MPEG-4 estão em conformidade com o padrão, conhecido como teste de conformidade.[3]

MPEG-4 Parts

O MPEG-4 consiste em vários padrões - denominados "partes" - incluindo os seguintes (cada parte cobre um certo aspecto de toda a especificação):

Parts MPEG-4[4][5]
PartNúmeroPrimeira data de lançamento público (primeira edição)Última data de lançamento público (última edição)Última alteraçãoTítuloDescrição
Part 1ISO/IEC 14496-119992010[6]2014[7]SystemsDescreve a sincronização e multiplexação de vídeo e áudio. Por exemplo, o formato de arquivo MPEG-4 versão 1 (obsoleto pela versão 2 definida em MPEG-4 Parte 14). A funcionalidade de uma pilha de protocolos de transporte para transmitir e/ou armazenar conteúdo em conformidade com a ISO/IEC 14496 não está dentro do escopo de 14496-1 e apenas a interface para esta camada é considerada (DMIF). As informações sobre o transporte de conteúdo MPEG-4 são definidas, por exemplo, em MPEG-2 Transport Stream, RTP Audio Video Profiles e outros.[8][9][10][11][12]
Part 2ISO/IEC 14496-219992004[13]2009VisualUm formato de compressão para dados visuais (vídeo, texturas estáticas, imagens sintéticas, etc.). Um dos muitos "perfis" na Part 2 é o Advanced Simple Profile (ASP).
Part 3ISO/IEC 14496-319992009[14]2017[15]AudioUm conjunto de formatos de compressão para codificação perceptiva de sinais de áudio, incluindo algumas variações de Advanced Audio Coding (AAC), bem como outros formatos e ferramentas de codificação de áudio/fala (como Audio Lossless Coding (ALS), Scalable Lossless Coding (SLS), Áudio Estruturado, Text-To-Speech Interface (TTSI), HVXC, CELP e outros)
Part 4ISO/IEC 14496-420002004[16]2016Teste de conformidadeDescreve os procedimentos para testar a conformidade com outras partes do padrão.
Part 5ISO/IEC 14496-520002001[17]2017software de referênciaFornece software de referência para demonstrar e esclarecer as outras partes do padrão.
Part 6ISO/IEC 14496-619992000[18]Delivery Multimedia Integration Framework (DMIF)
Part 7ISO/IEC TR 14496-720022004[19]Software de referência otimizado para codificação de objetos audiovisuaisFornece exemplos de como fazer implementações aprimoradas (por exemplo, em relação à Part 5).
Part 8ISO/IEC 14496-820042004[20]Transporte de conteúdo ISO/IEC 14496 em redes IPEspecifica um método para transportar conteúdo MPEG-4 em redes IP. Ele também inclui diretrizes para projetar formatos de carga útil RTP, regras de uso do SDP para transportar informações relacionadas ao ISO/IEC 14496-1, definições de tipo MIME, análise de segurança RTP e multicasting.
Part 9ISO/IEC TR 14496-920042009[21]Descrição do hardware de referênciaFornece projetos de hardware para demonstrar como implementar as outras partes do padrão.
Part 10ISO/IEC 14496-1020032014[22]2016[23]Advanced Video Coding (AVC)Um formato de compressão para sinais de vídeo que é tecnicamente idêntico ao padrão ITU-T H.264.
Part 11ISO/IEC 14496-1120052015[24]Descrição da cena e motor de aplicaçãoPode ser usado para conteúdo rico e interativo com vários perfis, incluindo versões 2D e 3D. MPEG-4 Part 11 MPEG-4 Part 1 revisado - ISO/IEC 14496-1:2001 e duas emendas ao MPEG-4 Part 1. Ele descreve uma descrição em nível de sistema de um mecanismo de aplicativo (entrega, ciclo de vida, formato e comportamento de Java byte code applications) e o Binary Format for Scene (BIFS) e o Extensible MPEG-4 Textual (XMT) – uma representação textual do conteúdo multimídia MPEG-4 usando XML, etc.[24] (Também é conhecido como BIFS, XMT, MPEG-J.[25] MPEG-J foi definido em MPEG-4 Part 21)
Part 12ISO/IEC 14496-1220042015[26]2017[27]Formato de arquivo de mídia de base ISOUm formato de arquivo para armazenar conteúdo de mídia baseado em tempo. É um formato geral que forma a base para vários outros formatos de arquivo mais específicos (por exemplo, 3GP, Motion JPEG 2000, MPEG-4 Part 14). É tecnicamente idêntico ao ISO/IEC 15444-12 (sistema de codificação de imagem JPEG 2000 – Part 12).
Part 13ISO/IEC 14496-1320042004[28]Extensões de proteção e gerenciamento de propriedade intelectual (IPMP)MPEG-4 Parte 13 revisou uma emenda ao MPEG-4 Parte 1 – ISO/IEC 14496-1:2001/Amd 3:2004. Ele especifica processamento, sintaxe e semântica comuns de gerenciamento e proteção de propriedade intelectual (IPMP) para o transporte de ferramentas IPMP no fluxo de bits, transporte de informações IPMP, autenticação mútua para ferramentas IPMP, uma lista de autoridades de registro necessárias para o suporte das especificações alteradas (por exemplo, CISAC), etc. Foi definido devido à falta de interoperabilidade de diferentes mecanismos de proteção (diferentes sistemas DRM) para proteção e distribuição de conteúdo digital protegido por direitos autorais, como música ou vídeo.[29][30][31][32][33][34][35]
Part 14ISO/IEC 14496-1420032003[36]2010[37]MP4 file formatTambém é conhecido como "formato de arquivo MPEG-4 versão 2". O formato de arquivo contêiner designado para conteúdo MPEG-4, que é baseado na Parte 12. Ele revisa e substitui completamente a Cláusula 13 da ISO/IEC 14496-1 (MPEG-4 Part 1: Sistemas), na qual o formato de arquivo MPEG-4 foi previamente especificado.
Part 15ISO/IEC 14496-1520042017[38]2020[39]Part 15: Transporte de vídeo estruturado de unidade de camada de abstração de rede (NAL) no formato de arquivo de mídia de base ISOPara armazenamento do vídeo da Part 10. O formato do arquivo é baseado na Part 12, mas também permite o armazenamento em outros formatos de arquivo.
Part 16ISO/IEC 14496-1620042011[40]2016[41]Animation Framework eXtension (AFX)Ele especifica o modelo MPEG-4 Animation Framework eXtension (AFX) para representar o conteúdo de gráficos 3D. O MPEG-4 é estendido com objetos sintéticos de alto nível para especificar geometria, textura, animação e algoritmos de compressão dedicados.
Part 17ISO/IEC 14496-1720062006[42]Streaming text formatFormato de legenda de texto cronometrado
Part 18ISO/IEC 14496-1820042004[43]2014Compressão e streaming de fontesPara Open Font Format definido na Part 22.
Part 19ISO/IEC 14496-1920042004[44]Synthesized texture streamOs fluxos de textura sintetizada são usados ​​para a criação de videoclipes sintéticos de taxa de bits muito baixa.
Part 20ISO/IEC 14496-2020062008[45]2010Lightweight Application Scene Representation (LASeR) and Simple Aggregation Format (SAF)Os requisitos do LASeR (eficiência de compactação, código e área de memória) são atendidos com base no formato Scalable Vector Graphics (SVG) existente definido pelo World Wide Web Consortium.[46]
Part 21ISO/IEC 14496-2120062006[47]MPEG-J Graphics Framework eXtensions (GFX)Descreve um ambiente programático leve para aplicativos multimídia interativos avançados – uma estrutura que combina um subconjunto do ambiente de aplicativo Java padrão MPEG (MPEG-J) com uma API Java.[25][47][48][49] (no estágio "FCD" em julho de 2005, FDIS em janeiro de 2006, publicado como padrão ISO em 22/11/2006).
Part 22ISO/IEC 14496-2220072015[50]2017Open Font FormatOFFS é baseado na especificação de formato de fonte OpenType versão 1.4 e é tecnicamente equivalente a essa especificação.[51] Atingiu o estágio "CD" em julho de 2005, publicado como padrão ISO em 2007
Part 23ISO/IEC 14496-2320082008[52]Symbolic Music Representation (SMR)Atingiu o estágio "FCD" em outubro de 2006, publicado como padrão ISO em 28/01/2008
Part 24ISO/IEC TR 14496-2420082008[53]Interação de áudio e sistemasDescreve o comportamento conjunto desejado do formato de arquivo MPEG-4 e do áudio MPEG-4.
Part 25ISO/IEC 14496-2520092011[54]Modelo de compressão de gráficos 3DDefine um modelo para conectar ferramentas de Compressão de Gráficos 3D definidas nos padrões MPEG-4 a primitivas gráficas definidas em qualquer outro padrão ou especificação.
Part 26ISO/IEC 14496-2620102010[55]2016Conformidade de áudio
Part 27ISO/IEC 14496-2720092009[56]2015[57]3D Graphics conformanceA Conformidade de Gráficos 3D resume os requisitos, faz referências cruzadas com as características e define como a conformidade com eles pode ser testada. Orientações são dadas na construção de testes para verificar a conformidade do decodificador.
Part 28ISO/IEC 14496-2820122012[58]Representação de fonte composta
Part 29ISO/IEC 14496-2920142015Web video codingO texto da Part 29 é derivado da Part 10 - ISO/IEC 14496-10. A codificação de vídeo da Web é uma tecnologia compatível com o perfil de linha de base restrita da ISO/IEC 14496-10 (o subconjunto especificado no Anexo A para linha de base restrita é uma especificação normativa, enquanto todas as partes restantes são informativas).
Part 30ISO/IEC 14496-3020142014Texto cronometrado e outras sobreposições visuais no formato de arquivo de mídia de base ISOEle descreve o transporte de algumas formas de texto cronometrado e fluxos de legendas em arquivos baseados em ISO/IEC 14496-12 - W3C Timed Text Markup Language 1.0, W3C WebVTT (Web Video Text Tracks). A documentação desses formulários não exclui outra definição de transporte de texto cronometrado ou legendas; consulte, por exemplo, 3GPP Timed Text (3GPP TS 26.245).
Part 31ISO/IEC 14496-31Em desenvolvimento (2018-05)Video Coding for BrowsersVideo Coding for Browsers (VCB) - uma tecnologia de compactação de vídeo destinada ao uso no navegador da World Wide Web
Part 32ISO/IEC CD 14496-32Em desenvolvimentoSoftware de conformidade e referência
Part 33ISO/IEC FDIS 14496-33Em desenvolvimentoInternet video coding

Os perfis também são definidos dentro das "partes" individuais, portanto, uma implementação de uma parte normalmente não é uma implementação de uma parte inteira.

MPEG-1, MPEG-2, MPEG-7 e MPEG-21 são outros conjuntos de padrões MPEG.

MPEG-4 Levels

Os níveis de baixo perfil fazem parte das restrições de codificação/decodificação de vídeo MPEG-4 e são compatíveis com o antigo padrão ITU H.261, também compatível com os antigos padrões de TV analógica para transmissão e gravação (como vídeo NTSC ou PAL). O perfil ASP em seu nível mais alto é adequado para a maioria das mídias e reprodutores de DVD comuns ou para muitos sites de vídeo online, mas não para discos Blu-ray ou conteúdos de vídeo HD online.

PerfilLevelMax.
buffer
Max.
bitrate
Max.
delay
Max.
tamanho
VP
Max.
tamanho
VOP
Taxa
máxima do
decodificador
Max. framesize
@ max.
bitrate
@ 30 Hz@ 25 Hz@ 24 Hz@ 15 Hz@ 12.5 Hz
SPL0160642.502,048991,485QCIF (176×144)
L0b320128
L116064128×96144×96160×96
L26401285.004,0963965,940256×192304×192, 288×208304×208CIF (352×288)
L33841.668,19211,880CIF (352×288)
L4a1,2804,0000.3216,3841,20036,000VGA (640×480)
L51,7928,0000.221,62040,500D1 NTSC (720×480)D1 PAL (720×576)
L63,96812,0000.333,600108,000720p (1280x720)
ASPL01601281.252,048992,970QCIF (176×144)
L1
L26403841.664,0963965,940256×192304×192, 288×208304×208CIF (352×288)
L37680.8611,880CIF (352×288)
L3b1,0401,5000.69
L41,2803,0000.438,19279223,760352×576, 704×288
L51,7928,0000.2216,3841,62048,600720×576
Unidadeskbitskbits/ssegundosbitsmacroblocosmacroblocospixels

Perfis mais avançados para mídia HD foram definidos posteriormente no perfil AVC, que é funcionalmente idêntico ao padrão ITU H.264, mas agora também integrado ao MPEG-4 Part 10 (consulte H.264/MPEG-4 AVC para obter a lista de níveis definidos neste perfil AVC).

Licenciamento

O MPEG-4 contém tecnologias patenteadas, cujo uso requer licenciamento em países que reconhecem patentes de algoritmos de software. Mais de duas dúzias de empresas afirmam ter patentes que cobrem o MPEG-4. A MPEG LA[59] licencia as patentes necessárias para o MPEG-4 Part 2 Visual de uma ampla gama de empresas (o áudio é licenciado separadamente) e lista todos os seus licenciantes e licenciados no site. Novas licenças para patentes do Sistema MPEG-4 estão em desenvolvimento[60] e nenhuma nova licença está sendo oferecida enquanto os detentores de sua antiga licença do Sistema MPEG-4 ainda estiverem cobertos pelos termos dessa licença para as patentes listadas (MPEG LA – Lista de Patentes).

A maioria das patentes usadas para o formato MPEG-4 Visual são detidas por três empresas japonesas: Mitsubishi Electric (255 patentes), Hitachi (206 patentes) e Panasonic (200 patentes).

Ver também

Referências

Ligações externas