MPEGは新しいメディア・テクノロジーに対処できるか?

Leonardo Chiariglione, CEDEO.net
(MPEG) ISO/IEC JTC1/SC29/WG11議長

 

摘要

本書は、ほぼ20年にわたるMPEGの経緯を調べ、作成された規格によって示された業界の動向を明らかにして、現状を分析したものである。

1. 序

Moving Pictures Experts GroupMPEG)は、正式には、国際標準化機構(ISO)および国際電気標準会議(IEC)の第1合同技術委員会(JTC1)「情報技術」、専門部会29SC29)「音声、映像、マルチメディアおよびハイパーメディア情報のコーディング」の作業部会(WG1111「動画像と音声の符号化」を指している。

一般に作業部会は、具体的な技術的問題に対処するために専門部会が設立する。そして当該の問題が解決されると、通常その作業部会は解散される。

しかしMPEGの場合は違った。当時、専門部会2の作業部会8の専門家グループとして発足したMPEGは、次のような要旨のビジョンによって推進された:

2. 基本的な要素

2.1 MPEG-1

この規格は、デジタル技術がもたらす影響がまだ不明瞭な初期段階で考案されたものである。実際MPEG-1によって、「双方向性(interactivity)」という魔法の言葉とともにオーディオ/ビデオ(音声/画像)データに対処するための技術が初めて可能となった。

当時は、デジタル・オーディオ/ビデオを含んだデータは、必ずハードウェア――集積回路(IC)――実装の問題に直面にした。このためすべての決定は、ICの設計に及ぶと考えられる影響を考慮して検討された。

MPEG-1にとっての最も深刻な問題は、規格にもとづいたデジタル技術の実際の用途であった。MPEG-1オーディオ・レイヤ1を利用するために設計されたデジタル・コンパクト・カセット(DCC)は失敗作、MPEG-1オーディオ・レイヤ2を利用するために設計されたデジタル・オーディオ・ブロードキャスティング(DAB)はいまだに成功を見ず、MPEG-1技術一式を活用しようと開発されたコンパクト・ディスク・インタラクティブ(対話型コンパクト・ディスク=CD-i)も市場から撤退して久しい。

それでもMPEG-1そのものは健在である:ビデオCDではMPEG-1技術一式が、またMP3ではMPEG-1オーディオ・レイヤ3が利用されている。どちらも、今さら紹介するまでもない。

2.2. MPEG-2

ハードウェアが作動することが実証され、テレビをデジタル化するという長年の夢を実現することも可能となった。MPEG技術により、真の意味で普遍的なデジタル・ビデオ・フォーマットが定義された(よく知られているように、オーディオは、真の意味で普遍的なデジタル・テレビジョン・フォーマットには含まれていない)。

MPEG-2ビデオの開発には、つねにハードウェア実装という問題がつきまとった。1990年代初め、MPEG-1ビデオ・チップの設計は可能となったが、MPEG-2のチップは別問題だった。ハードウェア上の問題は、信号処理に関してだけでなく、解読された画像を保存するために必要なランダム・アクセス・メモリー(RAM)についても存在した。RAMの使用量を抑えるための特別なプロファイル(Simple)も開発されたが、ある程度の画質の低下は避けられなかった。

パテント(特許権)の重要性が高まると、これに関連した問題も浮上した。家庭用電化製品(CE)産業は、各々の規格において、独自の方法でパテントの問題に対処していた。ヒット製品の知的所有権は、最初にその製品を考案した企業に帰属するが、MPEGに関しては、MPEG-2ビデオの知的所有権を有する企業はごくわずかだった。長い年月が経過した後、パテント・プール管理者がMPEG-2規格の実施に関連していると判断した100件以上のパテントを処理するための最初のパテント・プールが形成された。ロイヤルティ・モデルは、既存のCE産業の慣行にしたがって定められた。MPEG-2ビデオで符号化されたコンテンツを含む装置およびデジタル多用途ディスク(DVD)一点ごとに、一定の金額が定められたのである。

2.3. MPEG-4

MPEG-4は、マルチメディア統一符号化規格として考案された。実際MPEG-4ビデオは、ビットレートおよびビデオ・フォーマットのすべてをカバーするように設計されており、MPEG-4オーディオは音楽と音声の両方を処理することが可能である。

またMPEG-4は、2D3Dグラフィック、人間の顔や身体、電子音楽など合成コンテンツも処理することができる。さらに、未加工の情報と合成情報を組み合わせたデータを処理するための強力な技術も備えている。

MPEG-4は、とくにビジュアル部分で幅広く拡張され、プロファイルも豊富である。アドバンスト・オーディオ・コーディング(AAC)の基本技術は、MPEG-4で継承・拡張され、数々の拡張子が存在する。

MPEG-4のトランスポートに関しては、MPEGコンテンツのトランスポート・メカニズムは開発されておらず、汎用インターフェースのみが存在する。ただし、汎用コンテンツのためのリアルタイム・プロトコル(RTP)のペイロードは開発し――無数の変遷を経た後にインターネット・エンジニアリング・タスク・フォース(IETF)から採択されている。

MPEG-4は、いくつかの点で革新的である。第一に、MPEG-4は、知的所有権の管理と保護(IPMP)システムを通じて知的所有権を完全に管理するための最初の例を提示した。

MPEG-4が実現した第二の革新は、ハードウェアをベースにした従来のオーディオ・ビジュアル産業と、ソフトウェアをベースにした新たなオーディオ・ビジュアル産業の集束であった。これにより、参照ソフトウェアは、なくても構わない単なる付加物から、テキスト形式にも劣らない正式なステータスの規格へと変貌した。またこの参照ソフトウェアの発展は、オープン・ソースの伝統にしたがって――独立したかたちで――符号化された。

MPEG-4による第三の革新は、パテントのライセンス供与であった。MPEG-2ビデオのライセンス供与は、セット・トップ・ボックス(STB)やDVDディスクなど、物理的な実体をベースにしているが、MPEG-4ビジュアルのライセンス供与形態では、単位時間当たりのコンテンツ利用料が請求される。

3. 新天地

3.1. MPEG-7

MPEG-1/-2/-4規格は、現在のようなデジタル・オーディオ/ビデオ産業を形作る過程でそれぞれの役割を果たしてきた。MPEG-7は、この産業を更に実質的なかたちに作り変えるための潜在力を秘めている。

コンテンツも重要だが、そのコンテンツが発見され、組織化されるためには、そのコンテンツの記述が更に重要である、というのが当然の注目点――私たちが検索エンジンを使ってweb上の情報を探すときの類語反復――である。

MPEG-7を考案するきっかけとなったのは、オーディオ/ビデオ符号化の標準形式がコンテンツの水平的市場を生み出したのであれば、オーディオ/ビデオによる記述の標準形式は記述の水平的市場を生み出すはずである、という認識であった。

必要な規格技術は、すべて開発されている。ビジュアルによる記述も、オーディオ、マルチメディアによる記述も存在する。MPEG-7記述定義言語(DDL)を利用してマルチメディア・コンテンツ記述スキーム(MDS)を定義することも可能である。

MPEG-7というビジョンには、まだ改善の余地がある。デジタル技術は、「無料の」コンテンツからは価値を排除してきたためである。今なお高い評価を得ている有料コンテンツは、デジタル権利管理(DRM)技術を用いた専有パッケージとして提供されている。

水平的市場は、まだ正確には実現されたとは言えない。相互運用可能なDRMiDRM)ソリューションが本業界で幅広く採択されないかぎり、こうした状況は続くであろう。相互運用可能なDRMは、コンテンツがその価値を保持し、企業が各自の提供サービスにより多くの機能を付加するよう促す奨励材料となるための唯一の手段なのである。

3.2. MPEG-21

MPRG-7がオーディオ/ビデオ符号化規格ではないのと同様、MPEG-21も「信号処理」のための規格ではない。MPEG-21に対するニーズは、圧縮と記述は「マルチメディア」にとって重要な二要素ではあるが、コンテンツを自律的に取引できるような完全なマルチメディア市場を可能にするには更に多くの異種技術を統合する必要がある、という認識によって誘発されている。こうした目標を実現するには、次のような数々の新技術が必要である:

4. 新たな展望

4.1. MPEG-A

MPEGが開発されてから19年が経過した現在、MPEGおよび他の起源に由来するマルチメディア技術は数多く存在するが、有益なマルチメディア・アプリケーションの難しさは変わらない――選択肢が多すぎるためである。

一方MPEGには、豊富なマルチメディア・ツールがあり、アプリケーションを可能にする技術の組み合わせを適宜定義するためのノウハウも備わっている。

これがMPEG-AAはアプリケーションのA)規格の論理的根拠である。この規格に関しては、以下が開発されている、もしくは進行中である。

4.2. MPEG-E

MPEGマルチメディア・ミドルウェア(M3W)は、符号化や信号処理を目的とせず、マルチメディア志向の強いもう一つの規格である。

この規格は、最終的には以下の部分から構成される予定である。

  1. アーキテクチャ

  2. マルチメディアAPI

  3. コンポーネント・モデル

  4. リソースおよび品質管理

  5. コンポーネント・ダウンロード

  6. 故障管理

  7. システム保全管理

M3W APIは、プラットフォームで必要な機能を大幅に重複しながらも、互いに差異のある多様な能力を備えた複数の製品で使用するのに適した、汎用APIを目指して設計されている。

5. 現況

MPEGは、開発されてから20年近くが経過しており、その作業分野に関して次の評価が可能である。

6. 結論

開発当初から今日までの20年近くにわたり、MPEGは、当時(20年前)のオーディオ/ビデオ産業をデジタル化し、現在のように収束された新しいデジタル・オーディオ/ビデオ産業を作り上げるための過程に貢献してきた。

この間、数々の変化が見られたが、この業界はいまだに安定からはほど遠い状態にある。技術が進歩するとともに、規格に対するニーズも存続してゆく。

MPEGは、当初ビジョンを固持し、開発された多大な技術資産を頼りに、制約の少ない環境で新たな規格を考案することで、今後も業界の標準化に対するニーズを先取りしてゆくであろう。