ビデオトラッキング
ビデオトラッキング(英語: Video tracking)は、カメラを使用して時間の経過とともに移動するオブジェクト(または複数のオブジェクト)を見つけるプロセス。
解説
さまざまな用途があり、その一部には、人間とコンピューターの相互作用、セキュリティと監視、ビデオ通信と圧縮、拡張現実、交通管制、医療画像[1] 、ビデオ編集などがある[2][3]。ビデオに含まれるデータの量が多いため、ビデオトラッキングは時間のかかるプロセスになる可能性がある。複雑さをさらに増すのは、追跡のためにオブジェクト認識技術を使用する必要がある可能性がある。それ自体が困難な問題である。
ビデオトラッキングの目的は、連続するビデオフレーム内のターゲットオブジェクトを関連付けることである。オブジェクトがフレームレートに比べて速く移動している場合、関連付けは特に難しい場合がある。問題の複雑さを増すもう1つの状況は、追跡対象のオブジェクトが時間の経過とともに方向を変える場合。これらの状況では、ビデオ追跡システムは通常、オブジェクトのさまざまな可能なモーションに対してターゲットの画像がどのように変化するかを説明するモーションモデルを採用している。
単純なモーションモデルの例は次のとおり。
アルゴリズム
ビデオトラッキングを実行するために、アルゴリズムは連続するビデオフレームを分析し、フレーム間のターゲットの動きを出力する。さまざまなアルゴリズムがあり、それぞれに長所と短所がある。使用するアルゴリズムを選択するときは、使用目的を考慮することが重要。視覚追跡システムには、ターゲットの表現とローカリゼーション、およびフィルタリングとデータの関連付けという2つの主要なコンポーネントがある。
ターゲットの表現とローカリゼーションは、ほとんどがボトムアッププロセスです。これらのメソッドは、移動するオブジェクトを識別するためのさまざまなツールを提供する。ターゲットオブジェクトを正常に見つけて追跡することは、アルゴリズムに依存する。たとえば、ブロブトラッキングを使用すると、人のプロファイルが動的に変化するため、人の動きを特定するのに役立つ[6]。通常、これらのアルゴリズムの計算の複雑さは低い。以下は、いくつかの一般的なターゲット表現およびローカリゼーションアルゴリズムである。
- カーネルベースの追跡(平均シフト追跡[7] ):類似性測度(バタチャリア距離)の最大化に基づく反復ローカリゼーション手順。
- 輪郭追跡:オブジェクト境界の検出(アクティブな輪郭や凝縮アルゴリズムなど)。輪郭追跡方法は、前のフレームから現在のフレームの新しい位置に初期化された初期輪郭を繰り返し展開する。輪郭追跡へのこのアプローチは、勾配降下法を使用して輪郭エネルギーを最小化することにより、輪郭を直接進化させる。
フィルタリングとデータの関連付けは、ほとんどがトップダウンプロセスであり、シーンまたはオブジェクトに関する事前情報の組み込み、オブジェクトダイナミクスの処理、さまざまな仮説の評価が含まれる。これらの方法により、障害物の背後を移動するオブジェクトの追跡など、より複雑なオブジェクトの相互作用とともに、複雑なオブジェクトの追跡が可能になる[8]。さらに、ビデオトラッカー(TVトラッカーまたはターゲットトラッカーとも呼ばれます)が堅固な基礎(陸上)ではなく、移動する船(沖合)に取り付けられている場合、複雑さが増す。ビデオトラッカーを安定させて、カメラシステムに必要なダイナミクスと帯域幅を減らす[9]。これらのアルゴリズムの計算の複雑さは通常、はるかに高くなる。以下は、いくつかの一般的なフィルタリングアルゴリズム。
関連項目
- マッチムーブ
- モーションキャプチャ
- 動きの推定
- オプティカルフロー
- Swisトラック
- 単一粒子追跡
- Teknomo–Fernandezアルゴリズム
脚注
外部リンク
- –迷路を通過するボールを追跡するために使用されるCromemco Cyclops Cameraの興味深い歴史的な例(1980年)。