ビデオトラッキング

ビデオトラッキング英語: Video tracking)は、カメラを使用して時間の経過とともに移動するオブジェクト(または複数のオブジェクト)を見つけるプロセス

解説

さまざまな用途があり、その一部には、人間とコンピューターの相互作用、セキュリティと監視、ビデオ通信と圧縮拡張現実、交通管制、医療画像[1]ビデオ編集などがある[2][3]。ビデオに含まれるデータの量が多いため、ビデオトラッキングは時間のかかるプロセスになる可能性がある。複雑さをさらに増すのは、追跡のためにオブジェクト認識技術を使用する必要がある可能性がある。それ自体が困難な問題である。

高速画像処理システムで処理される視覚フィードバックを備えたオブジェクトトラッキングによってロボットの手がボールをキャッチするためのビジュアルサーボ英語版の例[4][5]

ビデオトラッキングの目的は、連続するビデオフレーム内のターゲットオブジェクトを関連付けることである。オブジェクトがフレームレートに比べて速く移動している場合、関連付けは特に難しい場合がある。問題の複雑さを増すもう1つの状況は、追跡対象のオブジェクトが時間の経過とともに方向を変える場合。これらの状況では、ビデオ追跡システムは通常、オブジェクトのさまざまな可能なモーションに対してターゲットの画像がどのように変化するかを説明するモーションモデルを採用している。

単純なモーションモデルの例は次のとおり。

  • 平面オブジェクトを追跡する場合、モーションモデルはオブジェクトの画像(初期フレームなど)の2D変換(アフィン変換またはホモグラフィ英語版)。
  • ターゲットがリジッド3Dオブジェクトの場合、モーションモデルはその3D位置と方向に応じてそのアスペクトを定義する。
  • ビデオ圧縮の場合、キーフレームマクロブロックに分割される。モーションモデルはキーフレームの中断であり、各マクロブロックはモーションパラメータによって指定されたモーションベクトルによって変換される。
  • 変形可能なオブジェクトの画像はメッシュで覆うことができ、オブジェクトの動きはメッシュのノードの位置によって定義される。

アルゴリズム

ビデオトラッキングを実行するために、アルゴリズムは連続するビデオフレームを分析し、フレーム間のターゲットの動きを出力する。さまざまなアルゴリズムがあり、それぞれに長所と短所がある。使用するアルゴリズムを選択するときは、使用目的を考慮することが重要。視覚追跡システムには、ターゲットの表現とローカリゼーション、およびフィルタリングとデータの関連付けという2つの主要なコンポーネントがある。

ターゲットの表現とローカリゼーションは、ほとんどがボトムアッププロセスです。これらのメソッドは、移動するオブジェクトを識別するためのさまざまなツールを提供する。ターゲットオブジェクトを正常に見つけて追跡することは、アルゴリズムに依存する。たとえば、ブロブトラッキングを使用すると、人のプロファイルが動的に変化するため、人の動きを特定するのに役立つ[6]。通常、これらのアルゴリズムの計算の複雑さは低い。以下は、いくつかの一般的なターゲット表現およびローカリゼーションアルゴリズムである。

  • カーネルベースの追跡平均シフト英語版追跡[7] ):類似性測度英語版バタチャリア距離英語版)の最大化に基づく反復ローカリゼーション手順。
  • 輪郭追跡:オブジェクト境界の検出(アクティブな輪郭や凝縮アルゴリズム英語版など)。輪郭追跡方法は、前のフレームから現在のフレームの新しい位置に初期化された初期輪郭を繰り返し展開する。輪郭追跡へのこのアプローチは、勾配降下法を使用して輪郭エネルギーを最小化することにより、輪郭を直接進化させる。

フィルタリングとデータの関連付けは、ほとんどがトップダウンプロセスであり、シーンまたはオブジェクトに関する事前情報の組み込み、オブジェクトダイナミクスの処理、さまざまな仮説の評価が含まれる。これらの方法により、障害物の背後を移動するオブジェクトの追跡など、より複雑なオブジェクトの相互作用とともに、複雑なオブジェクトの追跡が可能になる[8]。さらに、ビデオトラッカー(TVトラッカーまたはターゲットトラッカーとも呼ばれます)が堅固な基礎(陸上)ではなく、移動する船(沖合)に取り付けられている場合、複雑さが増す。ビデオトラッカーを安定させて、カメラシステムに必要なダイナミクスと帯域幅を減らす[9]。これらのアルゴリズムの計算の複雑さは通常、はるかに高くなる。以下は、いくつかの一般的なフィルタリングアルゴリズム。

  • カルマンフィルター:ガウスノイズにさらされる線形関数に最適な再帰ベイズフィルター。これは、ノイズ(ランダムな変動)やその他の不正確さを含む、時間の経過とともに観測される一連の測定値を使用するアルゴリズムであり、単一の測定値のみに基づくものよりも正確になる傾向がある未知の変数の推定値を生成する[10]
  • 粒子フィルター:非線形および非ガウス過程の基礎となる状態空間分布をサンプリングするのに役立つ[11][12][13]

関連項目

脚注

外部リンク