PTZカメラの新しいガイド - なぜそれがすべて変更されたのか

By Lumens

April 02, 2025 889

 

人気の「PTZカメラの初心者向けガイド」を書いてから3年以上が経ちました。当時、私たちは、これらのカメラがリモートプロダクション、目立たないポジショニング、そして画質をほとんどまたはまったく損なうことなく運用コストを削減するためのブレークスルーであったことを振り返りました。これらの特徴が、ドキュメンタリーテレビ番組、講義のキャプチャ、会議スペース、音楽会場、礼拝所の主力となったのです。

しかし、この時以来、PTZカメラは第2の革命を経験しましたが、必ずしも私たちが予測した方法ではありませんでした。

▶ 何よりも画質

2021年当時、PTZカメラは、ライブイベントや放送局のニーズを満たすためにますます開発されていました。センサーは大きくなり、美しい映画のような画質を実現しました。より高いビットレート(フルNDIおよびSMPTE 2110)、放送に適した12G-SDIおよびXLRオーディオ入力、さらには交換レンズのオプションへの推進がありました。業界は明らかに、テレビスタジオカメラの代替品としてPTZカメラに向かっていました。

▶ ユーザーを第一に考える

しかし、その間に状況は変わりました。なぜ、映画業界は究極の目標として映画の品質を追求してこなかったのでしょうか?いくつかの例外を除いて、PTZ業界は何よりも究極の画質を達成することに夢中になってきませんでした。これには主に3つの理由があります。

1. センサーの小型化の台頭

フルフレームまたは新世代の1インチセンサーは、確かに小型のタイプよりも優れていますが、真の利点は主に極端な低照度条件、極端なコントラストのシーン、または非常に浅い被写界深度を必要とするショットで見られます。大型センサーを選択することの見返りは、電子機器、画像フィルター、高度なフォーカシングエンジン、レンズのコストが大幅に増加することです。特に、組織がズームのワイドエンドとロングエンドの両方で重要なシャープネスを保持する20倍または30倍の範囲が必要な場合です。特に主要なスタジオや国際的に重要なコンサートホール、劇場、オペラハウス、コンベンションセンターでは、このテクノロジーが提供できる微妙な画質を求めるユーザーがいますが、ますます多くのユーザーにとって、他の要素が優先されます。

業界は圧倒的に大きく異なる、しかし間違いなくはるかにエキサイティングなルートをとっています。標準(1/3インチおよび1/2インチ)センサーは、近年、画質、効率、費用対効果が劇的に向上しています。初期のマイクロフォーサーズセンサーまたは1インチで見られたパフォーマンスは、低照度機能、ダイナミックレンジ、および全体的な画質の点で、今日の小型コンポーネントに匹敵します。結論は、新しい小型センサーは、多くの(またはほとんどの)アプリケーションにとって簡単に「十分」であるということです。

2. PTZの民主化効果

会議スペース、トレーニングスイート、教室、礼拝所、YouTuberの寝室など、あらゆる場所でのビデオの約束は、PTZ業界を変えました。多くのお客様は、輝度、ガンマ、台座のレベルを微調整して放送に適したショットを実現するスキルも傾向もありません。彼らは単にフルオートモードで素晴らしい画像を求めています。要するに、ほとんどの顧客は、iPhoneが提供するのと同じユーザー体験を望んでいます。

3.揚げるべき大きな魚がいます!

PTZ業界は、過去5年間でイノベーション(および成長)の点でスタジオカメラとビデオカメラマーケットをはるかに上回っています。では、より大きなセンサーを使用しなければ、この急速な発展はどこにあるのでしょうか?一言で言えば、自動化です。

▶ 自動化のご紹介

1人でのリモートマルチカメラ制作を可能にするために発明されたこの分野で、自動化が最大の原動力であり続けていることは驚くことではありません。PTZカメラは、あらゆる場所に迅速かつ目立たないように設置するために考案されました。1人のオペレーターが1台から20台のカメラを制御できることで人気を博しました。

したがって、これらのカメラが人間の介入をまったく必要とせずに設置および操作できるのであれば、可能なすべてのプロセスを自動化することがメーカーの最前線にあることは驚くことではありません。

▶ AI の有効化

人工知能の登場により、理論的には可能だったことがほぼ一夜にして現実のものとなりました。例として、自動追跡技術を見てみましょう。

モーショントラッキングカメラは新しいものではありません。初期の(非インテリジェント)モデルは、特に講義のキャプチャやライブプレゼンテーションで人気がありました。彼らは、典型的な人間の形、動き、肌の色を識別し、個々のステージの中央を保つようにカメラを動かすことができるアルゴリズムを使用しました。これは、クリーンな背景と最小限の個人が視界に入る明るい空間で効果的に機能しました。しかし、理想的とは言えない環境に配置されると、その信頼性が損なわれ、追跡対象を見失ったり、間違った個体をランダムに選択したりすることがありました。

AIを搭載した新世代の追跡カメラは、(人混みの中でも)個人を認識し、その人物をしっかりと把握し、時折背を向けたり、物体の後ろを一瞬歩いたりしても、確実に追跡する不思議な能力を持っています。新しいAIアルゴリズムは、モーショントラッキングを真のクリックアンドフォーゲットユニットにするほどに変革しました。

▶ 2つは1つよりも優れています

オートトラッキングカメラは非常に人気があり、現在ではマルチプレゼンター環境で広く使用されています。多くのモデルが直面する問題は、ある被写体から次の被写体に切り替えるときに、カメラが次のターゲットを見つけてロックする前にズームアウトしなければならないことです。解決策は、パノラマ/分析カメラと主要なPTZヘッドを備えた新しいモーショントラッキングカメラを使用して、2台のカメラ設計を実装することでした。このアプローチにより、カメラは不必要で気を散らす狩猟なしに、プレゼンターからプレゼンターへとすぐに移動できます。

▶ スーパーファインモーショントラッキング

HDを4Kトラッキングセンサーに置き換えることで、プロセッサは自然に4倍の画像データを生成します。これはシーン分析のブレークスルーであり、カメラは4倍の詳細を調査できるようになり、大きなメリットがあります。HDカメラから最大8メートル離れた場所で個人を追跡する代わりに、4Kユニットは追跡距離を2倍以上の18メートル以上にすることができます。

現在では、モーショントラッキングカメラを、会議室や講義室の奥、大聖堂、劇場など、より多くの場所に設置することができます。

▶ 健全な投資

このように、過去5年間でモーショントラッキング技術は成熟しましたが、音声トラッキングではさらに魅力的な進歩が見られる可能性があります。なぜでしょうか?なぜなら、圧倒的多数の環境では、人間は単に動いていないからです。スピーカートラッキングは、カメラが個人の動きではなく、会話を追うことを可能にするだけです。

音声トラッキングが実装されている方法は2つあります。まず、カメラは到着方向(DOA)マイクアレイにリンクされています(Sennheiser TCCMまたはTCC2、YamahaのRMCG、およびニューエバ、Shure、オーディオテクニカの多くのモデルを考えてください)。これらは、複数のマイクをカプセル化して、音が来る方向を分析します。Lumens CamConnect AI-Box1などの処理ユニットを使用すると、カメラ(または複数のカメラ)が部屋のアクティブな音声に焦点を合わせ、角度を切り替えて活発なディスカッションをキャプチャできます。

PTZカメラは、人間の介入を必要とせずに、即座に(そして自動的に)マルチカメライベントを生成する機能を与えられています。手動コントローラーはなくなり、誰が話しているのかを理解するのを難しくする必然的なワイドショットもなくなりました。

マルチスピーカートラッキングは、放送スタジオの数分の一のコストで、会議スペースにテレビスタイルの制作価値をもたらしました。複数のマイクアレイと4台のカメラをサポートするこの種のインスタレーションは、カメラアングルを切り替えることでリモートビューイング体験を変えることができる会議室や講堂に最適です。

▶ スマートハドルルームカメラ

音声トラッキングへの2つ目のアプローチは、ごく最近のイノベーションです。このアプローチでは、この音声検出技術をカメラ自体に組み込みます。小規模なミーティングスペース、ポッドキャストスタジオ、Vlogスイートでは、Lumens VC-TR60Aなどのユニットで、カメラヘッドを自動的に2人のスピーカーに向けたり、マルチボイスフレーミングモードに移行して、アクティブな参加者全員を捉えた正確なフレームショットでディスカッションを撮影したりできます。

AI対応のカメラは、音の位置を検出し、人間が発する音と、ドアを閉める音、鳥の鳴き声、犬の鳴き声などを区別することができます。カメラをリファレンスオーディオラインにリンクすることで、ユニットは室内のスピーカーを音検出からさらに排除し、音声追跡を的確に行うことができます。

セカンダリパノラマカメラを含めることで、PTZヘッドが移動する必要があるときはいつでもシステムがワイドショットに切り替えられるようになりました。これにより、リモートの視聴者を不安にさせる可能性のある目に見えるカメラの動きがすべて排除されます。

▶ ピクチャーインピクチャー

これまで見てきたように、パノラマカメラは多機能で、人間の検出と追跡のためのAI分析ツールとして機能し、インテリジェントなショット切り替えのためのワイドショットとして機能します。セカンダリカメラは、最新モデルでは3番目の役割を果たしており、HDMI、USB、および(利用可能な場合)SDI出力から直接ピクチャーインピクチャー(PIP)出力を可能にします。

カメラから直接PIPを生成することは、2ショットビューが必要な場合や、ユーザーがワークフローを簡素化したいと考えている多くのアプリケーションにとって画期的なことです。この開発は、インテロゲーションスイートやトレーニングルームのお客様からの要求の結果であり、同期した同時のクローズアップとワイドビューが不可欠です。

▶ IPストリーミングと接続性

IP生産の台頭は長年にわたって避けられず、3〜4年前に利用可能だったテクノロジーはまだ最新であるか、進化しています。これは、特に人気のあるNDI形式に当てはまります。

▶ NDI HX3の

高帯域幅のビデオストリーミング(VC-A71P-HNを参照)は、テレビ放送、ハイエンドデジタルサイネージ、ティア1ライブイベントのキャプチャで依然としてその地位を占めていますが、圧縮と画質のバランスが取れた低遅延フォーマットへの関心が急増しています。NDI HX3の登場により、ビデオストリーミングとコラボレーションは新しい時代に入りました。1GbEネットワークで最大4K伝送をサポートするHX3は、ビデオ品質、遅延、帯域幅の完璧なバランスです。

幅広いマルチベンダーサポートを備えたHX3は、他のIPフォーマットに匹敵することのないクリエイティブなエコシステムを備えたライブプロダクションに非常に適しています。

NDI HX3フォーマットは、最新のPTZカメラに組み込まれ、最新バージョンにアップグレードできない古いモデルのミニエンコーダーを介して利用できるようになりました。

▶ AV統合:Dante AV-H

新しいDante AV-Hは現在、PTZカメラに実装されています。これは、NDI HX3 の特性の多くを共有しており、既存のローカル エリア ネットワークで実行するように設計された低遅延の H.26X コーデックです。NDIがクリエイティブな制作ワークフローで高く評価されているのに対し、Dante AV-Hは、IPオーディオ(Danteオーディオ)とその制御エコシステム(DanteマネージャーおよびDanteコントローラー)との互換性に関して、他の追随を許しません。

Dante AV-HをサポートするPTZカメラにより、管理者は使い慣れたDanteアプリケーションを使用してビデオおよびオーディオ信号をルーティング、管理、保護できます。また、PTZカメラをマイク、スピーカー、DSPなどのサードパーティ製品と統合することもできるため、Danteオーディオがすでにインストールされている会議スペース、トレーニングルーム、イベントスペースで働くAVマネージャーにとって非常に魅力的な形式になっています。

▶ 今後の展開

画質やセンサーサイズへのこだわりから、何よりも生産性の向上に重点を置くことへの重点のシフトを予測できた人はほとんどいませんでした。AIの採用が加速し、人工知能の能力が期待を上回り続けるにつれて、自動化の面で享受できる利益がさらに増えることは確かです。未来は確かに描かれていませんが、エキサイティングであることは間違いありません。

PS. この記事は人間によって書かれました!

 

 
 

 
戻る