By Lumens
avril 02, 2025 1239
Cela fait plus de trois ans que nous avons rédigé notre populaire Guide du débutant sur les caméras PTZ. À l’époque, nous avons réfléchi à la façon dont ces caméras constituaient une percée dans la production à distance, dans le positionnement discret et dans la réduction des coûts opérationnels, avec peu ou pas de compromis sur la qualité d’image. Ce sont ces caractéristiques qui en ont fait un pilier des programmes télévisés documentaires, de la capture de conférences, des espaces de réunion, des salles de concert et des lieux de culte.
Depuis lors, les caméras PTZ ont connu une deuxième révolution, mais pas nécessairement de la manière que nous aurions prédite.
En 2021, les caméras PTZ étaient de plus en plus développées pour répondre aux besoins des événements en direct et des diffuseurs. Les capteurs devenaient de plus en plus grands, offrant une belle qualité d’image cinématographique. Il y a eu une poussée vers des débits binaires plus élevés (full NDI et SMPTE 2110), des entrées audio 12G-SDI et XLR adaptées à la diffusion et même l’option d’objectifs interchangeables. L’industrie s’orientait clairement vers les caméras PTZ en remplacement des caméras de studio de télévision.
Mais dans les années qui ont suivi, les choses ont changé. Pourquoi l’industrie n’a-t-elle pas poursuivi la qualité cinématographique comme objectif ultime ? À quelques exceptions près, l’industrie PTZ n’a pas été obsédée par l’obtention de la qualité d’image ultime avant tout. Il y a trois raisons principales à cela.
1. L’essor du capteur plus petit
Un capteur plein format ou de nouvelle génération de 1 pouce surpassera certainement un type plus petit, mais les véritables avantages sont principalement visibles dans des conditions de faible luminosité extrêmes, des scènes avec un contraste extrême ou avec des prises de vue qui nécessitent une très faible profondeur de champ. Le choix d’un grand capteur se distingue par l’augmentation considérable du coût de l’électronique, des filtres d’image, des moteurs de mise au point sophistiqués et des objectifs, en particulier lorsque l’entreprise souhaite une plage de 20x ou 30x qui conserve une netteté critique à la fois à l’extrémité large et à l’extrémité longue du zoom. Certains utilisateurs, en particulier dans les grands studios ou les salles de concert d’importance internationale, les théâtres, les opéras et les centres de congrès, exigent la qualité d’image nuancée que cette technologie peut offrir, mais pour la majorité croissante, d’autres facteurs sont prioritaires.
L’industrie a massivement pris une voie très différente, mais sans doute beaucoup plus excitante. Ces dernières années, la qualité d’image, l’efficacité et la rentabilité des capteurs standard (1/3 » et 1/2 ») se sont considérablement améliorées. Les performances que nous avons observées avec un capteur micro quatre tiers de première génération ou 1 pouce sont désormais égalées par les composants plus petits d’aujourd’hui en termes de capacités de faible luminosité, de plage dynamique et de qualité d’image globale. La conclusion est que les nouveaux capteurs plus petits sont facilement « assez bons » pour de nombreuses applications (voire la plupart).
2. L’effet démocratisant du PTZ
La promesse de la vidéo partout – dans les salles de réunion, les salles de formation, les salles de classe, les lieux de culte, les chambres des YouTubers – a changé l’industrie PTZ. L’expérience utilisateur est devenue aussi importante qu’une bonne qualité d’image : de nombreux clients n’ont ni les compétences ni l’envie de modifier les niveaux de luminance, de gamma ou de socle pour obtenir une prise de vue prête pour la diffusion. Ils veulent simplement une belle image en mode entièrement automatique. En bref, la plupart des clients veulent la même expérience utilisateur simple que celle que leur offre l’iPhone.
3. Il y a de plus gros poissons à faire frire !
Au cours des 5 dernières années, l’industrie PTZ a largement dépassé le marché des caméras de studio et des caméscopes en termes d’innovation (et de croissance). Alors, si ce n’est dans l’utilisation de capteurs plus grands, où trouve-t-on ce développement rapide ? En un mot, l’automatisation.
Dans un secteur qui a été inventé pour permettre la production multi-caméras à distance par une seule personne, il n’est pas surprenant que l’automatisation ait continué d’être sa principale force motrice. La caméra PTZ a été conçue pour une installation rapide et discrète dans n’importe quel endroit. Il est devenu populaire pour la capacité d’un seul opérateur à contrôler entre une et vingt caméras.
Ainsi, si ces caméras peuvent être installées et exploitées sans avoir besoin d’une quelconque intervention humaine, il n’est pas surprenant que l’automatisation de tous les processus possibles ait été au premier plan des préoccupations des fabricants.
L’arrivée de l’intelligence artificielle a transformé ce qui est théoriquement possible en réalité, presque du jour au lendemain. Prenons l’exemple de la technologie de suivi automatique.
Les caméras de suivi de mouvement ne sont pas nouvelles. Les premiers modèles (non intelligents) étaient populaires, en particulier pour la capture de cours et les présentations en direct. Ils ont utilisé des algorithmes capables d’identifier les formes humaines, les mouvements et les tons de peau typiques et de diriger la caméra pour qu’elle se déplace afin de garder un individu au centre de la scène. Cela a fonctionné efficacement dans des espaces bien éclairés avec une toile de fond propre et avec un minimum d’individus en vue. Cependant, ils se positionnent dans des environnements moins qu’idéaux et leur fiabilité vacille, perdant parfois le sujet de suivi ou sélectionnant au hasard la mauvaise personne.
Avec AI, les caméras de suivi de nouvelle génération ont une capacité étonnante à reconnaître un individu (même dans une foule de personnes), à se fixer sur cette personne et à la suivre de manière fiable, même si elle tourne le dos de temps en temps ou marche momentanément derrière un objet. De nouvelles AI algorithmes ont transformé le suivi de mouvement à un point tel qu’ils sont devenus de véritables unités de clic et d’oubli.
Les caméras de suivi automatique sont devenues si populaires qu’elles sont maintenant largement utilisées dans les environnements à plusieurs présentateurs. Un problème auquel de nombreux modèles sont confrontés est le fait que lors du passage d’un sujet à l’autre, l’appareil photo devrait effectuer un zoom arrière avant de trouver et de verrouiller la cible suivante. La solution a été de mettre en œuvre une conception à deux caméras, avec de nouvelles caméras de suivi de mouvement dotées d’une caméra panoramique/analytique ainsi que d’une tête PTZ principale. Grâce à cette approche, la caméra peut se déplacer immédiatement et rapidement d’un présentateur à l’autre sans aucune chasse inutile et distrayante.
En remplaçant une HD par un capteur de suivi 4K, le processeur génère naturellement quatre fois plus de données d’image. Il s’agit d’une percée pour l’analyse de scène : l’appareil photo peut désormais examiner quatre fois plus de détails, ce qui présente d’énormes avantages. Au lieu de suivre les individus à une distance maximale de 8 mètres à partir d’une caméra HD, une unité 4K peut plus que doubler la distance de suivi à 18 mètres, voire au-delà.
Aujourd’hui, les caméras de suivi de mouvement peuvent être installées dans de nombreux autres endroits, à l’arrière des salles de conférence et de conférence, des cathédrales et des théâtres, par exemple.
Ainsi, les cinq dernières années ont vu la technologie de suivi de mouvement mûrir, mais une avancée potentiellement encore plus convaincante a été le suivi vocal. Pourquoi ? Parce que dans l’écrasante majorité des environnements, l’homme n’est tout simplement pas en mouvement ! Le suivi de l’intervenant permet simplement à la caméra de suivre une conversation plutôt que le mouvement d’un individu.
Le suivi vocal a été mis en œuvre de deux manières. Tout d’abord, les caméras ont été reliées à des réseaux de microphones DOA (pensez au TCCM ou au TCC2 de Sennheiser, au RMCG de Yamaha et à de nombreux modèles de Nureva, Shure et Audio Technica). Ceux-ci encapsulent plusieurs microphones pour analyser la direction d’où provient un son. À l’aide d’une unité de traitement, telle que la Lumens CamConnect AI-Box1, une caméra (ou plusieurs caméras) peut se concentrer sur la voix active dans une pièce et changer d’angle pour capturer une discussion animée.
Instantanément (et automatiquement), les caméras PTZ ont la possibilité de produire un événement multi-caméras sans intervention humaine. Fini les manettes manuelles, et fini l’inévitable plan large qui rend difficile de déterminer qui parle.
Le suivi multi-haut-parleurs a apporté des valeurs de production de style télévisuel aux espaces de réunion pour une fraction du coût d’un studio de diffusion. Prenant en charge plusieurs réseaux de microphones et quatre caméras, ce type d’installation est bien adapté aux salles de conférence et aux amphithéâtres où le passage d’un angle de caméra à l’autre peut transformer l’expérience de visualisation à distance.
La deuxième approche du suivi vocal est une innovation très récente. Cette approche intègre cette technologie de détection du son dans la caméra elle-même. Dans les petits espaces de réunion, les studios de podcast et les salles de vlogging, des unités telles que le Lumens VC-TR60A peuvent diriger automatiquement leur tête de caméra pour alterner entre deux intervenants, ou passer en mode de cadrage à plusieurs voix pour filmer une discussion avec un cadrage précis qui capture tous les participants actifs.
Grâce à l’AI, la caméra est capable de détecter l’emplacement d’un son, puis de faire la distinction entre le bruit émis par un humain et, par exemple, une porte qui claque, un oiseau qui crie ou un chien qui jappe ! En reliant la caméra à une ligne audio de référence, l’unité peut éliminer davantage les haut-parleurs de la pièce de sa détection du son, ce qui rend le suivi vocal infailliblement précis.
L’inclusion de la caméra panoramique secondaire porte à nouveau ses fruits, car elle permet au système de passer à un plan large chaque fois que la tête PTZ doit bouger. Cela élimine tous les mouvements de caméra visibles qui peuvent être déstabilisants pour les téléspectateurs.
Comme nous l’avons vu, la caméra panoramique est multifonctionnelle, agissant comme un outil d’analyse de l’AI pour la détection et le suivi humains, et comme un plan large pour une commutation intelligente des plans. La caméra secondaire joue un troisième rôle dans les derniers modèles, permettant une sortie d’image dans l’image (PIP) directement à partir des sorties HDMI, USB et (le cas échéant) SDI.
La génération d’un PIP directement à partir de la caméra est une percée pour de nombreuses applications où une vue à deux prises est requise et où les utilisateurs souhaitent simplifier leur flux de travail. Ce développement a été le résultat des demandes des clients dans les salles d’interrogatoire et les salles de formation, où une vue rapprochée et large synchronisée et simultanée est vitale.
L’essor de la production d’IP est inévitable depuis de nombreuses années et les technologies disponibles il y a 3-4 ans sont soit toujours d’actualité, soit ont évolué. C’est notamment le cas avec le format NDI, toujours très populaire.
Bien que le streaming vidéo à large bande passante (voir le VC-A71P-HN) ait toujours sa place dans la télévision diffusée, l’affichage numérique haut de gamme et la capture d’événements en direct de premier niveau, il y a eu un regain d’intérêt pour les formats à faible latence qui équilibrent la compression et la qualité d’image. Avec l’arrivée de NDI HX3, le streaming vidéo et la collaboration sont entrés dans une nouvelle ère. Prenant en charge la transmission jusqu’à 4K sur un réseau 1GbE, HX3 offre l’équilibre parfait entre qualité vidéo, latence et bande passante.
Avec une large prise en charge multi-fournisseurs, HX3 est très bien adapté à la production en direct, avec un écosystème créatif qu’aucun autre format IP ne peut rivaliser.
Le format NDI HX3 est désormais intégré dans les dernières caméras PTZ et disponible via des mini-encodeurs dans les anciens modèles qui ne peuvent pas être mis à niveau vers la dernière version.
Le nouveau Dante AV-H est maintenant mis en œuvre dans PTZ caméras. Il partage de nombreuses caractéristiques de NDI HX3, à savoir un codec H.26X à faible latence, conçu pour fonctionner sur les réseaux locaux existants. Alors que NDI est célèbre pour ses flux de production créatifs, Dante AV-H est inégalé en ce qui concerne sa compatibilité avec l’audio IP (Dante audio) et son écosystème de contrôle (Dante Manager et Dante Controller).
Grâce à PTZ caméras prenant en charge Dante AV-H, les administrateurs peuvent acheminer, gérer et sécuriser les signaux vidéo et audio à l’aide d’applications Dante familières. Ils peuvent également intégrer des caméras PTZ avec des produits tiers tels que des microphones, des haut-parleurs et des DSP, ce qui rend le format extrêmement attrayant pour les gestionnaires AV travaillant dans des espaces de réunion, des salles de formation et des espaces événementiels où Dante audio est déjà installé.
Peu de gens auraient pu prédire le passage d’une obsession pour la qualité d’image et la taille du capteur à une concentration sur les gains de productivité avant tout. Il y a certainement d’autres gains à réaliser en termes d’automatisation à mesure que l’adoption de AI s’accélère et que la capacité de l’intelligence artificielle à dépasser les attentes continue de surpasser. L’avenir n’est certes pas tracé, mais il promet d’être passionnant.
PS. Cet article a été écrit par un humain !