Una nueva guía para la cámara PTZ: por qué ha cambiado todo

By Lumens

abril 02, 2025 1240

 

Han pasado más de tres años desde que escribimos nuestra popular Guía para principiantes sobre cámaras PTZ. En ese momento, reflexionamos sobre cómo estas cámaras fueron un gran avance en la producción remota, en el posicionamiento discreto y en la reducción de los costos operativos, con poco o ningún compromiso en la calidad de la imagen. Fueron estas características las que los convirtieron en un pilar en la programación de documentales de televisión, la captura de conferencias, los espacios de reunión, los lugares de música y los lugares de culto.

Sin embargo, desde entonces, las cámaras PTZ han experimentado una segunda revolución, pero no necesariamente de la manera que hubiéramos predicho.

▶ Calidad de imagen por encima de todo

En 2021, las cámaras PTZ se desarrollaban cada vez más para satisfacer las necesidades de los eventos en directo y las emisoras. Los sensores eran cada vez más grandes, lo que proporcionaba una hermosa calidad de imagen cinematográfica. Hubo un impulso hacia tasas de bits más altas (NDI completo y SMPTE 2110), entradas de audio 12G-SDI y XLR amigables para la transmisión e incluso la opción de lentes intercambiables. La industria se estaba moviendo claramente hacia las cámaras PTZ como reemplazo de las cámaras de estudio de televisión.

▶ Poner al usuario en primer lugar

Pero en los años transcurridos, las cosas han cambiado. ¿Por qué la industria no ha perseguido la calidad cinematográfica como objetivo final? Con algunas excepciones, la industria de PTZ no ha estado obsesionada con lograr la máxima calidad de imagen por encima de todo. Hay tres razones principales para esto.

1. El auge del sensor más pequeño

Un sensor de fotograma completo o de nueva generación de 1 pulgada sin duda superará a un tipo más pequeño, pero los beneficios reales se ven principalmente en condiciones de luz extremadamente baja, escenas con contraste extremo o con tomas que requieren una profundidad de campo muy baja. La recompensa por seleccionar un sensor grande es el costo considerablemente mayor de la electrónica, los filtros de imagen, los sofisticados motores de enfoque y las lentes, particularmente cuando la organización desea un rango de 20x o 30x que conserve la nitidez crítica tanto en el extremo amplio como en el largo del zoom. Hay usuarios, especialmente en los grandes estudios o en las salas de conciertos, teatros, óperas y centros de convenciones de importancia internacional, que exigen la calidad de imagen matizada que puede ofrecer esta tecnología, pero para la creciente mayoría, otros factores tienen prioridad.

La industria ha tomado abrumadoramente una ruta muy diferente, pero posiblemente mucho más emocionante. Los sensores estándar (1/3" y 1/2") han mejorado drásticamente en calidad de imagen, eficiencia y rentabilidad en los últimos años. El rendimiento que vimos de un sensor micro cuatro tercios de primera generación o de 1 pulgada ahora es igualado por el componente más pequeño de hoy en términos de capacidades con poca luz, rango dinámico y calidad de imagen general. La conclusión es que los nuevos sensores más pequeños son fácilmente "lo suficientemente buenos" para muchas (o incluso la mayoría) de las aplicaciones.

2. El efecto democratizador de la PTZ

La promesa del vídeo en todas partes, en espacios de reuniones, salas de formación, aulas, lugares de culto, dormitorios de YouTubers, ha cambiado la industria de PTZ. La experiencia del usuario se ha vuelto tan importante como una buena calidad de imagen: muchos clientes no tienen la habilidad ni la inclinación para ajustar la luminancia, la gamma o los niveles de pedestal para lograr una toma lista para la transmisión. Simplemente quieren una gran imagen en modo totalmente automático. En resumen, la mayoría de los clientes quieren la misma experiencia de usuario sencilla que les ofrece su iPhone.

3. ¡Hay peces más grandes para freír!

La industria PTZ ha superado con creces al mercado de cámaras de estudio y videocámaras en términos de innovación (y crecimiento) en los últimos 5 años. Entonces, si no es en el uso de sensores más grandes, ¿dónde encontramos este rápido desarrollo? En una palabra, automatización.

▶ Introducción a la automatización

En un sector que se inventó para permitir la producción multicámara remota de una sola persona, no es de extrañar que la automatización haya seguido siendo su mayor fuerza motriz. La cámara PTZ fue concebida para una instalación rápida y discreta en cualquier lugar. Se hizo popular por la capacidad de un solo operador para controlar entre una y veinte cámaras.

Por lo tanto, si esas cámaras se pueden instalar y operar sin necesidad de ninguna intervención humana, no es de extrañar que la automatización de todos los procesos posibles haya estado a la vanguardia de la mente de los fabricantes.

▶ Habilitación de la AI

La llegada de la inteligencia artificial ha convertido en realidad lo que es teóricamente posible, casi de la noche a la mañana. Veamos como ejemplo la tecnología de seguimiento automático.

Las cámaras de seguimiento de movimiento no son nuevas. Los primeros modelos (no inteligentes) fueron populares, especialmente en la captura de conferencias y presentaciones en vivo. Utilizaron algoritmos que podían identificar las formas humanas, el movimiento y los tonos de piel típicos y dirigir la cámara para que se moviera y mantuviera a un individuo en el centro del escenario. Esto funcionó de manera efectiva en espacios bien iluminados con un fondo limpio y con un mínimo de personas a la vista. Sin embargo, se colocaron en entornos menos que ideales, y su fiabilidad flaqueó, perdiendo ocasionalmente al sujeto de seguimiento o seleccionando al azar al individuo equivocado.

Con AI, las cámaras de seguimiento de nueva generación tienen una extraña capacidad para reconocer a un individuo (incluso en una multitud de personas), fijarse en esa persona y rastrearla de manera confiable incluso si le da la espalda ocasionalmente o camina momentáneamente detrás de un objeto. Los nuevos algoritmos de AI han transformado el seguimiento de movimiento hasta tal punto que se han convertido en verdaderas unidades de clic y olvido.

▶ Dos es mejor que uno

Las cámaras de seguimiento automático se han vuelto tan populares que ahora se usan ampliamente en entornos de múltiples presentadores. Un problema al que se enfrentan muchos modelos es al cambiar de un sujeto a otro: la cámara tendría que alejarse antes de encontrar y fijar el siguiente objetivo. La solución ha sido implementar un diseño de dos cámaras, con nuevas cámaras de seguimiento de movimiento que cuentan con una cámara panorámica/analítica, así como un cabezal PTZ principal. Con este enfoque, la cámara puede moverse rápidamente de un presentador a otro sin ninguna búsqueda innecesaria y que distraiga.

▶ Seguimiento de movimiento súper fino

Al sustituir un HD por un sensor de seguimiento 4K, el procesador genera naturalmente cuatro veces más datos de imagen. Este es un gran avance para el análisis de escenas: la cámara ahora puede examinar cuatro veces más detalles, lo que tiene enormes beneficios. En lugar de seguir a las personas a un máximo de 8 metros de una cámara HD, una unidad 4K puede duplicar con creces la distancia de seguimiento a 18 metros, o más.

Ahora las cámaras de seguimiento de movimiento se pueden instalar en muchos más lugares, en la parte trasera de salas de conferencias y conferencias, catedrales y teatros, por ejemplo.

▶ Una buena inversión

Por lo tanto, en los últimos cinco años se ha visto la maduración de la tecnología de seguimiento de movimiento, pero un avance potencialmente aún más convincente ha sido el seguimiento de voz. ¿Por qué? ¡Porque en la inmensa mayoría de los entornos, los humanos simplemente no están en movimiento! El seguimiento del orador simplemente permite que la cámara siga una conversación en lugar del movimiento de una persona.

Hay dos formas en las que se ha implementado el seguimiento por voz. En primer lugar, las cámaras se han vinculado a matrices de micrófonos de dirección de llegada (DOA) (piense en Sennheiser TCCM o TCC2, RMCG de Yamaha y muchos modelos de Nureva, Shure y Audio Technica. Estos encapsulan múltiples micrófonos para analizar la dirección de la que proviene un sonido. Con una unidad de procesamiento, como la CamConnect AI-Box de lúmenes1, una cámara (o varias cámaras) puede enfocar la voz activa en una habitación y cambiar de ángulo para capturar una conversación animada.

De forma instantánea (y automática), las cámaras PTZ tienen la capacidad de producir un evento multicámara sin necesidad de intervención humana. Atrás quedaron los controladores manuales, y se acabó el inevitable plano general que dificulta determinar quién está hablando.

El seguimiento de varios altavoces ha proporcionado valores de producción al estilo de la televisión a los espacios de reuniones a una fracción del costo de un estudio de transmisión. Al admitir múltiples conjuntos de micrófonos y cuatro cámaras, este tipo de instalación es muy adecuada para salas de juntas y salas de conferencias donde el cambio entre ángulos de cámara puede transformar la experiencia de visualización remota.

▶ Cámaras inteligentes para salas de reunión

El segundo enfoque del seguimiento de voz es una innovación muy reciente. Este enfoque incorpora esta tecnología de detección de sonido en la propia cámara. En espacios de reuniones más pequeños, estudios de podcast y salas de Vlogging, unidades como el Lumens VC-TR60A pueden dirigir su cabezal de cámara automáticamente para alternar entre dos altavoces, o entrar en modo de encuadre de múltiples voces para filmar una discusión con una toma enmarcada con precisión que captura a todos los participantes activos.

Habilitada para AI, la cámara es capaz de detectar la ubicación de un sonido y luego distinguir entre el ruido producido por un humano y, por ejemplo, un portazo, un pájaro que grazna o un perro que ladra. Al vincular la cámara a una línea de audio de referencia, la unidad puede eliminar aún más los altavoces de la habitación de su detección de sonido, lo que hace que el seguimiento de voz sea infaliblemente preciso.

La inclusión de la cámara panorámica secundaria vuelve a dar sus frutos, ya que permite que el sistema cambie a una toma amplia cada vez que el cabezal PTZ necesite moverse. Esto elimina todos los movimientos visibles de la cámara, que pueden ser inquietantes para los espectadores remotos.

▶ Imagen en imagen

Como hemos visto, la cámara panorámica es multifuncional y actúa como una herramienta de análisis de AI para la detección y el seguimiento humanos, y como un plano general para el cambio de disparo inteligente. La cámara secundaria tiene una tercera función en los últimos modelos, permitiendo la salida picture-in-picture (PIP) directamente desde las salidas HDMI, USB y (cuando estén disponibles) SDI.

La generación de un PIP directamente desde la cámara es un gran avance para muchas aplicaciones en las que se requiere una vista de dos tomas y en las que los usuarios quieren simplificar su flujo de trabajo. Este desarrollo ha sido el resultado de las demandas de los clientes en las salas de interrogatorios y las salas de formación, donde un primer plano sincronizado y simultáneo y una visión amplia son vitales.

▶ Transmisión y conectividad IP

El aumento de la producción IP ha sido inevitable durante muchos años y las tecnologías disponibles hace 3-4 años siguen siendo actuales o han evolucionado. Este es particularmente el caso del siempre popular formato NDI.

▶ NDI HX3

Aunque la transmisión de video de alto ancho de banda (consulte el VC-A71P-HN) todavía tiene su lugar en la transmisión de televisión, la señalización digital de alta gama y la captura de eventos en vivo de primer nivel, ha habido un aumento del interés en los formatos de baja latencia que equilibran la compresión con la calidad de la imagen. Con la llegada de NDI HX3, la transmisión de video y la colaboración entraron en una nueva era. Al admitir transmisiones de hasta 4K a través de una red de 1 GbE, HX3 es el equilibrio perfecto entre calidad de video, latencia y ancho de banda.

Con un amplio soporte de múltiples proveedores, HX3 es muy adecuado para la producción en vivo, con un ecosistema creativo con el que ningún otro formato IP puede rivalizar.

El formato NDI HX3 ahora está integrado en las últimas cámaras PTZ y está disponible a través de mini codificadores en modelos más antiguos que no se pueden actualizar a la última versión.

▶ AV Integración: Dante AV-H

El nuevo Dante AV-H ya se está implementando en PTZ cámaras. Comparte muchas de las características de NDI HX3, siendo un códec H.26X de baja latencia, diseñado para ejecutarse en redes de área local existentes. Mientras NDI es célebre por sus flujos de trabajo de producción creativa, Dante AV-H no tiene rival en lo que respecta a su compatibilidad con el audio IP (Dante audio) y su ecosistema de control (Dante Manager y Dante Controller).

Con PTZ cámaras compatibles con Dante AV-H, los administradores pueden enrutar, administrar y proteger las señales de video y audio utilizando aplicaciones Dante conocidas. También pueden integrar cámaras PTZ con productos de terceros como micrófonos, altavoces y DSP, lo que hace que el formato sea muy atractivo para los gerentes de AV que trabajan en espacios de reuniones, salas de capacitación y espacios de eventos donde Dante audio ya está instalado.

▶ El futuro

Pocos podrían haber predicho el cambio de énfasis de una obsesión con la calidad de la imagen y el tamaño del sensor, a un enfoque en las ganancias de productividad por encima de todo. Sin duda, hay más beneficios que se pueden disfrutar en términos de automatización a medida que se acelera la adopción de la AI y la capacidad de la inteligencia artificial para seguir superando las expectativas. Ciertamente, el futuro no está trazado, pero seguro que será emocionante.

PD. ¡Este artículo fue escrito por un humano!

 

 
 

 
Atrás