La copia cibernética de YouTube es una gran característica con una ejecución terrible

Recientemente, he manido creadores completamente nuevos en mi feed de YouTube. Nuevas miniaturas de videos con una pequeña marca en la remate que dice “doblado automáticamente”. ¡Oh, ocurrente! Esto significa que puedo ver mucho más contenido de todo el mundo; me gusta esa idea.

Es asegurar, me gustó hasta que hice clic en uno de estos videos. Si adecuadamente es una gran idea, la ejecución deja mucho que desear.

La promesa del autodoblaje

La nueva función de doblaje impulsada por IA de YouTube es la culminación de varias tecnologías que han llegado al punto en que poco como esto es posible. La IA vanguardia ahora puede transcribir palabras habladas en prácticamente cualquier idioma con un detención límite de precisión. La tecnología de inteligencia químico asimismo puede sintetizar una voz humana basada en ese texto que es esencialmente indistinguible de una voz humana existente. Aún más impresionante, puedes clonar la voz del hablante en el idioma innovador, para que suene como si estuviera hablando el idioma de destino con su propia voz.

Combine esto con la enorme cantidad de potencia informática de YouTube y obtendrá el doblaje automotriz. Existe todo un mundo de contenido de YouTube que no está en inglés y, por supuesto, una gran parte del mundo no palabra inglés. Entonces, una función de doblaje automotriz como esta tiene el potencial de desbloquear todo YouTube para cualquiera. Durante mucho tiempo he observado en X que la multitud utiliza herramientas de doblaje impulsadas por IA para los vídeos que se publican, por lo que claramente hay demanda para esto, pero ¿qué tan adecuadamente funciona?

Los problemas de calidad son reales

Una captura de pantalla de Envolto Tech, que muestra las dos pistas de audio diferentes.
Una captura de pantalla de Tecnología Envoltomostrando las dos pistas de audio diferentes.
Crédito: Tecnología Envolvo

Primero, debo señalar que YouTube parece harto consciente de todas las deficiencias de esta función en este momento. Si miras el documento oficial de ayuda para el doblaje automotrizenumera casi todos ellos.

Un gran problema que tengo es cómo el doblaje reemplaza prácticamente toda la pista de audio. Entonces, cualquier sonido que no sea un diálogo hablado desaparece. Vuelve aquí y allá en segmentos sin discurso, pero en su longevo parte estos videos doblados suenan vacíos. Sé que es posible borrar la voz innovador del video sin eliminar el resto del sonido, así que espero que veamos una traducción de doblaje automotriz que pueda restaurar la mezcla de audio innovador de estos videos. Diablos, no me importaría algún tipo de IA que pueda arreglar la mezcla de audio en videos de YouTube, porque muchos YouTubers no saben cómo mezclar su audio.

El otro problema es un poco más sutil y YouTube asimismo lo reconoce. La voz doblada no tiene vida y no parece intentar igualar el tono o la energía de la voz innovador. En este sentido, suena muy parecido al tipo de doblaje en vivo que se obtiene en las Naciones Unidas, en el que el traductor parece harto desinteresado. Obviamente, YouTube está trabajando activamente en esto, pero los doblajes que he escuchado aún no lo muestran.

Hasta donde yo sé, no se intenta hacer coincidir el audio con los movimientos de la boca del hablante, lo cual es bueno, pero resulta extraño que los doblajes sonido como el tipo que intenta igualar el movimiento de la boca. Anexar cosas como “¿verdad?” y “¿sabes?”, o “¿OK? Por supuesto, hasta donde yo sé, todos estaban en la pista de audio innovador. Pero como no hablo el idioma innovador, no puedo saberlo. Todo lo que sé es que los doblajes suenan incómodos por eso.

Por otra parte de esto, están todos los artefactos que se obtienen a partir de voces sin procesar generadas por IA. Como pronunciar mal abreviaturas como “MB” como “em-bee” en oportunidad de “megabyte”. Sin confiscación, no puedo culpar a YouTube por esto en particular, sin que los humanos modifiquen la IA, en mi experiencia, la conversión de texto a voz siempre tiene estos problemas.

El conflicto entre paso y precisión

Mujer joven y hombre con auriculares aprendiendo diferentes idiomas. Crédito: pathdoc/Shutterstock.com

Estos problemas de calidad son molestos, pero pueden mejorarse con el tiempo. En última instancia, es una cuestión de refinamiento de la tecnología. Lo que no es tan acomodaticio de resolver es la confianza en la traducción existente. La traducción cibernética ha trayecto un desprendido camino desde los primeros días en que se leían manuales de dispositivos en un inglés deficiente. Sin confiscación, incluso los traductores humanos expertos encuentran este trabajo complicado y cometen errores.

La conclusión es que incluso cuando veo un vídeo doblado automáticamente, no tengo idea de si puedo abandonarse en la información de ese vídeo o no. Esto no es diferente de los subtítulos, por supuesto, pero los doblajes son más populares que los subtítulos, incluso como este malhumorado fanático del anime tiene que recibir. Por lo tanto, el significación de la desinformación es mucho longevo gracias a esta función, especialmente si YouTube la ha tomado como luz verde para incluir videos en los feeds de personas que hablan un idioma diferente al del material innovador.

Odiaría que me criticaran por uno de mis propios vídeos de youtube ¡Por poco que en verdad no dije! He escrito antaño que la confianza es lo único que la IA no puede resolver invirtiendo más hacienda y tecnología en el problema, y ​​este podría ser un excelente ejemplo.

Cómo YouTube podría hacerlo funcionar

Me gusta la función de doblaje automotriz y creo que tiene mucho potencial, pero hay algunas cosas que creo que YouTube podría implementar de inmediato para mejorarla.


En primer oportunidad, me gustaría ver una forma sencilla y directa de desactivar las copias automáticas que aparecen en mi feed o en las búsquedas. Hazlo tan acomodaticio como filtrar YouTube Shorts, por ejemplo. Lo segundo que me gustaría ver es algún tipo de puntuación de confianza de la IA en la traducción y, quizás más importante, calificaciones humanas de personas que hablan los dos idiomas.

Tener calificaciones humanas sobre la calidad del doblaje aumentaría enormemente la confianza. Permitir que esas mismas personas brinden comentarios específicos que la IA pueda utilizar sería una doble rendimiento. Hasta ahora, le doy a toda la función de doblaje automotriz una C. No está mal, pero podría ser mejor.

Related Posts

Arizona acusa al mercado de predicciones Kalshi de realizar operaciones de pernio ilegales

El fiscal normal de Arizona presentó cargos penales contra el mercado de predicciones Kalshi, acusándolo de actuar un negocio de juegos de azar sin atrevimiento y de ofrecer apuestas ilegales…

La pantalla del Galaxy S26 Extremista está causando sofocación visual a algunos usuarios

TL;DR Varios usuarios del Galaxy S26 Extremista informan sofocación visual, dolores de individuo y mareos a posteriori de usar la pantalla del teléfono. Los informes abarcan varios hilos de Reddit,…

You Missed

El compromiso organizacional exige reciprocidad

El compromiso organizacional exige reciprocidad

¿Si tienes el viejo ejército del mundo, por qué pides ayuda?

¿Si tienes el viejo ejército del mundo, por qué pides ayuda?

Asiento BHD realiza taller de finanzas digitales para adultos mayores

Asiento BHD realiza taller de finanzas digitales para adultos mayores

Arizona acusa al mercado de predicciones Kalshi de realizar operaciones de pernio ilegales

Arizona acusa al mercado de predicciones Kalshi de realizar operaciones de pernio ilegales

Renuncia director del Centro Antiterrorista y critica a Donald Trump por extirpación con Irán

Renuncia director del Centro Antiterrorista y critica a Donald Trump por extirpación con Irán

Las Diosas se coronan campeonas del softbol femíneo Copa Pescadería Wanda

Las Diosas se coronan campeonas del softbol femíneo Copa Pescadería Wanda