Transcribí horas de entrevistas sin conexión utilizando esta útil de código despejado.

Si alguna vez ha intentado transcribir una reproducción de audio, sabrá lo difícil que puede ser. Herramientas en dirección turbias, riesgos de privacidad e intentos fallidos son parte del proceso. Hay formas de transcribir audio sin instalar una aplicación, pero terminarás dedicando mucho tiempo simplemente a encontrar la útil adecuada.

Pero preciso cuando estaba a punto de rendirme y retornar a la opción medieval de escribir todo manualmente, me topé con una útil de código despejado que parecía demasiado buena para ser verdad. Terminé transcribiendo horas de entrevistas sin conexión, sin que mis grabaciones de audio salieran de mi dispositivo, y no perdí ni un centavo por suscripciones o aplicaciones turbias.

La transcripción de IA sin conexión finalmente tiene sentido

Resultados precisos sin cargas, cuentas o dependencias de la abundancia

Buzz ejecutándose en Windows 11.
Yadullah Abidi / MakeUseOf
Crédito: Yadulah Abidi / MakeUseOf

Buzz es una aplicación de escritorio gratuita y de código despejado que lleva el maniquí Whisper de OpenAI directamente a su computadora, sin suscripciones, límites de carga ni preocupaciones de privacidad al remitir entrevistas confidenciales a servidores de terceros. La útil se ejecuta en Windows, macOS y Linux y maneja todo localmente.

En una época en la que incluso el software cardinal exige conectividad constante, Buzz se siente refrescantemente independiente. Descarga los modelos una vez y está vivo para transcribir en cualquier zona: aviones, ubicaciones remotas o simplemente su escritorio sin preocuparse por la estabilidad de Internet.

Principiar asimismo es más ligera de lo que cabría esperar. La instalación la realiza un asistente de configuración, que asimismo instala todas las dependencias de FFmpeg. Simplemente obtenga la última lectura de repositorio oficial de GitHubejecuta el instalador y vivo. Para los usuarios de Mac, incluso hay una lectura mejorada en la App Store con funciones adicionales como reproducción de audio e importaciones de deslizar y soltar. Los usuarios de Windows asimismo pueden usar Winget para instalar Buzz con un solo comando:

winget install ChidiWilliams.Buzz

Más allá de la comodidad, Buzz resuelve un problema crítico para periodistas, investigadores y cualquier persona que maneje audio sensible: la privacidad. Tus grabaciones nunca salen de tu máquina. Ningún término de servicio otorga a las empresas derechos sobre sus datos. No hay preocupaciones sobre las entrevistas confidenciales realizadas en servidores externos.

Este enfoque restringido primero asimismo significa que no hay límites de uso. Puede transcribir fácilmente cientos de horas sin sufragar un centavo ni alcanzar límites arbitrarios. Para autónomos, pequeñas organizaciones o cualquier persona con un presupuesto, esto no es poca cosa.

logotipo de zumbido

SO

Windows, macOS, Linux

Revelador

Chidi Williams

Maniquí de precio

Graciosamente, de código despejado

Buzz es una aplicación de escritorio gratuita y de código despejado que utiliza los modelos Whisper de OpenAI para transcribir y traducir audio localmente, sin remitir sus grabaciones a la abundancia.


Gran potencia, sorprendentemente poca configuración.

Una útil de código despejado que sigue siendo servible en zona de estorbar

Cuando inicie Buzz por primera vez, será recibido con una interfaz minimalista que puede parecer decepcionante al principio. No hay paneles llamativos ni menús complicados, solo una ventana limpia con opciones para transcribir o traducir audio.

El flujo de trabajo en sí es asaz sencillo. Haga clic en Nueva transcripción deslizamiento su archivo de audio o video, seleccione el maniquí y presione ejecutar. Buzz admite prácticamente todos los formatos multimedia populares, por lo que no tienes que preocuparte por convertir tus archivos antiguamente de transcribirlos.

Debajo del capó, Buzz utiliza múltiples implementaciones de Whisper, lo que le permite nominar el maniquí según sus deposición y hardware. Las opciones incluyen:

  • Susurro: La implementación innovador de OpenAI. Preciso pero más sosegado y requiere mucha memoria.
  • Susurro.cpp: Un puerto C++ que es significativamente más rápido y viene con soporte para GPU Vulkan.
  • Susurro más rápido: Una lectura optimizada que ofrece mejoras notables en la velocidad.

La pantalla de selección de maniquí presenta varios tamaños: diminuto, cardinal, pequeño, mediano y magnate. Cada tamaño de maniquí es una compensación entre precisión y consumo de capital. El maniquí diminuto puede funcionar con casi cualquier cosa, pero comete más errores. El maniquí magnate v3 ofrece una precisión casi humana, pero necesita RAM y potencia de procesamiento sustanciales.

Lista de modelos de Buzz.
Yadullah Abidi / MakeUseOf
Crédito: Yadulah Abidi / MakeUseOf

Mis grabaciones de audio se graban principalmente en entornos silenciosos con equipos de audio profesionales. El maniquí mediano funcionó mejor para mí, transcribiendo una reproducción de audio de 45 minutos en aproximadamente 15 minutos en mi computadora portátil Omen Transcend 14 con memoria LPDDR5X de 16 GB y un RTX 4060. La transcripción requirió una impresión ligera, pero Buzz hizo la viejo parte perfectamente.

El procesamiento ocurre en segundo plano con un indicador de progreso que muestra el tiempo restante estimado. Puede poner en culo varios archivos y la aplicación muestra una panorama previa en vivo a medida que transcribe, lo que le permite realizar la calidad sin esperar a que finalice.

Una vez terminado, el visor de transcripciones le permite apañarse en el texto, ajustar la velocidad de reproducción, reproducir segmentos específicos y seguir el audio. Las opciones de exportación incluyen texto sin formato, SRT para subtítulos o VTT para reproductores web.

Es bueno, pero no es mágico.

Comprender los límites de precisión, las deposición de hardware y las compensaciones del mundo auténtico

Ninguna útil de transcripción cibernética es perfecta y Buzz no es una excepción. La precisión de Whisper varía según el idioma, el acento, la calidad del audio y el ruido de fondo. En mi experiencia con entrevistas en inglés claro, Buzz fue preciso la mayoría de las veces. Sin bloqueo, la argot técnica, los nombres propios y la diafonía a menudo requerían correcciones manuales.

Para los idiomas con menos capital de formación, la precisión disminuye notablemente. En mi experiencia con Buzz, el inglés es el único idioma que se puede transcribir de forma confiable, pero eso puede cambiar regalado el vertiginoso ritmo de expansión de la IA. En cualquier caso, es mejor probar con una muestra corta antiguamente de comprometerse con horas de procesamiento.

Primer plano del visor de transcripciones de Buzz.
Yadullah Abidi / MakeUseOf
Crédito: Yadulah Abidi / MakeUseOf

La naturaleza fuera de dirección de Buzz asimismo significa que su hardware determina la velocidad. La compatibilidad con GPU Vulkan ayuda, pero no reemplaza el hardware. Si está ejecutando archivos de una hora a través del software y desea resultados precisos, necesitará una computadora prudente. Mi computadora portátil para juegos con 16 GB de RAM y una GPU dedicada manejaba perfectamente la mayoría de los modelos, pero su kilometraje puede variar.

La interfaz, aunque sencillo, carece del brillo de las alternativas comerciales. Siquiera hay impresión colaborativa integrada, resúmenes impulsados ​​por IA ni sofisticadas herramientas de reutilización. La traducción asimismo requiere configuración adicional con servicios externos como Ollama.

Por posterior, pero no menos importante, la transcripción en tiempo auténtico desde su micrófono funciona pero requiere importantes capital. Dependiendo de su sistema, es posible que no sea tan en tiempo auténtico como sugiere la útil. Los modelos más grandes pueden mostrar fácilmente un retraso de tres a cinco segundos.

Las entrevistas largas no tienen por qué parecer un trabajo

La transcripción sin conexión puede cambiar por completo la forma en que maneja el audio

Buzz se ha convertido ahora en una parte esencial de mi caja de herramientas. La transcripción es ahora un proceso en segundo plano en el que casi nada pienso. La combinación de capacidad fuera de dirección, rentabilidad y transparencia de código despejado es una combinación difícil de aventajar. Puede que el software de código despejado no siempre sea la mejor opción, pero en este caso ciertamente se acerca.

Página de inicio de Turboscribe en una computadora portátil

Finalmente encontré el mejor servicio de transcripción sin cargo

Los probé todos y este efectivamente funciona.

Para los creadores de contenido, investigadores, periodistas o cualquier persona que convierta asiduamente voz en texto, Buzz ofrece capacidades casi de nivel profesional sin el precio de nivel profesional ni compromisos de privacidad. No es sólo una alternativa gratuita a los servicios en la abundancia; suele ser la mejor opción.

La próxima vez que estés mirando horas de audio y una data frontera inminente, evita la frustración de subirlo. Descarga Buzz, elige tu maniquí y deja que tu computadora haga el trabajo mientras tú te concentras en lo que efectivamente importa.

Related Posts

La vulnerabilidad Zombie ZIP permite que el malware comprimido pase tranquilamente por el 95% de las aplicaciones antivirus; las suites de seguridad ignoran felizmente el problema de seguridad

La presente carrera armamentista de ciberseguridad y contramedidas se ha vuelto increíblemente destacamento y complicada. La mayoría de las veces, encontrar un exploit de software o hardware requiere la elaboración…

La secuela de Superman de James Gunn ha apéndice otro héroe popular a sus filas, y es cierto a quien veremos en uno de los proyectos de DCU de este año.

El hombre del mañana ha añadido uno de Linternas‘estrellas en sus filas El Superhombre La secuela comenzará a filmarse a mediados de 2026. Linternas se estrenará este agosto y nos…

You Missed

La civilización del disimulo

La civilización del disimulo

Trump afirma tiene «munición ilimitada» para combatir a Irán | AlMomento.net

Trump afirma tiene «munición ilimitada» para combatir a Irán | AlMomento.net

La vulnerabilidad Zombie ZIP permite que el malware comprimido pase tranquilamente por el 95% de las aplicaciones antivirus; las suites de seguridad ignoran felizmente el problema de seguridad

La vulnerabilidad Zombie ZIP permite que el malware comprimido pase tranquilamente por el 95% de las aplicaciones antivirus; las suites de seguridad ignoran felizmente el problema de seguridad

Hoy inicia la tercera impresión de la feria “Turismo y Atracciones Samaná 2026”

Hoy inicia la tercera impresión de la feria “Turismo y Atracciones Samaná 2026”

El rol de la mujer empresaria en RD | AlMomento.net

El rol de la mujer empresaria en RD | AlMomento.net

Nicole Kidman, Pedro Pascal y Channing Tatum se suman como presentadores en los Óscar

Nicole Kidman, Pedro Pascal y Channing Tatum se suman como presentadores en los Óscar