Existen innumerables opciones para construir su propio altavoz inteligente, desactivarse de personas como Google y Amazon, pero es difícil pasar el hardware que usan estas compañías. Esas compañías pueden trabajar esencialmente como líderes de pérdidas; La idea es que pueden perder esa traspaso, porque la mayoría de los consumidores gastarán más hacienda en otros productos adentro de su respectivo ecosistema. Una alternativa autohostada puede ser trueque, pero es difícil cumplir con ese nivel de esmalte. Ahí es donde el respiro XMOS XVF3800 con el Xiao ESP32-S3 de Seeed Studio entra.
Para ser claros, esto es no Una tabla que es más trueque que los paquetes completos que ofrecen los principales fabricantes de voz asistentes, pero está cerca. Empaca cuatro micrófonos (en comparación con los seis del Echo), un procesador de audio integrado y el Xiao ESP32-S3, más un interruptor de silencio, un yema de reinicio y 12 LED en la parte posterior que muestran la dirección del audio entrante. Está empachado de funciones, y a $ 60, me da todo lo que necesito para reemplazar mi Amazon Echo para siempre.
Sobre este artículo: Seeed Studio nos envió el respetador XVF3800 con el Xiao ESP32-S3 a los pertenencias de este artículo. La compañía no tenía información sobre su contenido.
El respiro xvf3800 tiene hardware increíble
Está empachado de branquias con buenos componentes
Puede parecer un tablero simple, pero no es muy diferente a lo que encontrarías adentro de los pesos pesados del mundo del asistente de voz de hoy. Tiene un procesador de audio, cuatro micrófonos se extienden uniformemente en los bordes, una antena Wi-Fi (a la que el ESP32 conecta) y dos opciones para el audio: un conector de 3.5 mm o un conector JST PH 2.0 para un altavoz.
Sin requisa, la suerte del software es el ESP32-S3, y es lo que permite la verdadera personalización de este tablero. La variable típico del XVF3800 (es afirmar, sin el ESP32-S3) se puede usar con una computadora sobre USB como un micrófono típico de la caja, pero eso es todo. Cualquier personalización o prueba se apoyo en traer su propio microcontrolador y cablearlo o procesar el micrófono usando una computadora que está conectada a él a través de USB.
El ESP32-S3 viene previamente regido, y la variable específica utilizada aquí tiene un procesador LX7 de doble núcle de 32 bits de 240MHz de 32 bits, 8MB de PSRAM, y admite tanto Wi-Fi (2,4 GHz) como BLE 5.0. Es una de las variantes ESP32 más poderosas que existen, y con los pasadores GPIO expuestos en el tablero, podría adicionar sensores adicionales si lo desea.
Al configurar el XVF3800 para usar el ESP32 a lado, es probable que necesite flashearlo usando DFU. Tiene dos modos: uno para USB y otro para el sonido Inter-IC, igualmente conocido como I2S. Solo uno puede estar activo a la vez, y fuera de la caja, se flasheará para usar el modo USB. Si desea retornar al modo USB a posteriori de configurar I2S (ya que la transferencia de datos está completamente deshabilitada sobre el modo USB de la placa una vez que está gestor I2S), deberá sustentar presionado el yema de silencio mientras lo conecta a su computadora. Esto lo pondrá en modo seguro, donde puede retornar al modo USB.
El chip XVF3800 tiene un montón de funciones relacionadas con el audio que lo convierten en una prosperidad marcada sobre el Respetador litetan buena tabla como esa igualmente puede ser. Tiene rescisión de eco, formadores de haz para rastrear las fuentes de audio, la supresión de ruido y el control inconsciente de ganancias, y todo esto permite un mejor inspección de voz y claridad de audio.
En términos de hardware, esta es una de las mejores soluciones contraseña en mano para un asistente de voz autohospedado que pueda obtener. A medida que entraremos en, con Espíritupuede implementar un asistente de voz basado en el asistente doméstico en cuestión de minutos, conectar un altavoz con el conector de 3.5 mm y comenzará a funcionar de inmediato. Está en el costado más caro, pero usted controla cada aspecto, lo que lo convierte en una inversión que valga la pena para su hogar inteligente.
Una cosa que tengo que preguntarme sobre el diseño es el hecho de que está formado de una forma que sugeriría que podría dejar caer el PCB en un Echo de Amazon existente, pero lamentablemente, no puede. Los tornillos no se alinean, por lo que parece estar formado de esta forma para simplemente simplificar la construcción de su propio dispositivo similar. Ni siquiera es una crítica porque nunca se posicionó como un reemplazo de entrega; Simplemente habría sido perspicaz de ver.
Configuración del XVF3800 con asistente de casa
Y usando Platformio
La documentación, como los otros productos de Seeed Studios, está congruo proporcionadamente hecha. Encontrará ejemplos de código y proyectos completos y desplegables, para que pueda tener una idea de cómo funciona el hardware. En este caso, uno de los proyectos completamente desarrollados que puede implementar es un puerto del asistente de voz desarrollado para el respiro Lite, que en sí mismo es un puerto de la tirada de audiencia previa de voz del asistente doméstico Tirada de audiencia previa de voz de asistente de inicio firmware. En solo unos minutos, tuve un secuaz de voz completamente de trabajo en el asistente de casa, usando el XVF3800.
Esto funciona muy proporcionadamente, y con una salida de audio que va a un altavoz, es un asistente que funciona en la habitación, que he probado y descubrí que es congruo consistente cuando se combina con mi propia tubería de voz en casa usando Whisper y un LLM particular. Los temporizadores están expuestos a Asistente de casa para que puedan mostrarse en otros dispositivos, y todo solo … funciona. Es quimérico.
Traté de implementar poco más interesante, pero no pude hacer que ausencia funcione mientras me desarrollé en Platformio. Quería mostrar un visualizador de espectro de audio en mi PC, usando el XVF3800 como micrófono, pero no pude hacer que funcionara. De hecho, siquiera pude hacer que funcionara el ejemplo de MQTT, que se encuentra en la documentación de estudio Seeed. Pensé que era porque había usado el firmware construido específicamente para el escoma al principio, pero flashear el firmware I2S innovador siquiera hizo ausencia.
Con el código de muestra, mientras se escribiría en mi servidor MQTT, se llenó con 0 bytes a posteriori del encabezado. No estoy seguro de cuál es la causa de esto, ya que los alfileres coinciden con los que se encuentran en el ejemplo de escoma, que hace Trabajo, y regalado que no estoy familiarizado con la implementación de estudio Seeed, estaba perdido cuando se trataba de depurar. Luego intenté ajustar el ejemplo para transmitir a un servidor Python principal que construí en mi PC, pero solo envió títulos de FF, por lo que en algún emplazamiento no puede hacer la conexión entre ESP32 y los micrófonos para extraer datos correctamente.
Tengo la esperanza de poder resolver poco y cubrirlo en un artículo futuro, ya que es claramente posible interactuar con él, regalado que el ejemplo de Esfomo funciona. Sin requisa, en cuanto a por qué el ejemplo oficial no funciona, no estoy efectivamente seguro de por qué, a pesar de producirse mucho tiempo tratando de resolverlo. Tengo algunas inquietudes sobre si la configuración de la escoma se mantendrá actualizada o no, pero para los más expertos técnicamente, debe ser trivial producirse las nuevas características de la tirada de audiencia previa de voz del Asistente de inicio a medida que llegan. Incluso me gusta que pueda controlar los LED si desea anular su comportamiento predeterminado.
Acontecer a la calidad de audio, como puede escuchar en el clip susodicho, xilografía utilizando el XVF3800 en modo USB en mi PC con Windows, suena congruo moderado. No es un micrófono increíble de ninguna forma, pero se me puede entender, y la característica de “enfoque de voz” que mencioné fue superficial por Windows en ingenuidad no cambia cómo aparece el sonido.
Puede imaginar que cualquier maniquí de transcripción de voz a texto moderado será más que capaz de transcribir mi discurso, y cuando se mueve a cinco e incluso a diez metros de distancia, todavía suena claro, simplemente más tranquilo. Esto explica por qué funciona tan proporcionadamente con la escoma, ya que puede entender clara y fácilmente mi discurso.
El respiro xvf3800 es una excelente forma de construir su propio asistente de voz
O simplemente prueba tus propias tuberías de audio
He estado jugando con mucho hardware cuando se negociación de construir un asistente de voz personalizado, y el respiro XVF3800 es uno de los mejores que he usado. Los micrófonos son excelentes y trabajan desde el otro costado de la habitación, y mi maniquí de susurro no he tenido problemas cuando el maniquí de susurro proporciona el audio.
Los LED no son los más avíos para lo que sentiría que sería la mayoría de las configuraciones que usan estas, pero son geniales y pueden mostrar la dirección de la que proviene el audio. Los enfrentamiento bonitos, y es perspicaz ver cuándo reconoce que estoy hablando. A partir de mis pruebas, parece que la reunión parece “ilustrarse” cómo es el sonido ambiental, por lo que solo los “nuevos” ruidos (como departir) hará que se ilumine y apunte en la dirección de la que caldo.
Para darle una idea de esta rescisión, cuando la conecta por primera vez, las luces apuntan en direcciones aleatorias, ya que parece aclimatarse al entorno. Sin requisa, incluso ahora, mientras escribo, apuntan en la dirección de mi escritura, pero no la dirección del ventilador que tengo en lo contrario. Estoy congruo impresionado por la precisión, aunque creo que no es demasiado difícil atinar. Es probable que sea solo una triangulación de los volúmenes de entrada en cada micrófono, siendo el pandeo más detención el más probable que apunte a la fuente, pero sigue siendo congruo colocado.
Como resultado, si está buscando lo más cercano a un enemigo de “eco” que encontrará, esto es probable que esté emparejado con el asistente doméstico. Hay una configuración inventario para usar que puede implementar que solo funcionará, y si para eso lo desea, puede configurarla en minutos. Si desea hacer su propio ampliación y pruebas, igualmente puede, y es probable que me haya perdido poco al hacerlo yo mismo. Probablemente construiré un plan extraño con este dispositivo en el futuro, así que actualizaré este artículo cuando lo haga para explicar cómo lo logré y lo arreglé.
Si quieres tu propio asistente de voz autohostable y quieres poco con un poco más de habilidades que el respetador Lite, esto podría ser lo que estás buscando.





