Sería una exageración opinar que cualquiera positivamente extraña Cortana en Windows 11, aunque diría que fue al menos una aditamento mucho más interesante que el copilot actualmente. La idea de un asistente de voz adecuado en una PC tenía potencial, se subutilizó severamente con Cortana, y aún más con copiloto. Pero, ¿qué pasaría si pudiera juntar comandos de voz a Windows 11?
De eso se alcahuetería Talk2Windows. Esta aplicación aprovecha el examen de voz para que su PC sea controlable usando solo su voz, y aunque no es perfecta, funciona sorprendentemente acertadamente, haciendo muchas cosas que nunca podría hacer con Cortana. Incluso se combina en algunos principios de acercamiento a la voz, lo que le brinda controles básicos sobre ciertas características del sistema activo y de la aplicación. Hablemos de ello.
Relacionado
En este día hace 10 primaveras, Cortana aterrizó en Windows Phone como asistente digital
Lamentablemente, Cortana reunió mucho Flak posteriormente de su emanación en Windows 10. Al final, Microsoft sacó el enchufe del asistente aparente en 2023
Configurar no es demasiado difícil
Aunque requiere un espacio habitable
Para usar Talk2Windows, deberá instalar un software llamado Serenade, que está diseñado para ayudar a los desarrolladores a codificar su voz en IDES compatibles. Esta es una instalación relativamente alto, ya que presenta modelos de examen de voz, pero de otra modo es proporcionado ligera configurarlo. El proceso auténtico es un poco confuso, ya que se le dan enlaces para instalar complementos, pero en verdad, hacer clic en los enlaces solo abre una página web, y posteriormente de eso puede descartar la pantalla de los complementos para sobrevenir y usar la aplicación.
Lo único que necesita es descargar el repositorio de Talk2Windows desde GitHub, extraer el archivo y ejecutar el setup.ps1 Script en los archivos. Esto agregará los comandos de examen de voz a la biblioteca de Serenade, lo que lo hace para que su PC pueda contestar a las cosas que dice. Para ejecutar el script, querrá iniciar Windows Terminal/PowerShell con privilegios de administrador de antemano, navegar a la carpeta y ejecutar el archivo de esa modo. Es posible que asimismo necesite usar Set -ejecutionPolicy -bypass Para poder ejecutar el script.
Una vez hecho, todo lo que necesitas hacer es configurar Serenade en modo de audición, y te vas a las carreras.
Relacionado
6 scripts de PowerShell para automatizar y acelerar su flujo de trabajo
Cuando trabaja a través de la CLI, ahorra mucho tiempo. Aquí están los scripts de PowerShell para acelerar su flujo de trabajo.
Una biblioteca de comandos sorprendentemente integral
Hay una tonelada que puedes hacer
Al entrar en esto, positivamente esperaba que Talk2Windows no fuera mucho más que un truco con un par de frases reconocidas que no hacen mucho. Estaba casi desencantado al descubrir que estaba muy errado en mi suposición, ya que hay muchas disponibles aquí. Puede pedirle a su PC que bahía aplicaciones y sitios web, preguntar sobre el clima y aún más detalles técnicos como la temperatura flagrante de la CPU en su PC. La tira de frases es positivamente muy larga, e incluso incluye algunos comandos más directos como cerrar una pestaña. La mejor parte es que esto ni siquiera depende del navegador, ya que lo probé con Vivaldi y funcionó.
Por supuesto, cada comando tiene que programarse manualmente, por lo que hay una cantidad finita de cosas que se pueden hacer, pero los desarrolladores han capacitado el soporte de muchas cosas. En términos de aplicaciones, puede brindar cosas como 7-ZIP, CrystalDiskmark, Discord, Firefox o VLC, entre muchos otros, y puede cerrar la aplicación. Incluso admite la instalación de algunas aplicaciones de la tienda de Microsoft, incluidas todas las mencionadas anteriormente, pero asimismo cosas como Opera GX, Visual Studio Code y Spotify.
Para los sitios web, muchos de ellos asimismo son compatibles, incluidos Amazon, Apple, CNN, Discord, PayPal, Wikipedia, etc. Y luego está el comando “Corroborar”, que puede obtener información tanto de su PC como de la web. Puede preguntar sobre las temperaturas de la CPU, la velocidad de Internet, la latencia de ping y más. Incluso están disponibles algunos atajos como pestañas de obstrucción, desplazamiento o teleobjetivo, puede insertar bits específicos de texto o caracteres especiales, etc.
Incluso puede divertirse pidiéndole a su PC que le cuente una broma o le dé una cita aleatoria. Combina la utilidad y la diversión, que es exactamente lo que hubiera querido que Cortana fuera. Al aparición de su vida, se sintió que Cortana solo tenía el hábitat divertido, y luego Copilot parece solo cuidar las acciones más enseres, e incluso entonces, no es ocurrente para eso.
Relacionado
Piper del asistente de inicio acaba de acoger una gran puesta al día para asistentes de voz locales, pero tendrá que esperar para usarlo
Esta será una puesta al día masiva para las personas que dirigen un LLM tópico combinado con asistente de origen.
Una posibilidad más privada
No se necesita procesamiento en bisectriz
Un gran aspecto de esta posibilidad en comparación con Microsoft’s es que ningún de sus datos de voz debe enviarse a Internet. Puede configurar Serenade para ejecutar usando un servidor tópico para que todo el procesamiento se realice en el dispositivo en superficie de usar Internet. Incluso puede hacer que no se envíen datos de voz a Serenade para ayudar a mejorar el examen de audio en el futuro, si desea tener mucho cuidado con su privacidad.
En comparación con el uso de Copilot y Cortana, ese beneficio de privacidad es una delantera muy bienvenida sobre otras soluciones de examen de voz. Adicionalmente, ningún de esos datos se envía a Microsoft en primer superficie, que dependiendo de cuánto confíe en la empresa, podría ser un beneficio.
Relacionado
Deje de usar estas 4 características de Windows si le importa la privacidad
Windows puede ser un sistema activo sólido, pero debe estar aprendiendo sobre el uso de estas características.
Es un poco rígido
Discurso natural? No aquí
El principal problema con la forma en que funciona Talk2Windows es que requiere que hable de una modo rígida. Efectivamente no está programado para manejar el habla natural, por lo que debe murmurar los comandos exactamente en el formato que están diseñados.
Por ejemplo, cuando quería compulsar la temperatura de la CPU, tenía que opinar “compulsar la temperatura de la CPU”, no “compulsar la temperatura de la CPU”. Cualquier frases en las que pueda juntar palabras como esa para un flujo más natural debe recortarse a este tipo de formato roboticizado. Por supuesto, estoy seguro de que esto podría programarse para investigar asimismo las oraciones con esas palabras, pero todo ese trabajo debe hacerse manualmente, y estoy seguro de que no es la anciano prioridad para los desarrolladores en comparación con solo juntar nuevas características. Sin requisa, me encantaría verlo.
Lo que podría ser interesante sería la capacidad de crear sus propias frases o comandos que se puedan investigar. Tal vez no sea la frase completa, pero digamos que desea juntar un sitio web a la tira de sitios web compatibles: sería ocurrente si pudiera editar un archivo para juntar el nombre de un sitio web que se reconocería para ese comando. Puede ser más ligera para los desarrolladores hacer una aparejo que le permita modificar los comandos reconocidos usted mismo que juntar todos esos comandos ellos mismos, por lo que sería ocurrente verlo.
Relacionado
Este complemento de obsidiana regalado convierte mi voz en notas, y todo se ejecuta en mi computadora
Usando el complemento Whisper con su LLM tópico, uso Obsidian para transcribir mis notas de voz y mis archivos de audio para cursar mensajes de texto en mi computadora.
No es para todos, pero es positivamente ocurrente
Incluso el mejor asistente de voz del mundo probablemente no complacería a todos los usuarios de Windows, por lo que sé que no todos estarán interesados en poco como Talk2Windows. Sin requisa, creo que esta es una de las mejores implementaciones de controles de voz hasta ahora en Windows, integrando tantas características que anteriormente han sido parte de soluciones separadas. Tiene un poco de acercamiento a la voz y un poco de Cortana, y el beneficio de la privacidad encima de todo eso.






