Teleobjetivo dice que superó el examen más difícil de IA. Los críticos dicen que copió a sus vecinos.

Teleobjetivo dice que superó el examen más difícil de IA. Los críticos dicen que copió a sus vecinos.

Comunicaciones por vídeo con teleobjetivola empresa más conocida por sostener conectados a los trabajadores remotos durante la pandemia, anunció la semana pasada que había acabado la puntuación más reincorporación nones registrada en una de las pruebas más exigentes de inteligencia sintético, una afirmación que provocó oleadas de sorpresa, incredulidad y curiosidad genuina en toda la industria de la tecnología.

La empresa con sede en San José dijo que su sistema de inteligencia sintético obtuvo una puntuación 48,1 por ciento en el El postrero examen de la humanidadun punto de narración diseñado por expertos en la materia de todo el mundo para dejar perplejos incluso a los modelos de IA más avanzados. Ese resultado supera al de Google. Géminis 3 Proque ostentaba el récord preparatorio del 45,8 por ciento.

"Teleobjetivo ha acabado un nuevo resultado de vanguardia en el desafiante punto de narración completo del postrero examen de la Humanidad, con una puntuación del 48,1 %, lo que representa una restablecimiento sustancial del 2,3 % con respecto al resultado preparatorio de SOTA." escribió Xuedong Huang, director de tecnología de Teleobjetivo, en un blog post.

El anuncio plantea una pregunta provocativa que ha consumido a los observadores de IA durante días: ¿Cómo es posible que una empresa de videoconferencias, sin informes públicos de capacitación de grandes modelos lingüísticos, salte repentinamente del pasado? Google, Descubierto AIy antrópico ¿En un punto de narración creado para calcular las fronteras de la inteligencia sintético?

La respuesta revela tanto sobre cerca de dónde se dirige la IA como sobre las propias ambiciones técnicas de Teleobjetivo. Y dependiendo de a quién le preguntes, es una demostración ingeniosa de ingeniería maña o una afirmación vacía que se apropia del crédito por el trabajo de otros.

Cómo Teleobjetivo construyó un compensador de tráfico de IA en motivo de entrenar su propio maniquí

Teleobjetivo no entrenó su propio maniquí de estilo magnate. En motivo de ello, la empresa desarrolló lo que vehemencia un "enfoque de IA federada" – un sistema que dirige consultas a múltiples modelos existentes de OpenAI, Google y Anthropic, y luego utiliza software propietario para optar, combinar y refinar sus resultados.

En el corazón de este sistema se encuentra lo que Teleobjetivo vehemencia su "anotador Z," un mecanismo que evalúa las respuestas de diferentes modelos y elige el mejor para una tarea determinada. La empresa combina esto con lo que describe como un "organización explorar-verificar-federar," un flujo de trabajo agente que equilibra el razonamiento exploratorio con la comprobación en múltiples sistemas de IA.

"Nuestro enfoque federado combina los pequeños modelos de estilo propios de Teleobjetivo con modelos avanzados de código amplio y cerrado," “Huang escribió. El entorno "Fanfarria diversos modelos para crear, desafiar y refinar el razonamiento a través de la colaboración dialéctica."

En términos más simples: Teleobjetivo creó un sofisticado compensador de tráfico para la IA, no la IA en sí.

Esta distinción es enormemente importante en una industria donde el derecho a envalentonarse (y miles de millones en valoración) a menudo dependen de quién puede protestar el maniquí más capaz. Los principales laboratorios de IA gastan cientos de millones de dólares en entrenar sistemas de vanguardia en vastos grupos informáticos. El logro de Teleobjetivo, por el contrario, parece acatar de una integración inteligente de esos sistemas existentes.

Por qué los investigadores de IA están divididos sobre lo que se considera innovación auténtico

La respuesta de la comunidad de IA fue rápida y profundamente dividida.

casco mayorun ingeniero de inteligencia sintético que dice favor entrenado modelos de estilo de última engendramiento, publicó una crítica mordaz en las redes sociales. "Teleobjetivo encadenó llamadas API a Gemini, GPT, Claude et al. y levemente mejorado en un punto de narración que no ofrece ningún valencia para sus clientes," él escribió. "Luego reclaman SOTA."

Rumpf no descartó el enfoque técnico en sí. El uso de múltiples modelos para diferentes tareas, señaló, es "En ingenuidad, es proporcionado inteligente y la mayoría de las aplicaciones deberían hacer esto." Señaló a Sierra, una empresa de servicio al cliente de IA, como ejemplo de esta organización multimodelo ejecutada de forma eficaz.

Su réplica fue más específica: "No entrenaron al maniquí, pero confunden este hecho en el tweet. La injusticia de atribuirse el mérito del trabajo de otros está profundamente arraigada en la concurrencia."

Pero otros observadores vieron el logro de otra guisa. Hongcheng Zhuun desarrollador, ofreció una evaluación más mesurada: "Para pasar una evaluación de IA, lo más probable es que necesites una agrupación de modelos, como lo hizo Teleobjetivo. Una conexión es que todos los competidores de Kaggle saben que hay que reunir modelos para vencer un concurso."

La comparación con Kaggle – la competitiva plataforma de ciencia de datos donde combinar múltiples modelos es una maña normalizado entre los equipos ganadores – replantea el enfoque de Teleobjetivo como una mejor maña de la industria en motivo de un ocio de manos. La investigación académica ha establecido desde hace mucho tiempo que los métodos de conjunto superan asiduamente a los modelos individuales.

Aún así, el debate expuso una descompostura en cómo la industria entiende el progreso. Ryan Preamfundador de Exoria AI, fue desdeñoso: "Teleobjetivo simplemente está creando un arnés más o menos de otro LLM e informándolo. Es sólo ruido." Otro comentarista captó lo inesperado de la comunicación: "Que la aplicación de videoconferencia ZOOM desarrolló un maniquí SOTA que alcanzó un 48% HLE no estaba en mi plástico de bingo."

Quizás la crítica más aguda se refería a las prioridades. Rumpf argumentó que Teleobjetivo podría favor dirigido sus fortuna a los problemas que en realidad enfrentan sus clientes. "La recuperación de transcripciones de llamadas no se “resuelve” con SOTA LLM," él escribió. "Supongo que a los usuarios de Teleobjetivo les importaría esto mucho más que HLE."

El fogueado de Microsoft envite su reputación por un tipo diferente de IA

Si el resultado del benchmark de Teleobjetivo parecía surgir de la nadie, su director de tecnología no.

Xuedong Huang se unió a Teleobjetivo procedente de Microsoft, donde pasó décadas desarrollando las capacidades de inteligencia sintético de la empresa. Fundó el asociación de tecnología del acento de Microsoft en 1993 y dirigió equipos que lograron lo que la empresa describió como paridad humana en registro de voz, traducción cibernética, comprensión del estilo natural y visión por computadora.

Huang tiene un doctorado. en ingeniería eléctrica de la Universidad de Edimburgo. Es miembro electo de la Corporación Franquista de Ingeniería y el Corporación Estadounidense de Artes y Cienciasasí como miembro de los dos IEEE y el ACM. Sus credenciales lo colocan entre los ejecutivos de IA más exitosos de la industria.

Su presencia en Teleobjetivo indica que las ambiciones de la compañía en materia de IA son serias, incluso si sus métodos difieren de los de los laboratorios de investigación que dominan los titulares. En su tweet celebrando el resultado del benchmark, Huang enmarcó el logro como una firmeza de la organización de Teleobjetivo: "Hemos desbloqueado capacidades más sólidas en exploración, razonamiento y colaboración multimodelo, superando los límites de rendimiento de cualquier maniquí único."

Esa cláusula final – "Superando los límites de rendimiento de cualquier maniquí." – puede ser el más significativo. Huang no afirma que Teleobjetivo haya construido un maniquí mejor. Afirma que Teleobjetivo construyó un mejor sistema para usar modelos.

Interiormente de la prueba diseñada para desconcertar a las máquinas más inteligentes del mundo

El punto de narración en el centro de esta controversia, El postrero examen de la humanidadfue diseñado para ser excepcionalmente difícil. A diferencia de pruebas anteriores en las que los sistemas de IA aprendieron a pugnar mediante la coincidencia de patrones, HLE presenta problemas que requieren una comprensión genuina, un razonamiento de varios pasos y la síntesis de información en dominios complejos.

El examen se zócalo en preguntas de expertos de todo el mundo, que abarcan campos que van desde matemáticas avanzadas hasta filosofía y conocimientos científicos especializados. Una puntuación del 48,1 por ciento puede parecer poco impresionante para cualquiera que esté acostumbrado a las curvas de calificaciones escolares, pero en el contexto de HLE, representa el techo coetáneo del rendimiento de las máquinas.

"Este punto de narración fue desarrollado por expertos en la materia a nivel mundial y se ha convertido en una métrica crucial para calcular el progreso de la IA cerca de el desempeño a nivel humano en tareas intelectuales desafiantes." Se toma nota del anuncio de Teleobjetivo.

La restablecimiento de la compañía de 2,3 puntos porcentuales sobre el mejor preparatorio de Google puede parecer modesta de forma aislada. Pero en la evaluación comparativa competitiva, donde las ganancias a menudo se producen en fracciones de porcentaje, ese brinco vehemencia la atención.

Lo que revela el enfoque de Teleobjetivo sobre el futuro de la IA empresarial

El enfoque de Teleobjetivo conlleva implicaciones que se extienden mucho más allá de las tablas de clasificación de narración. La compañía está señalando una visión de la IA empresarial que difiere fundamentalmente de las estrategias centradas en modelos seguidas por Descubierto AI, antrópicoy Google.

En motivo de situar todo por construir el maniquí más capaz, Teleobjetivo se está posicionando como una capa de orquestación: una empresa que puede integrar las mejores capacidades de múltiples proveedores y ofrecerlas a través de productos que las empresas ya utilizan todos los días.

Esta organización protege contra una incertidumbre crítica en el mercado de la IA: nadie sabe qué maniquí será mejor el próximo mes, y mucho menos el próximo año. Al construir una infraestructura que puede intercambiarse entre proveedores, Teleobjetivo evita la dependencia de los proveedores y, al mismo tiempo, ofrece teóricamente a los clientes la mejor IA acondicionado para cualquier tarea determinada.

El anuncio de GPT-5.2 de OpenAI el día posterior subrayó esta dinámica. Los propios comunicados de OpenAI nombraban a Teleobjetivo como socio que había evaluado el rendimiento del nuevo maniquí "en todas sus cargas de trabajo de IA y obtuvieron ganancias mensurables en todos los ámbitos." En otras palabras, Teleobjetivo es al mismo tiempo un cliente de los laboratorios de vanguardia y ahora un competidor en sus puntos de narración, utilizando su propia tecnología.

Este acuerdo puede resultar sostenible. Los principales proveedores de modelos tienen todos los incentivos para traicionar ampliamente el paso a API, incluso a empresas que podrían amplificar sus productos. La pregunta más interesante es si las capacidades de orquestación de Teleobjetivo constituyen una propiedad intelectual genuina o simplemente una ingeniería rápida y sofisticada que otros podrían replicar.

La verdadera prueba llega cuando los 300 millones de usuarios de Teleobjetivo empiezan a hacer preguntas

Teleobjetivo tituló su sección de anuncios sobre relaciones industriales "Un futuro colaborativo," y Huang expresó notas de correspondencia en todo momento. "El futuro de la IA es colaborativo, no competitivo." él escribió. "Al combinar las mejores innovaciones de toda la industria con nuestros propios avances en investigación, creamos soluciones que son mayores que la suma de sus partes."

Este entorno posiciona a Teleobjetivo como un integrador benéfico, que reúne el mejor trabajo de la industria en beneficio de los clientes empresariales. Los críticos ven poco más: una empresa que reclama el prestigio de un laboratorio de IA sin realizar la investigación fundamental que lo merece.

El debate probablemente no se resolverá mediante tablas de clasificación sino mediante productos. Cuando Compañero de IA 3.0 Cuando llegue a los cientos de millones de usuarios de Teleobjetivo en los próximos meses, darán su propio veredicto, no sobre puntos de narración de los que nunca han aurícula charlar, sino sobre si el sumario de la reunión en realidad captó lo que importaba, si las acciones tenían sentido, si la IA les ahorró tiempo o lo desperdició.

Al final, la afirmación más provocativa de Teleobjetivo puede no ser que superó un punto de narración. Puede ser el argumento implícito de que en la era de la IA, el mejor maniquí no es el que se construye, sino el que se sabe utilizar.

Related Posts

La táctica de Musk de culpar a los usuarios por las imágenes sexuales de Grok puede encontrarse frustrada por la carta de la UE

Por qué los funcionarios quieren perseguir las plataformas, no los usuarios Los funcionarios “quieren introducir una nueva prohibición de los llamados sistemas ‘nudificadores’ que utilizan IA para crear o manipular…

La próxima tableta reMarkable podría ser más baratura

Kaitlyn Cimino / Autoridad de Android TL;DR Una nueva filtración revela que la próxima tableta de reMarkable se llamará Paper Pure y se dirigirá a un sabido más amplio. Se…

You Missed

La táctica de Musk de culpar a los usuarios por las imágenes sexuales de Grok puede encontrarse frustrada por la carta de la UE

La táctica de Musk de culpar a los usuarios por las imágenes sexuales de Grok puede encontrarse frustrada por la carta de la UE

Realizan recorrido gratuita detección de glaucoma en Cristo Rey

Realizan recorrido gratuita detección de glaucoma en Cristo Rey

Buscan regular uso medios digitales en Honestidad

Buscan regular uso medios digitales en Honestidad

“No permitan que nadie defina su color”

“No permitan que nadie defina su color”

Jochy Santos, el Gran Soberano 2026

Jochy Santos, el Gran Soberano 2026

La próxima tableta reMarkable podría ser más baratura

La próxima tableta reMarkable podría ser más baratura