Deepseek puede ocurrir usado Géminis de Google para entrenar su extremo maniquí

La semana pasada, el laboratorio chino Deepseek lanzó una traducción actualizada de su maniquí de AI de razonamiento R1 que funciona perfectamente en una serie de puntos de relato de matemáticas y codificación. La compañía no reveló la fuente de los datos que utilizó para capacitar al maniquí, pero algunos investigadores de IA especulan que al menos una porción provenía de la tribu de IA Géminis de Google.

Sam Paeach, un desarrollador con sede en Melbourne que crea evaluaciones de “inteligencia emocional” para la IA, publicó lo que dice es evidencia de que el extremo maniquí de Deepseek fue entrenado en expectativas de Gemini. El maniquí de Deepseek, llamado R1-0528, prefiere palabras y expresiones similares a los favores Gemini 2.5 Pro de Google, dijo Paeach en una publicación X.

Si se pregunta por qué el nuevo Deepseek R1 suena un poco diferente, creo que probablemente cambiaron de entrenamiento en OpenAi sintética a expectativas sintéticas de Géminis. pic.twitter.com/oex9roapnv

– Sam Paech (@sam_paech) 29 de mayo de 2025

Esa no es una pistola humeante. Pero otro desarrollador, el creador seudónimo de una “evaluación de autodeterminación de expresión” para AI llamamiento Speechmap, señaló las huellas del maniquí Deepseek, los “pensamientos” que genera el maniquí mientras funciona con destino a una conclusión, “lea como trazas de Géminis”.

Deepseek ha sido acentuado de capacitar en datos de modelos de IA rivales ayer. En diciembre, los desarrolladores observaron que el maniquí V3 de Deepseek a menudo se identificaba como ChatGPT, la plataforma de chatbot con AI de OpenAI, lo que sugiere que puede ocurrir sido entrenado en los registros de chat de Chatgpt.

A principios de este año, Operai le dijo al Financial Times Encontró evidencia que vincula Deepseek con el uso de la destilación, una técnica para entrenar modelos de IA al extraer datos de los más grandes y más capaces. Según BloombergMicrosoft, un colaborador e inversor de OpenAI cercano, detectó que se exfiltraban grandes cantidades de datos a través de cuentas de desarrolladores de OpenAI a fines de 2024, las cuentas OpenAI creen que están afiliadas a Deepseek.

La destilación no es una maña poco global, pero los términos de servicio de OpenAI prohíben a los clientes usar los resultados maniquí de la compañía para construir IA competitiva.

Para ser claros, muchos modelos identificar erróneamente ellos mismos y converge en las mismas palabras y giros de frases. Eso es porque la web abierta, que es donde las compañías de IA obtienen la maduro parte de sus datos de capacitación, se está convirtiendo en cubierto de basura con ai agua sucia. Las granjas de contenido están utilizando AI para crear clickbaity los bots están inundando Reddit y intríngulis.

Esta “contaminación”, por así decirlo, lo ha hecho asaz difícil Para filtrar a fondo las expectativas de IA de los conjuntos de datos de capacitación.

Aún así, expertos en IA como Nathan Lambert, un investigador del Instituto de Investigación de AI sin fines de ganancia AI2, no piensan que está fuera de la cuestión que Deepseek entrenó en datos de Géminis de Google.

“Si fuera profundo, definitivamente crearía una tonelada de datos sintéticos del mejor maniquí de API”, Lambert escribió En una publicación sobre X. “(Deepseek es) corto en GPU y al ras de efectivo. Es textualmente efectivamente más calculador para ellos”.

Si fuera profundo, definitivamente crearía una tonelada de datos sintéticos del mejor maniquí API que existe. Están cortos en GPU y sonrojes con efectivo. Es textualmente efectivamente más calculador para ellos. Sí, en la pregunta de destilación de Géminis.

– Nathan Lambert (@natolambert) 3 de junio de 2025

En parte en un esfuerzo por organizar la destilación, las compañías de IA han aumentado las medidas de seguridad.

En abril, OpenAi comenzó requerido organizaciones para completar un proceso de demostración de identificación para aceptar a ciertos modelos avanzados. El proceso requiere una identificación emitida por el gobierno de uno de los países respaldados por la API de Operai; China no está en la inventario.

En otros lugares, Google recientemente comenzó a “resumir” los rastros generados por los modelos disponibles a través de su plataforma de desarrollador de estudio de IA, un paso que hace que sea más difícil entrenar modelos rivales performantes en trazas de Géminis. Anthrope en mayo dijo que comenzaría a resumir los rastros de su propio maniquí, citando la escazes de proteger sus “ventajas competitivas”.

Nos comunicamos con Google para hacer comentarios y actualizaremos esta habitación si recibimos telediario.

DeUltimoMinuto

Or check our Popular Categories...

DeUltimoMinuto

Or check our Popular Categories...

Deepseek puede ocurrir usado Géminis de Google para entrenar su extremo maniquí

ztevenreal

Related Posts

Revisión de Samsung Galaxy Buds 4 Pro: la mejor opción para su teléfono Galaxy

¿Canadá necesita IA pública y nacionalizada?

You Missed

Feminicidio-suicidio conmocionan a Comedero, Cotuí

Eddy Alcántara disertará en Argentina sobre los derechos del consumidor turístico

Revisión de Samsung Galaxy Buds 4 Pro: la mejor opción para su teléfono Galaxy

Operativos migratorios dejan 1,089 detenidos y 948 deportados tras acciones coordinadas a nivel franquista

Irán denuncia ataques desde bases de EE.UU. en Oriente Medio

Concesión recíproca: “Él se declaró insuficiente para colmarle sus seguras expectativas”