El cocreador de RSS venablo un nuevo protocolo para la osadía de datos de IA

A raíz del acuerdo de derechos de autor de $ 1.5 mil millones de Anthrope, la industria de la IA está llegando a un acuerdo con su problema de datos de capacitación. Hay Hasta muchos 40 casos pendientes que buscan daños para datos sin osadía, incluido uno que lleva a la fracción de la acoplamiento a los tribunales para Creando imágenes de Superman.

Sin algún tipo de sistema de osadía, las compañías de IA podrían indisponer una avalancha de demandas por derechos de autor que un poco de preocupación Retirará a la industria de forma permanente.

Ahora, un corro de tecnólogos y editores web ha valiente un sistema que permitiría la osadía de datos a gran escalera, siempre que las empresas de IA los lleven. Llamado Positivo Simple Licensing (RSL), el sistema ya está siendo respaldado por principales editores web como Reddit, Quora y Yahoo. La pregunta ahora es si ese impulso será suficiente para arrostrar los principales laboratorios de IA a la mesa de negociación.

Según el cofundador de RSL, Eckart Walther, quien todavía co-creó el normalizado RSS, el objetivo era crear un sistema de licencias de datos de entrenamiento que pudiera medrar en Internet. “Necesitamos tener acuerdos de osadía legibles por máquina para Internet”, dijo Walther a TechCrunch. “Eso es efectivamente lo que RSL resuelve”.

Durante primaveras, grupos como el Allianza de proveedores de conjuntos de datos han estado presionando por prácticas de convento más claras, pero RSL es el primer intento de una infraestructura técnica y judicial que podría hacer que funcione en la habilidad. En el costado técnico, el Protocolo RSL establece términos de licencias específicos que un editor puede establecer para su contenido, ya sea que eso significa que las compañías de IA necesitan una osadía personalizada o para adoptar disposiciones de Creative Commons. Los sitios web participantes incluirán los términos como parte de su archivo “robots.txt” en un formato preestablecido, lo que hace que sea sencillo identificar qué datos caen bajo qué términos.

En el costado judicial, el equipo RSL ha establecido una estructura de licencias colectivas, el RSL Collective, que puede negociar términos y compilar regalías, similar a ASCAP para músicos o MPLC para películas. Como en la música y el cine, el objetivo es dar a los licenciantes un solo punto de contacto para avalar regalías, y proporcionar a los derechistas una forma de establecer términos con docenas de posibles licenciantes a la vez.

Una gran cantidad de editores web ya se han unido al colectivo, incluidos Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis (propietario de Mashable y CNET), Internet Brands (propietario de WebMD), People Inc. y The Daily Beast. Otros, como Fastly, Quora y Adweek, están apoyando el normalizado sin unirse al colectivo.

Evento de TechCrunch

San Francisco
|
27-29 de octubre de 2025

En particular, el colectivo RSL incluye algunos editores que ya tienen ofertas de licencias, especialmente Reddit, que recibe Se estima que $ 60 millones al año de Google para el uso de sus datos de capacitación. No hay falta que impida que las empresas corten sus propios acuerdos adentro del sistema RSL, así como Taylor Swift puede establecer términos especiales para las licencias y al mismo tiempo cosechar regalías a través de ASCAP. Pero para los editores demasiado pequeños para obtener sus propias ofertas, es probable que los términos colectivos de RSL sean la única opción.

Pero si adecuadamente es asaz practicable determinar cuándo se ha reproducido una canción, los modelos de IA plantean desafíos únicos cuando se prostitución de descubrir cuándo se deben las regalías para una estancia específica de datos de entrenamiento. El problema es más simple para un producto como los resúmenes de búsqueda de IA de Google, que extraen datos de la web en tiempo vivo y mantienen una atribución estricta para cada hecho.

Pero si la capacitación no se registra cuando ocurre, puede ser casi inútil confirmar que se ingirió un documento determinado en un LLM. Es particularmente desafiante si los editores solicitan que se les pague por inferencia en espacio de cobrar una tarifa militar, una opción ofrecida por una de las licencias de acciones RSL.

Aún así, los creadores de RSL creen que las compañías de IA podrán cuidar la dificultad. “Algunos de los acuerdos de osadía que ya han hecho han requerido que puedan informar sobre él, por lo que es posible”, dice Doug Leeds, cofundador de RSL y ex CEO de IAC Publishing. “No tiene que ser consumado. Simplemente tiene que ser lo suficientemente bueno como para que la concurrencia pague”.

La pregunta más importante es si las compañías de IA adoptarán el sistema. Como muestra el éxito de compañías como Scaleai y Mercor, Frontier Labs no tiene problemas para avalar los datos, pero la web tradicionalmente se ha pasado como una fuente de datos baratos y de víctima calidad. Con conjuntos de datos como el rastreo popular ya apto, puede ser un desafío extraer regalías de poco que los laboratorios están acostumbrados a obtener de forma gratuita. Y como el nuevo polvo Entre los espectáculos de CloudFlare y la perplejidad, no es sencillo notar la diferencia entre el raspado web y la navegación mejorada por la máquina.

Cuando le hice la pregunta a Leeds, señaló los comentarios recientes de los líderes de IA que pidieron un sistema como RSL, especialmente de Sundar Pichai en la cumbre de Dealbook del año pasado. Ya sea que las llamadas para un sistema de osadía sean sinceros o no, el equipo de RSL planea mantenerlos. “Han dicho externamente a todos, poco así debe existir”, me dijo Leeds. “Necesitamos un protocolo. Necesitamos un sistema”.

Ahora, pueden obtener uno.

Related Posts

Proyectos de ley prohibirían las demandas de responsabilidad por el cambio climático

Un profesor desconocido cita un mensaje de Inside Climate News: Los legisladores republicanos en varios estados y el Congreso están avanzando propuestas para proteger a los contaminadores de la responsabilidad…

Apple anuncia AirPods Max 2 con chip H2, ANC 1,5 veces más potente y traducción en vivo

Apple ha anunciado AirPods Max 2la segunda procreación de sus auriculares supraaurales, impulsados ​​por el chip H2 introducido por primera vez en AirPods Pro 2. Los pedidos se abren el…

You Missed

Proyectos de ley prohibirían las demandas de responsabilidad por el cambio climático

Proyectos de ley prohibirían las demandas de responsabilidad por el cambio climático

Líderes dominicanos en El Bronx apoyan congresista Ritchie Torres para primarias demócratas

Líderes dominicanos en El Bronx apoyan congresista Ritchie Torres para primarias demócratas

Gigantes del Cibao firman a cuatro agentes libres para vigorizar su roster

Gigantes del Cibao firman a cuatro agentes libres para vigorizar su roster

Todo perspicaz para la Tercera Feria Inmobiliaria Banreservas en Estados Unidos

Todo perspicaz para la Tercera Feria Inmobiliaria Banreservas en Estados Unidos

Historiador resalta el papel central de las mujeres en la independencia dominicana durante entrevista en “RD al Descubierto”

Historiador resalta el papel central de las mujeres en la independencia dominicana durante entrevista en “RD al Descubierto”

Apple anuncia AirPods Max 2 con chip H2, ANC 1,5 veces más potente y traducción en vivo

Apple anuncia AirPods Max 2 con chip H2, ANC 1,5 veces más potente y traducción en vivo