Bright Data venció a Elon Musk y Meta en la corte: ahora su plataforma de IA de $ 100 millones está asumiendo una gran tecnología


¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora


Datos brillantesla empresa de raspado web israelí que derrotó tanto a la X de Meta y Elon Musk En un tribunal federal, presentó un conjunto integral de infraestructura de IA el miércoles diseñado para aplaudir sistemas de inteligencia fabricado sin restricciones a datos web en tiempo positivo, una capacidad que la compañía argumenta que las grandes plataformas tecnológicas están tratando de monopolizar.

El anuncio de Búsqueda profunda, Navegador.aiy los protocolos de compendio de datos mejorados representan una expansión dramática para la compañía de caducidad, que se ha transformado de un servicio especializado de raspado web en lo que el CEO o Lenchner fuego “una capa de infraestructura única para las compañías de IA”. La medida se produce cuando las compañías de inteligencia fabricado luchan cada vez más por consentir a la información web presente necesaria para impulsar chatbots, agentes autónomos y otras aplicaciones de IA.

“La inteligencia de las LLM de hoy ya no es su número limitante; el acercamiento es”, dijo Lenchner en una entrevista monopolio con VentureBeat. “Hemos pasado la última período luchando por el acercamiento libre a los datos web públicos, y estas nuevas ofertas nos llevan al próximo capítulo de nuestro delirio, uno caracterizado por datos verdaderamente accesibles y el aumento posterior de agentes contextualmente conscientes”.

El emanación sigue los datos brillantes Victorias legales de detención perfil en 2024, cuando los jueces federales desestimaron las demandas de los dos Meta y busilis alegando que la compañía raspó ilegalmente sus plataformas. Esas decisiones establecieron precedentes legales cruciales que definen lo que constituye “datos públicos“En Internet, información que se puede ver sin iniciar sesión y, por lo tanto, se puede compendiar y utilizar legalmente.

Los casos judiciales revelaron que los dos Meta y busilis había sido Datos brillantes Los clientes incluso mientras demandan a la empresa, destacando la postura contradictoria que muchos gigantes tecnológicos han recogido para el raspado web. Las decisiones tienen implicaciones más amplias para la industria de la IA, que depende en gran medida de los datos web para capacitar y especular modelos de idiomas.

“Se reveló en la corte que los dos eran un cliente de datos brillantes, porque todos necesitan datos, todos, especialmente aquellos que están construyendo modelos”, explicó Lenchner. “Somos la única compañía que tiene los bienes financieros, e incluso diría el coraje de hacerlo”.

Sentenciador William Alsupquien presidió el caso X, escribió que dar a las compañías de redes sociales “rienda suelta para atreverse, sobre cualquier pulvínulo, quién puede compendiar y usar datos”, los riesgos de datos crean “monopolios de información que disigan el interés notorio”. El resolución estableció que los datos visibles sin credenciales de inicio de sesión constituyen información pública que se puede raer legalmente.

Los datos brillantes habían presentado previamente un contrarrestar contra xalegando que la plataforma violó las leyes antimonopolio al tratar de crear un monopolio de datos para beneficiar a la compañía AI de Musk, XAI. Sin requisa, ese caso se ha resuelto desde entonces. “Aunque los términos confidenciales, los datos brillantes nunca han retrocedido de su creencia fundamental de que los datos públicos deberían estar disponibles para el notorio. De acuerdo con esa creencia, nos complace informar que los datos brillantes continuarán proporcionando los mismos servicios líderes en la industria que siempre tiene y que nuestros clientes han esperado”, dijo Lenchner.

Búsqueda profunda y navegador. AIA AI AI Empresas que luchan con el acercamiento a los datos

Los nuevos productos de la Compañía abordan lo que Lenchner identifica como los tres requisitos básicos para los sistemas de IA: algoritmos, potencia de cálculo y acercamiento a datos. Mientras Datos brillantes No desarrolla algoritmos de IA ni proporciona bienes informáticos, tiene como objetivo convertirse en la posibilidad definitiva para el tercer requisito.

Búsqueda profunda Funciona como un motor de investigación del verbo natural diseñado para objetar preguntas comerciales complejas de múltiples capas en tiempo positivo. A diferencia de los motores de búsqueda de uso universal o los chatbots de IA que proporcionan resúmenes, la búsqueda profunda se especializa en resultados integrales para consultas que comienzan con “encontrar todo”. Por ejemplo, los usuarios pueden solicitar “todas las compañías navieras que pasaron por los canales de Panamá y Suez en 2023 cuyos ingresos del Q3 disminuyeron en más del 2 por ciento”.

El sistema se zócalo en el archivo web masivo de Bright Data, que actualmente contiene más de 200 mil millones de páginas HTML y agrega 15 mil millones mensuales. Para el próximo año, se calma que el archivo supere las 500 mil millones de páginas. “No son solo páginas web aleatorias, en existencia es lo que le importa al mundo, porque nuestros 20,000 clientes representan miles de millones de usuarios de Internet”, señaló Lenchner.

Navegador.ai Representa lo que la compañía fuego “el primer navegador nativo de AI desbloqueable de la industria”. Diseñado específicamente para agentes de IA autónomos, el servicio basado en la nimbo imita el comportamiento humano para consentir a sitios web sin desencadenar sistemas de detección de bots. Admite comandos de verbo natural y puede realizar interacciones web complejas como reservar vuelos o hacer reservas de restaurantes.

La infraestructura del navegador ya procesa más de 150 millones de acciones web diariamente, según la compañía. “Casi todos son clientes”, dijo Lenchner sobre las compañías de agentes de IA que han recaudado fondos significativos. “Porque lo que descubrimos y descubrimos es que resolvemos ese problema de ingresar a un sitio web sin ser bloqueados y ejecutar acciones web en el sitio web”.

Servidores MCP (Protocolo de contexto del maniquí) proporciona una capa de control de víctima latencia que permite a los agentes de IA que buscan, rastrean y extraen datos en vivo en tiempo positivo. El protocolo permite a los desarrolladores construir sistemas de IA que puedan ejecutar sobre la información presente en oficio de necesitar sólo de los datos de capacitación.

La cartera de patentes y la red proxy crean foso competitivo contra el separación

La delantera competitiva de Bright Data proviene de lo que Lenchner describe como una “obsesión” con la superación de los mecanismos de separación del sitio web. La compañía tiene más de 5,500 reclamos de patentes sobre su tecnología y opera la red proxy más espacioso del mundo con más de 150 millones de direcciones IP en 195 países.

“Tenemos un buen aspecto en Internet”, explicó Lenchner. “Desde hace mucho tiempo, hemos estado mapeando Internet, y durante mucho tiempo, incluso estamos archivando grandes trozos de Internet”.

El enfoque de la compañía implica técnicas sofisticadas para imitar el comportamiento humano, utilizando dispositivos reales, direcciones IP y huellas digitales del navegador en oficio de simples scripts automatizados. Esto hace que la detección y el separación sean extremadamente difícil para los sitios web.

“La única forma de bloquearnos, prácticamente, es dejar los datos detrás del inicio de sesión, entonces ni siquiera lo intentaremos”, dijo Lenchner. “A veces hay una nueva dialéctica de separación que no resolveremos de inmediato. Llevará a nuestro equipo de investigación 12 horas, tres días que son lo mayor que fue, y la desbloquearemos”.

Los ingresos superan los $ 100 millones a medida que la demanda de IA explota luego de ChatGPT

Mientras Datos brillantes sigue siendo privado por una firma de caudal privado, Lenchner confirmó con VentureBeat, los ingresos recurrentes anuales de la compañía superaron los $ 100 millones hace varios abriles. El negocio ha experimentado un crecimiento explosivo desde el emanación de ChatGPT a fines de 2022, ya que las compañías de IA se apresuraron a consentir a los datos de capacitación y la información en tiempo positivo.

“A partir de marzo de 2023, que es más o menos cuando GPT-3 cambió el mundo, la IA o lo que llamamos los datos para la IA, el caso de uso simplemente explotó para nosotros como empresa”, dijo Lenchner. “Todo lo demás incluso está creciendo, porque todos necesitan más datos, período. Pero este caso de uso no se parece a cero que hayamos gastado antaño”.

La compañía atiende a más de 20,000 empresas, incluidas las compañías Fortune 500 y los principales laboratorios de IA. Los clientes tradicionales incluyen plataformas de comercio electrónico que rastrean los precios de los competidores, las empresas de servicios financieros que buscan inteligencia de mercado y empresas que realizan investigaciones comerciales.

El cumplimiento de GDPR y las prácticas éticas se diferencian de los competidores

Datos brillantes ha invertido mucho en la infraestructura de cumplimiento para tocar las preocupaciones de privacidad en torno a la compendio de datos. La compañía sigue GDPR europeo y California CCPA Regulaciones, notificando automáticamente a las personas cuando su información personal se recopila de fuentes públicas y proporciona opciones de aniquilación.

“La regulación y la código son claros ya que el GDPR europeo y al menos las regulaciones de California y CCPA llegaron a juguetear”, explicó Lenchner. “Si recopilamos su dirección de correo electrónico, por ejemplo, le enviaremos automáticamente un correo electrónico diciendo:” Hola, esto es lo que somos. Recopilamos su información personal del dominio notorio. Aquí hay un pitón enorme al que puede hacer clic si desea revisarlo, y obviamente puede pedir que la elimine “.

La compañía mantiene un gran equipo de cumplimiento y una amplia documentación de sus prácticas, lo que resultó valioso durante los procedimientos judiciales. “Las empresas nos amamos especialmente porque tenemos nuestra posición ética que fue examinada en los tribunales de los Estados Unidos dos veces”, dijo Lenchner.

Web Access Wars se intensifica a medida que los gigantes tecnológicos buscan monopolios de datos

La batalla sobre el acercamiento a los datos web refleja tensiones más amplias en la industria de la IA sobre el control de la información y la delantera competitiva. A medida que los sistemas de IA se vuelven más sofisticados, el acercamiento a los datos web actuales y completos se vuelve cada vez más valioso y polémico.

Lenchner predice que la web se “más cerrada” con el tiempo, similar a la forma en que Google mantiene el acercamiento exclusivo a sus capacidades de rastreo web, mientras que otros deben usar servicios alternativos. “Algunos gigantes tecnológicos obtendrán acercamiento gratis a cada sitio web con sus agentes”, dijo. “El resto deberá usar nuestra infraestructura o la infraestructura de otra persona”.

La compañía incluso está observando nuevas tendencias, incluidas las empresas que raspan los chatbots de IA para fines de marketing y la aparición de nuevos protocolos como MCP que permiten a los agentes de IA interactuar con los servicios web de forma más efectiva.

“Todos estos tipos que consumen cantidades masivas de datos, y todos nosotros los estamos usando, todo va alrededor de la construcción de los cerebros de los robots”, dijo Lenchner. “Está acertadamente que tengas un chatbot que esté hablando con un humano, porque eso es lo que hará un autómata”.

Brains de autómata y la bienes de agentes impulsan la próxima período de crecimiento

La transformación de Bright Data del servicio de raspado web al proveedor de infraestructura de IA refleja las deposición en rápida progreso de la industria de inteligencia fabricado. A medida que las empresas se apresuran a implementar agentes de IA y sistemas autónomos, el acercamiento a datos web en tiempo positivo se vuelve tan crucial como la potencia informática y la sofisticación algorítmica.

Los precedentes legales establecidos a través de las victorias judiciales de Bright Data pueden resultar tan significativas como sus innovaciones técnicas, lo que podría dar forma a la forma en que toda la industria de la IA accede y utiliza información web. Con las principales plataformas tecnológicas que restringen cada vez más el acercamiento a los datos al tiempo que desarrolla simultáneamente sus propios sistemas de IA, los proveedores de infraestructura independientes como los datos brillantes pueden ser esenciales para proseguir el contrapeso competitivo en el ecosistema de IA.

“Somos una empresa de infraestructura”, enfatizó Lenchner. “Somos ingenieros muy talentosos que al punto que van a ninguna parte, solo se sientan con nuestras computadoras y escriben código. Lo estamos haciendo acertadamente. No tenemos intenciones de hacer cero más”.

El Búsqueda profunda Beta se asta el martes para clientes comerciales, con acercamiento notorio en universal arreglado a través de una cinta de calma. Navegador.ai y Servidores MCP ya están disponibles para los clientes empresariales a través de la plataforma existente de Bright Data.


Related Posts

5 proyectos efectos de impresoras 3D que pueden mejorar tu hogar

La impresión 3D a menudo queda relegada a simplemente producir rellenos de plástico para estantes y dragones flexibles, pero fundir filamentos en diferentes formas…

Por qué la obsesión de los juegos de PC con la subtensión de la GPU es una completa pérdida de tiempo

La subtensión de la GPU se ha convertido en el pasatiempo protegido de muchos jugadores entusiastas de PC. Durante primaveras, nos han dicho que un simple subvoltaje reduce drásticamente las…

You Missed

Misil iraní impacta cerca del Monte del Templo en Jerusalén sin dejar heridos, pero sí daños materiales

Misil iraní impacta cerca del Monte del Templo en Jerusalén sin dejar heridos, pero sí daños materiales

5 proyectos efectos de impresoras 3D que pueden mejorar tu hogar

5 proyectos efectos de impresoras 3D que pueden mejorar tu hogar

Lamborghini abrirá su primer concesionario en República Dominicana, según informes

Lamborghini abrirá su primer concesionario en República Dominicana, según informes

Centroamérica siente la crisis en Oriente Medio con el incremento del precio de las gasolinas

Centroamérica siente la crisis en Oriente Medio con el incremento del precio de las gasolinas

77% de planteles públicos sin seguridad en el país

77% de planteles públicos sin seguridad en el país

Santos Badía resalta indigencia de una transformación profunda del sistema educativo

Santos Badía resalta indigencia de una transformación profunda del sistema educativo