Un nuevo mensaje de Cloudflare afirma que la perplejidad ha estado raspando contenido de los sitios web que han optado por sitiar los raspadores de la web de IA. La compañía dice que los continuos intentos de Perplexity de ocultar su actividad de rastreo han llevado a una confianza disminuida de los sitios web que han optado por no compartir su contenido con compañías de IA como Perplexity.
En Nuevo mensaje compartido en el blog de Cloudflareel proveedor de servicios de red dice que la perplejidad ha estado utilizando sigiloso y modificando sus agentes de usuarios y fuente ASNS para ocultar su actividad de rastreo, así como ignorar o no obtener completamente los archivos robots.txt configurados para estos sitios web.
Ese archivo en particular, para aquellos que no han ejecutado un sitio web, es responsable de transmitir las preferencias del propietario de un sitio web a los bots. Y cedido que la perplejidad supuestamente ha ignorado las preferencias establecidas por los usuarios, Cloudflare dice que ha eliminado a la compañía como un bot verificado y ha anexo medidas adicionales a sus servicios para sitiar los intentos de rastreo sigilosos. Estas acusaciones podrían arrojar una clave a otros planes en curso de compañías de terceros como Samsung, lo que podría acontecer planeado incluir la perplejidad en sus teléfonos inteligentes S26.
Probar las afirmaciones
Cloudflare no solo hace estas acusaciones a ciegas. La compañía dice que realizó una serie de pruebas y experimentos para determinar si la perplejidad en realidad estaba tratando de evitar fuera de los límites establecidos por los propietarios de los diversos sitios web que estaba raspando. Según los hallazgos que compartió el equipo, parece que la perplejidad ha estado descubriendo formas de evitar las preferencias establecidas por los sitios web.
Cloudflare dice que descubrió que cuando se cumplió con el corte, la perplejidad recurrió al uso de un agente de usufructuario no claro destinado a imitar Google Chrome en MacOS. Este rastreador no claro utilizó múltiples direcciones IP que no figuran en el rango IP oficial de Perplexity y girarían a través de esos IP a medida que se encontraba con bloqueos desde el archivo robots.txt para ciertas páginas.
Mientras que un portavoz de perplejidad dijo TechCrunch Que el bot que figura en la imagen compartida internamente del mensaje de investigación no es uno de los suyos, que no ha impedido que Cloudflare se mantenga firme contra sus acusaciones. Esta siquiera es la primera vez que la perplejidad ha sido acusada de raer el contenido sin la autorización adecuada.
Las preocupaciones sobre este posible incumplimiento de la confianza tienen serias implicaciones, ya que los raspadores de la red de IA han estado bajo fuego durante abriles oportuno a las preocupaciones de que plagiarían contenido escrito humano para capacitar a la IA, lo que se beneficia del arduo trabajo de determinado. Y con el navegador Comet de Perplexity en los titulares por último, este tipo de reproche podría incentivar a algunos usuarios para que se aclaren.






