Theorem quiere detener los errores escritos por la IA antaño de su distribución y acaba de recibir 6 millones de dólares para hacerlo

Theorem quiere detener los errores escritos por la IA antaño de su distribución y acaba de recibir 6 millones de dólares para hacerlo

A medida que la inteligencia químico remodela el ampliación de software, una pequeña startup envite a que el próximo gran cuello de botella de la industria no será escribir código, sino fiarse en él.

Teoremauna empresa con sede en San Francisco que surgió de Y Combinator’s Primavera 2025 porción, anunció el martes que ha recaudado 6 millones de dólares en financiación original para construir herramientas automatizadas que verifiquen la exactitud del software generado por IA. Khosla Ventures lideró la ronda, con la décimo de Combinador Y, e14, SAIF, Martín pescadore inversores ángeles, incluidos Blake Borgesson, cofundador de Recursion Pharmaceuticals, y Arthur Breitman, cofundador de la plataforma blockchain Tezos.

La inversión llega en un momento crucial. Asistentes de codificación de IA de empresas como GitHub, Amazonasy Google Ahora generamos miles de millones de líneas de código anualmente. La asimilación empresarial se está acelerando. Pero la capacidad de realizar que el software escrito con IA efectivamente funciona según lo previsto no ha seguido el ritmo, creando lo que los fundadores de Theorem describen como un proceso cada vez más amplio. "brecha de supervisión" que amenaza infraestructuras críticas, desde los sistemas financieros hasta las redes eléctricas.

"Ya estamos allí" dijo Jason Gross, cofundador de Theorem, cuando le preguntamos si el código generado por IA está superando la capacidad de revisión humana. "Si me pidieran que revisara 60.000 líneas de código, no sabría cómo hacerlo."

Por qué la IA escribe código más rápido de lo que los humanos pueden verificarlo

La tecnología central de Theorem combina la comprobación formal (una técnica matemática que demuestra que el software se comporta exactamente como se especifica) con modelos de IA entrenados para producir y realizar pruebas automáticamente. El enfoque transforma un proceso que históricamente requería primaveras de ingeniería a nivel de doctorado en poco que, según la empresa, se puede completar en semanas o incluso días.

La comprobación formal ha existido durante décadas, pero permaneció confinada a las aplicaciones más críticas: sistemas de aviónica, controles de reactores nucleares y protocolos criptográficos. El costo prohibitivo de la técnica (que a menudo requiere ocho líneas de prueba matemática por cada recorrido de código) la hacía poco habilidad para el ampliación de software convencional.

Gross lo sabe de primera mano. Ayer de fundar Theorem, obtuvo su doctorado en el MIT trabajando en investigaciones verificadas. código de criptografía que ahora impulsa el protocolo de seguridad HTTPS protegiendo billones de conexiones a Internet diariamente. Ese tesina, según sus estimaciones, consumió quince años-persona de trabajo.

"Nadie prefiere tener un código incorrecto," dijo bruto. "La comprobación de software simplemente no ha sido económica antaño. Las pruebas solían ser escritas por ingenieros con nivel de doctorado. Ahora, la IA lo escribe todo."

Cómo la comprobación formal detecta los errores que las pruebas tradicionales pasan por detención

El sistema del teorema opera según un principio que Gross fogosidad "Descomposición de prueba fraccionaria." En sitio de probar exhaustivamente todos los comportamientos posibles (computacionalmente inviables para software enredado), la tecnología asigna capital de comprobación proporcionalmente a la importancia de cada componente del código.

El enfoque identificó recientemente un error que pasó desapercibido en las pruebas de Anthropic, la compañía de seguridad de inteligencia químico detrás del chatbot Claude. Gross dijo que la técnica ayuda a los desarrolladores "detecte sus errores ahora sin pagar mucho cálculo."

En una demostración técnica nuevo llamamiento SFBench, Theorem utilizó IA para traducir 1276 problemas de Rocq (un asistente de prueba formal) a Lean (otro habla de comprobación), y luego demostró automáticamente que cada traducción era equivalente al diferente. La empresa estima que un equipo humano habría requerido aproximadamente 2,7 personas-año para completar el mismo trabajo.

"Todos pueden ejecutar agentes en paralelo, pero asimismo podemos ejecutarlos de forma secuencial." Gross explicó, señalando que la obra de Theorem maneja código interdependiente, donde las soluciones se basan entre sí en docenas de archivos, lo que hace tropezar a los agentes de codificación de IA convencionales limitados por ventanas de contexto.

Cómo una empresa convirtió una determinación de 1.500 páginas en 16.000 líneas de código confiable

La startup ya está trabajando con clientes en laboratorios de investigación de inteligencia químico, automatización de diseño electrónico e informática acelerada por GPU. Un estudio de caso ilustra el valía práctico de la tecnología.

Un cliente llegó a Theorem con una determinación PDF de 1500 páginas y una implementación de software heredado plagada de pérdidas de memoria, fallas y otros errores difíciles de alcanzar. Su problema más urgente: mejorar el rendimiento de 10 megabits por segundo a 1 gigabit por segundo (un aumento de 100 veces) sin introducir errores adicionales.

El sistema de Theorem generó 16.000 líneas de código de producción, que el cliente implementó sin siquiera revisarlo manualmente. La confianza provino de una determinación ejecutable compacta (unos pocos cientos de líneas que generalizaban el enorme documento PDF) combinada con un arnés de comprobación de equivalencia que verificaba que la nueva implementación coincidiera con el comportamiento previsto.

"Ahora tienen un analizador de nivel de producción que funciona a 1 Gbps y que pueden implementar con la confianza de que no se pierde información durante el estudio." dijo bruto.

Los riesgos de seguridad que acechan en el software generado por IA para infraestructuras críticas

El anuncio de financiación llega en un momento en que los responsables políticos y los tecnólogos examinan cada vez más la fiabilidad de los sistemas de IA integrados en infraestructuras críticas. El software ya controla los mercados financieros, los dispositivos médicos, las redes de transporte y las redes eléctricas. La IA está acelerando la ligereza con la que evoluciona el software y la facilidad con la que se pueden propagar errores sutiles.

Gross enmarca el desafío en términos de seguridad. Como la IA abarata la búsqueda y explotación de vulnerabilidades, los defensores necesitan lo que él fogosidad "defensa asimétrica" — protección que se amplía sin aumentos proporcionales de capital.

"La seguridad del software es un delicado inmovilidad entre ataque y defensa," dijo. "Con el hackeo de IA, el costo de hackear un sistema está cayendo drásticamente. La única alternativa viable es la defensa asimétrica. Si queremos una alternativa de seguridad de software que pueda durar más de unas pocas generaciones de mejoras de modelos, será mediante comprobación."

Cuando se le preguntó si los reguladores deberían exigir una comprobación formal del código generado por IA en sistemas críticos, Gross ofreció una respuesta persuasivo: "Ahora que la comprobación formal es lo suficientemente permuta, podría considerarse negligencia enfermo no utilizarla para garantías sobre sistemas críticos."

Lo que separa a Theorem de otras empresas emergentes de comprobación de códigos de IA

Theorem ingresa a un mercado donde numerosas empresas emergentes y laboratorios de investigación están explorando la intersección de la IA y la comprobación formal. La diferenciación de la empresa, sostiene Gross, radica en su singular enfoque en ampliar la supervisión del software en sitio de aplicar la comprobación a las matemáticas u otros dominios.

"Nuestras herramientas son bártulos para equipos de ingeniería de sistemas, que trabajan cerca del metal, que necesitan garantías de corrección antaño de fusionar cambios." dijo.

El equipo fundador refleja esa orientación técnica. Gross aporta una profunda experiencia en teoría de lenguajes de programación y un historial de implementación de código verificado en producción a escalera. El cofundador Rajashree Agrawal, ingeniero de investigación de educación mecánico, se centra en entrenar los modelos de IA que impulsan el proceso de comprobación.

"Estamos trabajando en el razonamiento formal del software para que todos puedan supervisar no solo el trabajo de una IA promedio de nivel de ingeniero de software, sino asimismo exprimir las capacidades de una IA de nivel de Linus Torvalds." Dijo Agrawal, haciendo narración al mítico creador de Linux.

La carrera por realizar el código de la IA antaño de que lo controle todo

Teorema planea utilizar los fondos para ampliar su equipo, aumentar los capital informáticos para entrenar modelos de comprobación e ingresar a nuevas industrias, incluidas la robótica, la energía renovable, las criptomonedas y la síntesis de fármacos. La empresa emplea actualmente a cuatro personas.

El surgimiento de la startup indica un cambio en la forma en que los líderes tecnológicos empresariales pueden carecer evaluar las herramientas de codificación de IA. La primera ola de ampliación asistido por IA prometió ganancias de productividad: más código, más rápido. El teorema es suponer a que la próxima ola exigirá poco diferente: una prueba matemática de que la velocidad no se consigue a costa de la seguridad.

Gross plantea lo que está en conjunto en términos claros. Los sistemas de IA están mejorando exponencialmente. Si esa trayectoria se mantiene, cree que la ingeniería de software sobrehumana es forzoso: capaz de diseñar sistemas más complejos que cualquier cosa que los humanos hayan construido en absoluto.

"Y sin una patrimonio de supervisión radicalmente diferente," él dijo, "Terminaremos implementando sistemas que no controlamos."

Las máquinas están escribiendo el código. Ahora determinado tiene que comprobar su trabajo.

Related Posts

¿Cree que la IA puede abonar sus impuestos? El IRS podría no estar de acuerdo

Cole Kan/CNET/Getty Presentación impuestos Es tan doloroso que mucha parentela felizmente le entregaría el trabajo a un androide. en la era de IA generativadonde los chatbots pueden crear un estudio…

Una hermosa computadora portátil que sobresale en casi todo… excepto escribir

Hay tanto que requerir del nuevo XPS 14 de Dell que me resulta difícil platicar de ello sin parecer un fanático total. Su nuevo diseño lo hace increíblemente delgado y…

You Missed

Cuba anuncia retirada de médicos en Jamaica tras cesar cooperación

Cuba anuncia retirada de médicos en Jamaica tras cesar cooperación

Pedernales y Santo Domingo concentran casi 40% de la inversión pública en enero

Pedernales y Santo Domingo concentran casi 40% de la inversión pública en enero

¿Cree que la IA puede abonar sus impuestos? El IRS podría no estar de acuerdo

¿Cree que la IA puede abonar sus impuestos? El IRS podría no estar de acuerdo

Dos mujeres mueren cada día en República Dominicana durante el parto o el obstáculo.

Dos mujeres mueren cada día en República Dominicana durante el parto o el obstáculo.

Clásico Mundial 2026: RD debuta con triunfo sobre Nicaragua – Remolacha

Clásico Mundial 2026: RD debuta con triunfo sobre Nicaragua – Remolacha

Hoy es Día Mundial de los Cereales – Remolacha

Hoy es Día Mundial de los Cereales – Remolacha