
Algunas empresas obtienen mejores resultados ajustando modelos grandes a sus evacuación, pero varias empresas planean construir sus propios modelosun tesina que requeriría paso a GPU.
Google Cloud quiere desempeñar un papel más importante en el proceso de creación de modelos de las empresas con su nuevo servicio. Entrenamiento de IA de vértice. El servicio brinda a las empresas que buscan entrenar sus propios modelos paso a un entorno Slurm administrado, herramientas de ciencia de datos y cualquier chip capaz de entrenar modelos a gran escalera.
Con este nuevo servicio, Google Cloud prórroga alejar a más empresas de otros proveedores y fomentar la construcción de modelos de IA más específicos para cada empresa.
Si admisiblemente Google Cloud siempre ha ofrecido la posibilidad de personalizar sus modelos Gemini, el nuevo servicio permite a los clientes traer sus propios modelos o personalizar cualquier maniquí de código campechano que aloje Google Cloud.
Vertex AI Training posiciona a Google Cloud directamente frente a empresas como Tejido central y Laboratorios Lambdaasí como sus competidores en la nubarrón AWS y MicrosoftAzure.
Jaime de Guerre, director senior de trámite de productos en Gloogle Cloud, dijo a VentureBeat que la compañía ha escuchado de muchas organizaciones de diferentes tamaños que necesitan una forma de optimizar mejor la computación pero en un entorno más confiable.
“Lo que estamos viendo es que hay un número cada vez anciano de empresas que están construyendo o personalizando modelos de IA de gran engendramiento para introducir una ofrecimiento de productos basada en esos modelos, o para ayudar a impulsar sus negocios de alguna forma”, dijo de Guerre. “Esto incluye nuevas empresas de inteligencia químico, empresas de tecnología, organizaciones soberanas que crean un maniquí para una región, civilización o idioma en particular y algunas grandes empresas que podrían estar incorporándolo a sus procesos internos”.
De Guerre señaló que, si admisiblemente cualquiera puede técnicamente utilizar el servicio, Google se dirige a empresas que planifican capacitación de modelos a gran escalera en ocupación de simples ajustes o adoptantes de LoRA. Vertex AI Services se centrará en trabajos de formación de anciano duración que abarcarán cientos o incluso miles de chips. El precio dependerá de la cantidad de computación que necesitará la empresa.
“Vertex AI Training no es para asociar más información al contexto o usar RAG; es para entrenar un maniquí en el que se puede comenzar con pesos completamente aleatorios”, dijo.
La personalización de modelos va en aumento
Las empresas están reconociendo el valía de crear modelos personalizados más allá del simple ajuste de un LLM mediante engendramiento aumentada de recuperación (RAG). Los modelos personalizados conocerían información más detallada de la empresa y responderían con respuestas específicas para la estructura. Empresas como Arcee.ai han comenzado ofreciendo sus modelos para personalización a los clientes. Adobe anunció recientemente un nuevo servicio que permite a las empresas retornar a capacitar a Firefly para sus evacuación específicas. Organizaciones como ICOque crean pequeños modelos de jerigonza específico para la industria financieraa menudo compran GPU para entrenarlas a un costo significativo.
Google Cloud dijo que Vertex AI Training se diferencia al ofrecer paso a un conjunto más ancho de chips, servicios para monitorear y cuidar la capacitación y la experiencia que aprendió al entrenar los modelos Gemini.
Algunos de los primeros clientes de Vertex AI Training incluyen AI Singapurun consorcio de institutos de investigación y nuevas empresas de Singapur que construyeron el SEA-LION v4 de 27 mil millones de parámetros, y fuerza de ventasEl equipo de investigación de IA.
Las empresas a menudo tienen que nominar entre tomar un LLM ya creado y perfeccionarlo o crear su propio maniquí. Pero crear un LLM desde cero suele ser inalcanzable para las empresas más pequeñas, o simplemente no tiene sentido para algunos casos de uso. Sin secuestro, para las organizaciones donde tiene sentido un maniquí totalmente personalizado o desde cero, el problema es obtener paso a las GPU necesarias para ejecutar la capacitación.
La formación de modelos puede resultar costosa
Entrenar un maniquí, dijo de Guerre, puede ser difícil y costosoespecialmente cuando las organizaciones compiten con otras por el espacio de GPU.
Los hiperescaladores como AWS y Microsoft (y, sí, Google) han afirmado que sus enormes centros de datos y bastidores y bastidores de chips de suscripción variedad ofrecen el anciano valía a las empresas. No solo tendrán paso a costosas GPU, sino que los proveedores de la nubarrón a menudo ofrecen servicios completos para ayudar a las empresas a suceder a la producción.
Servicios como CoreWeave ganaron prominencia por ofrecer paso bajo demanda a NVIDIA H100, que brinda a los clientes flexibilidad en la potencia informática al crear modelos o aplicaciones. Esto asimismo ha regalado ocupación a un maniquí de negocio en el que las empresas con GPU alquilan espacio en servidores.
De Guerre dijo que Vertex AI Training no se prostitución solo de ofrecer paso a modelos de entrenamiento en computación básica, donde la empresa alquila un servidor GPU; asimismo deben traer su propio software de capacitación y encargar los tiempos y las fallas.
“Este es un entorno Slurm administrado que ayudará con toda la programación de trabajos y la recuperación cibernética de los trabajos que fallan”, dijo de Guerre. “Entonces, si un trabajo de capacitación se ralentiza o se detiene adecuado a una descompostura del hardware, la capacitación se reiniciará automáticamente muy rápidamente, según los puntos de control automáticos que hacemos en la trámite de los puntos de control para continuar con muy poco tiempo de inactividad”.
Añadió que esto proporciona un anciano rendimiento y una capacitación más competente para una escalera anciano de clústeres informáticos.
Servicios como Vertex AI Training podrían proveer que las empresas creen modelos de hornacina o personalicen completamente los modelos existentes. Aún así, el hecho de que exista la opción no significa que sea la adecuada para cada empresa.





