Cloudflare Agents
Una plataforma de desarrollo integral para construir, desplegar y escalar agentes de IA autónomos. Aprovecha la infraestructura sin …
Una plataforma de desarrollo integral para construir, desplegar y escalar agentes de IA autónomos. Aprovecha la infraestructura sin servidor de Cloudflare para una ejecución duradera, inferencia de LLM eficiente y un modelo de precios de pago por uso rentable, diseñado para cargas de trabajo impredecibles.
Acerca de Sin servidor
Las plataformas sin servidor (Serverless) proporcionan un modelo de desarrollo nativo de la nube que permite a los desarrolladores crear y ejecutar aplicaciones y servicios de IA sin gestionar la infraestructura de servidores subyacente. Estas herramientas operan sobre una base orientada a eventos, ejecutando código en respuesta a disparadores específicos como una llamada a la API o la subida de un archivo. Este enfoque permite a los desarrolladores centrarse únicamente en escribir código para sus modelos de IA y lógica de negocio, mientras que el proveedor de la nube se encarga del aprovisionamiento, escalado y mantenimiento de los servidores. El valor principal reside en su escalabilidad automática y su precio de pago por ejecución, lo que lo hace muy eficiente para cargas de trabajo con tráfico variable, como los puntos de conexión de inferencia de IA.
Características Clave
- Ejecución Orientada a Eventos: El código se ejecuta automáticamente en respuesta a disparadores de varios servicios, como solicitudes HTTP, cambios en la base de datos o subidas de archivos.
- Escalado Automático: La plataforma escala automáticamente la aplicación ejecutando código en paralelo según sea necesario, desde cero hasta miles de solicitudes.
- Infraestructura Gestionada: Elimina la necesidad de gestionar servidores, incluyendo la aplicación de parches, el aprovisionamiento de capacidad y el mantenimiento del sistema operativo.
- Facturación de Pago por Uso: A los usuarios se les cobra solo por el tiempo de cómputo que su código consume realmente, hasta el milisegundo, lo que resulta en ningún costo por tiempo de inactividad.
Casos de Uso
El modelo sin servidor se utiliza ampliamente para construir backends impulsados por IA, pipelines de procesamiento de datos en tiempo real y microservicios. Es particularmente eficaz para desplegar APIs de inferencia de modelos de aprendizaje automático, donde el tráfico puede ser impredecible. Otras aplicaciones comunes incluyen la creación de chatbots, el procesamiento de flujos de datos de sensores de IoT y la automatización de flujos de trabajo de preparación de datos para el entrenamiento de modelos.
Cómo Elegir
Al seleccionar una plataforma sin servidor para IA, considere los lenguajes de programación y frameworks compatibles (p. ej., Python, TensorFlow, PyTorch). Evalúe métricas de rendimiento como los tiempos de arranque en frío (cold start), que pueden afectar la experiencia del usuario. Además, verifique los límites de ejecución, como la duración máxima y la asignación de memoria, para asegurarse de que se ajusten a los requisitos de su modelo. Finalmente, evalúe la integración de la plataforma con otros servicios en la nube, como almacenamiento, bases de datos y plataformas dedicadas de IA/ML.
Sin servidorEscenario de uso
Despliegue de una API de reconocimiento de imágenes en tiempo real
Un desarrollador de aplicaciones móviles necesita añadir una función que identifique objetos en las fotos subidas por los usuarios. En lugar de aprovisionar y gestionar un servidor dedicado, despliega su modelo de visión por computadora preentrenado utilizando una función sin servidor. Se configura una API Gateway para que active esta función cada vez que se envía una nueva imagen mediante POST a un punto de conexión. La función carga el modelo, realiza la inferencia en la imagen y devuelve las etiquetas de los objetos (p. ej., 'gato', 'árbol', 'coche') como una respuesta JSON en menos de un segundo. Este enfoque es muy rentable, ya que solo pagan por los pocos cientos de milisegundos de tiempo de cómputo por foto, y se escala automáticamente para manejar miles de usuarios concurrentes durante las horas pico sin ninguna intervención manual.
Preprocesamiento automatizado de datos para entrenamiento de modelos
Un equipo de ciencia de datos necesita procesar grandes volúmenes de datos brutos antes de que puedan ser utilizados para entrenar modelos de aprendizaje automático. Configuran un flujo de trabajo sin servidor donde la carga de un nuevo archivo CSV a un bucket de almacenamiento en la nube activa automáticamente una función. Esta función lee el archivo, realiza operaciones de limpieza como el manejo de valores faltantes, normaliza las características numéricas y codifica los datos categóricos. Los datos procesados se guardan luego en un bucket diferente, listos para el pipeline de entrenamiento. Esta automatización sin servidor elimina los scripts manuales, asegura una preparación de datos consistente y se escala sin esfuerzo para manejar cientos de archivos entrantes simultáneamente, acelerando significativamente el ciclo de vida de MLOps.
Potenciando un backend de chatbot escalable
Una empresa de servicio al cliente quiere desplegar un chatbot de IA en su sitio web para gestionar consultas comunes. Construyen la lógica del chatbot e integran un modelo de Procesamiento del Lenguaje Natural (PLN) dentro de una función sin servidor. Cada mensaje enviado por un usuario a través del widget de chat del sitio web activa la función mediante una llamada a la API. La función procesa el texto del usuario, determina la intención, consulta una base de conocimientos si es necesario y formula una respuesta. Dado que la carga de trabajo es esporádica —intensa durante el horario comercial y tranquila durante la noche— el modelo sin servidor es ideal. Se escala automáticamente para gestionar miles de conversaciones simultáneas y se reduce a cero cuando está inactivo, asegurando que solo paguen por la interacción activa y no por la capacidad de servidor inactiva.
Análisis de datos de IoT en tiempo real y alertas
Una empresa de tecnología agrícola utiliza miles de sensores de IoT para monitorear la humedad y la temperatura del suelo en vastas tierras de cultivo. Cada sensor envía datos cada minuto a un servicio de IoT en la nube. Este servicio está configurado para activar una función sin servidor por cada nuevo punto de datos recibido. La función ejecuta un pequeño modelo predictivo para verificar anomalías, como una caída repentina de la humedad que indica una posible falla en el sistema de riego. Si se detecta una anomalía, la función envía una alerta inmediata al dispositivo móvil del gerente de la granja a través de un servicio de notificaciones push. Esta arquitectura sin servidor y orientada a eventos permite la ingesta y el análisis de datos a gran escala y en tiempo real a bajo costo, ya que los recursos de cómputo solo se utilizan durante el breve momento en que se procesa cada lectura del sensor.
Disparadores programados para reentrenamiento de modelos
Un ingeniero de MLOps es responsable de mantener actualizado un modelo de detección de fraude con los datos de transacciones más recientes. Configura una función sin servidor para que se ejecute según un horario, por ejemplo, todos los domingos a las 2 a.m. Cuando se activa, la función ejecuta un script que busca en un lago de datos nuevos datos etiquetados de la semana anterior. Si existen suficientes datos nuevos, la función inicia un trabajo de reentrenamiento del modelo en una plataforma de ML dedicada como Amazon SageMaker o Google AI Platform. Al finalizar el trabajo de entrenamiento, otro evento activa la misma función (u otra diferente) para evaluar el rendimiento del nuevo modelo y, si lo aprueba, lo despliega a producción. Esto automatiza todo el ciclo de reentrenamiento sin requerir un servidor en funcionamiento continuo para gestionar la programación.
Transcripción de video y audio bajo demanda
Una empresa de medios necesita generar transcripciones para todo el contenido de video subido a su plataforma. Crean un flujo de trabajo sin servidor donde un nuevo archivo de video subido a un bucket de almacenamiento activa una función. Esta función llama a un servicio de transcripción de IA basado en la nube (como AWS Transcribe o Google Speech-to-Text), pasando la ubicación del archivo de video. El servicio de transcripción procesa el audio de forma asíncrona. Una vez que la transcripción está completa, envía una notificación que activa una segunda función sin servidor. Esta segunda función recupera el texto de la transcripción, lo formatea en un archivo de subtítulos estándar (p. ej., .srt) y lo guarda en el mismo bucket que el video original. Todo este proceso es automatizado, escalable y rentable, ejecutándose solo cuando se agrega nuevo contenido.