Cloudflare Agents
Une plateforme de développement complète pour construire, déployer et mettre à l'échelle des agents IA autonomes. Elle exploite …
Une plateforme de développement complète pour construire, déployer et mettre à l'échelle des agents IA autonomes. Elle exploite l'infrastructure sans serveur de Cloudflare pour une exécution durable, une inférence LLM efficace et un modèle de tarification au paiement à l'usage rentable, conçu pour les charges de travail imprévisibles.
À propos de Sans serveur
Les plateformes sans serveur (Serverless) fournissent un modèle de développement natif du cloud qui permet aux développeurs de créer et d'exécuter des applications et des services d'IA sans gérer l'infrastructure de serveurs sous-jacente. Ces outils fonctionnent sur une base événementielle, exécutant du code en réponse à des déclencheurs spécifiques comme un appel d'API ou le téléchargement d'un fichier. Cette approche permet aux développeurs de se concentrer uniquement sur l'écriture du code pour leurs modèles d'IA et leur logique métier, tandis que le fournisseur de cloud gère l'approvisionnement, la mise à l'échelle et la maintenance des serveurs. La valeur principale réside dans sa scalabilité automatique et sa tarification à l'exécution, ce qui la rend très efficace pour les charges de travail à trafic variable, telles que les points de terminaison d'inférence d'IA.
Fonctionnalités Clés
- Exécution Événementielle : Le code est exécuté automatiquement en réponse à des déclencheurs provenant de divers services, tels que des requêtes HTTP, des modifications de base de données ou des téléchargements de fichiers.
- Mise à l'Échelle Automatique : La plateforme met automatiquement à l'échelle l'application en exécutant le code en parallèle selon les besoins, de zéro à des milliers de requêtes.
- Infrastructure Gérée : Élimine le besoin de gestion des serveurs, y compris l'application de correctifs, l'approvisionnement de capacité et la maintenance du système d'exploitation.
- Facturation à l'Usage : Les utilisateurs ne sont facturés que pour le temps de calcul que leur code consomme réellement, à la milliseconde près, ce qui n'entraîne aucun coût pour le temps d'inactivité.
Cas d'Utilisation
Le sans serveur est largement utilisé pour construire des backends alimentés par l'IA, des pipelines de traitement de données en temps réel et des microservices. Il est particulièrement efficace pour déployer des API d'inférence de modèles d'apprentissage automatique, où le trafic peut être imprévisible. D'autres applications courantes incluent la création de chatbots, le traitement des flux de données de capteurs IoT et l'automatisation des flux de travail de préparation des données pour l'entraînement des modèles.
Comment Choisir
Lors de la sélection d'une plateforme sans serveur pour l'IA, tenez compte des langages de programmation et des frameworks pris en charge (par exemple, Python, TensorFlow, PyTorch). Évaluez les métriques de performance comme les temps de démarrage à froid (cold start), qui peuvent avoir un impact sur l'expérience utilisateur. Vérifiez également les limites d'exécution, telles que la durée maximale et l'allocation de mémoire, pour vous assurer qu'elles correspondent aux exigences de votre modèle. Enfin, évaluez l'intégration de la plateforme avec d'autres services cloud, comme le stockage, les bases de données et les plateformes dédiées à l'IA/ML.
Sans serveurCas d'utilisation
Déploiement d'une API de reconnaissance d'images en temps réel
Un développeur d'applications mobiles doit ajouter une fonctionnalité qui identifie les objets dans les photos téléchargées par les utilisateurs. Au lieu de provisionner et de gérer un serveur dédié, il déploie son modèle de vision par ordinateur pré-entraîné à l'aide d'une fonction sans serveur. Une passerelle API est configurée pour déclencher cette fonction chaque fois qu'une nouvelle image est envoyée via POST à un point de terminaison. La fonction charge le modèle, effectue une inférence sur l'image et renvoie les étiquettes des objets (par exemple, 'chat', 'arbre', 'voiture') sous forme de réponse JSON en moins d'une seconde. Cette approche est très rentable car ils ne paient que pour les quelques centaines de millisecondes de temps de calcul par photo, et elle s'adapte automatiquement pour gérer des milliers d'utilisateurs simultanés pendant les heures de pointe sans aucune intervention manuelle.
Prétraitement automatisé des données pour l'entraînement de modèles
Une équipe de science des données doit traiter de grands volumes de données brutes avant de pouvoir les utiliser pour entraîner des modèles d'apprentissage automatique. Ils mettent en place un flux de travail sans serveur où le téléchargement d'un nouveau fichier CSV dans un compartiment de stockage cloud déclenche automatiquement une fonction. Cette fonction lit le fichier, effectue des opérations de nettoyage comme la gestion des valeurs manquantes, normalise les caractéristiques numériques et encode les données catégorielles. Les données traitées sont ensuite enregistrées dans un compartiment différent, prêtes pour le pipeline d'entraînement. Cette automatisation sans serveur élimine les scripts manuels, assure une préparation cohérente des données et s'adapte sans effort pour traiter des centaines de fichiers entrants simultanément, accélérant considérablement le cycle de vie MLOps.
Alimenter un backend de chatbot évolutif
Une entreprise de service client souhaite déployer un chatbot IA sur son site web pour traiter les requêtes courantes. Ils construisent la logique du chatbot et intègrent un modèle de traitement du langage naturel (NLP) dans une fonction sans serveur. Chaque message envoyé par un utilisateur via le widget de chat du site web déclenche la fonction via un appel API. La fonction traite le texte de l'utilisateur, détermine l'intention, interroge une base de connaissances si nécessaire et formule une réponse. Comme la charge de travail est sporadique — intense pendant les heures de bureau et calme la nuit — le modèle sans serveur est idéal. Il s'adapte automatiquement pour gérer des milliers de conversations simultanées et se réduit à zéro lorsqu'il est inactif, garantissant qu'ils ne paient que pour l'engagement actif et non pour la capacité de serveur inactive.
Analyse de données IoT en temps réel et alertes
Une entreprise de technologie agricole utilise des milliers de capteurs IoT pour surveiller l'humidité du sol et la température sur de vastes terres agricoles. Chaque capteur envoie des données chaque minute à un service IoT cloud. Ce service est configuré pour déclencher une fonction sans serveur pour chaque nouveau point de données reçu. La fonction exécute un petit modèle prédictif pour vérifier les anomalies, comme une baisse soudaine de l'humidité indiquant une défaillance potentielle du système d'irrigation. Si une anomalie est détectée, la fonction envoie une alerte immédiate à l'appareil mobile du gestionnaire de la ferme via un service de notification push. Cette architecture sans serveur et événementielle permet une ingestion et une analyse de données à grande échelle et en temps réel à faible coût, car les ressources de calcul ne sont utilisées que pendant le bref instant où chaque lecture de capteur est traitée.
Déclencheurs de réentraînement de modèle planifiés
Un ingénieur MLOps est chargé de maintenir à jour un modèle de détection de fraude avec les dernières données de transaction. Il configure une fonction sans serveur pour qu'elle s'exécute selon un calendrier, par exemple, tous les dimanches à 2 heures du matin. Lorsqu'elle est déclenchée, la fonction exécute un script qui vérifie dans un lac de données la présence de nouvelles données étiquetées de la semaine précédente. S'il y a suffisamment de nouvelles données, la fonction lance une tâche de réentraînement du modèle sur une plateforme ML dédiée comme Amazon SageMaker ou Google AI Platform. À la fin de la tâche d'entraînement, un autre événement déclenche la même fonction (ou une autre) pour évaluer les performances du nouveau modèle et, s'il est approuvé, le déployer en production. Cela automatise l'ensemble du cycle de réentraînement sans nécessiter un serveur fonctionnant en continu pour gérer la planification.
Transcription vidéo et audio à la demande
Une entreprise de médias doit générer des transcriptions pour tout le contenu vidéo téléchargé sur sa plateforme. Ils créent un flux de travail sans serveur où un nouveau fichier vidéo téléchargé dans un compartiment de stockage déclenche une fonction. Cette fonction appelle un service de transcription IA basé sur le cloud (comme AWS Transcribe ou Google Speech-to-Text), en transmettant l'emplacement du fichier vidéo. Le service de transcription traite l'audio de manière asynchrone. Une fois la transcription terminée, il envoie une notification qui déclenche une deuxième fonction sans serveur. Cette deuxième fonction récupère le texte de la transcription, le formate en un fichier de sous-titres standard (par exemple, .srt) et le sauvegarde dans le même compartiment que la vidéo originale. L'ensemble de ce processus est automatisé, évolutif et rentable, ne s'exécutant que lorsque du nouveau contenu est ajouté.