Cloudflare Agents
自律型AIエージェントを構築、デプロイ、スケーリングするための包括的な開発者プラットフォームです。Cloudflareのサーバーレスインフラストラクチャを活用し、持続的な実行、効率的なLLM推論、予測不可能なワークロード向けに設計されたコスト効率の高い従量課金制の価格モデルを提供します。
自律型AIエージェントを構築、デプロイ、スケーリングするための包括的な開発者プラットフォームです。Cloudflareのサーバーレスインフラストラクチャを活用し、持続的な実行、効率的なLLM推論、予測不可能なワークロード向けに設計されたコスト効率の高い従量課金制の価格モデルを提供します。
サーバーレスについて
サーバーレスプラットフォームは、開発者が基盤となるサーバーインフラを管理することなく、AIアプリケーションやサービスを構築・実行できるクラウドネイティブな開発モデルを提供します。これらのツールはイベント駆動型で動作し、APIコールやファイルアップロードなどの特定のトリガーに応答してコードを実行します。このアプローチにより、開発者はAIモデルとビジネスロジックのコード記述に集中でき、クラウドプロバイダーがサーバーのプロビジョニング、スケーリング、メンテナンスを担当します。その主な価値は、自動スケーラビリティと実行ごとの課金モデルにあり、AI推論エンドポイントのような変動するトラフィックを持つワークロードに非常に効率的です。
主な機能
- イベント駆動実行:HTTPリクエスト、データベースの変更、ファイルのアップロードなど、様々なサービスからのトリガーに応じてコードが自動的に実行されます。
- 自動スケーリング:プラットフォームは必要に応じてコードを並行して実行し、ゼロから数千のリクエストまでアプリケーションを自動的にスケールします。
- マネージドインフラストラクチャ:パッチ適用、容量プロビジョニング、OSメンテナンスを含むサーバー管理の必要性を排除します。
- 従量課金制:ユーザーはコードが実際に消費した計算時間に対してのみ課金され、ミリ秒単位で計算されるため、アイドル時間に対するコストは発生しません。
利用シーン
サーバーレスは、AIを活用したバックエンド、リアルタイムデータ処理パイプライン、マイクロサービスの構築に広く使用されています。特に、トラフィックが予測不可能な機械学習モデルの推論APIのデプロイに効果的です。その他の一般的なアプリケーションには、チャットボットの作成、IoTセンサーデータストリームの処理、モデルトレーニング用のデータ準備ワークフローの自動化などがあります。
選択のポイント
AI向けのサーバーレスプラットフォームを選択する際は、サポートされているプログラミング言語とフレームワーク(例:Python、TensorFlow、PyTorch)を考慮してください。ユーザーエクスペリエンスに影響を与える可能性があるコールドスタート時間などのパフォーマンスメトリクスを評価します。また、モデルの要件に適合するかどうかを確認するために、最大実行時間やメモリ割り当てなどの実行制限を確認してください。最後に、ストレージ、データベース、専用のAI/MLプラットフォームなど、他のクラウドサービスとの統合性を評価します。
サーバーレス利用シーン
リアルタイム画像認識APIのデプロイ
モバイルアプリ開発者は、ユーザーがアップロードした写真内のオブジェクトを識別する機能を追加する必要があります。専用サーバーをプロビジョニングして管理する代わりに、事前にトレーニングされたコンピュータビジョンモデルをサーバーレス関数を使用してデプロイします。APIゲートウェイは、新しい画像がエンドポイントにPOSTされるたびにこの関数をトリガーするように設定されます。関数はモデルをロードし、画像に対して推論を実行し、オブジェクトのラベル(例:「猫」、「木」、「車」)を1秒未満でJSONレスポンスとして返します。このアプローチは、写真1枚あたり数百ミリ秒の計算時間に対してのみ支払うため、非常にコスト効率が高く、ピーク時には手動介入なしで何千もの同時ユーザーを処理するために自動的にスケールします。
モデルトレーニングのためのデータ前処理の自動化
データサイエンスチームは、機械学習モデルのトレーニングに使用する前に、大量の生データを処理する必要があります。彼らは、新しいCSVファイルがクラウドストレージバケットにアップロードされると自動的に関数をトリガーするサーバーレスワークフローを設定します。この関数はファイルを読み取り、欠損値の処理などのクリーニング操作を実行し、数値特徴を正規化し、カテゴリカルデータをエンコードします。処理されたデータは別のバケットに保存され、トレーニングパイプラインの準備が整います。このサーバーレス自動化により、手動スクリプトが不要になり、一貫したデータ準備が保証され、何百もの受信ファイルを同時に処理するために簡単にスケールアップできるため、MLOpsライフサイクルが大幅に加速されます。
スケーラブルなチャットボットバックエンドの動力源
あるカスタマーサービス会社は、一般的な問い合わせを処理するためにウェブサイトにAIチャットボットを導入したいと考えています。彼らはチャットボットのロジックを構築し、自然言語処理(NLP)モデルをサーバーレス関数内に統合します。ウェブサイトのチャットウィジェットを介してユーザーが送信する各メッセージは、APIコールを介して関数をトリガーします。関数はユーザーのテキストを処理し、意図を判断し、必要に応じてナレッジベースを照会し、応答を作成します。ワークロードは散発的であるため(営業時間中は集中し、夜間は静か)、サーバーレスモデルは理想的です。何千もの同時会話を管理するために自動的にスケールし、非アクティブ時にはゼロにスケールダウンするため、アクティブなエンゲージメントに対してのみ支払い、アイドル状態のサーバー容量には支払わないことが保証されます。
リアルタイムIoTデータ分析とアラート
ある農業技術企業は、広大な農地の土壌水分と温度を監視するために何千ものIoTセンサーを使用しています。各センサーは毎分データをクラウドIoTサービスに送信します。このサービスは、新しいデータポイントが受信されるたびにサーバーレス関数をトリガーするように設定されています。この関数は小さな予測モデルを実行して、灌漑システムの故障の可能性を示す急激な水分低下などの異常をチェックします。異常が検出された場合、関数はプッシュ通知サービスを介して農場管理者のモバイルデバイスに即時アラートを送信します。このイベント駆動型のサーバーレスアーキテクチャにより、各センサーの読み取り値が処理される短い瞬間だけ計算リソースが使用されるため、大規模なリアルタイムのデータ取り込みと分析が低コストで可能になります。
スケジュールされたモデル再トレーニングトリガー
MLOpsエンジニアは、不正検出モデルを最新のトランザクションデータで最新の状態に保つ責任があります。彼らは、例えば毎週日曜日の午前2時など、スケジュールに従って実行されるサーバーレス関数を設定します。トリガーされると、関数は過去1週間の新しいラベル付きデータをデータレイクでチェックするスクリプトを実行します。十分な新しいデータが存在する場合、関数はAmazon SageMakerやGoogle AI Platformなどの専用MLプラットフォームでモデルの再トレーニングジョブを開始します。トレーニングジョブが完了すると、別のイベントが同じ関数(または別の関数)をトリガーして新しいモデルのパフォーマンスを評価し、合格した場合は本番環境にデプロイします。これにより、スケジュールを管理するために継続的に実行されるサーバーを必要とせずに、再トレーニングサイクル全体が自動化されます。
オンデマンドのビデオ・オーディオ文字起こし
あるメディア企業は、プラットフォームにアップロードされたすべてのビデオコンテンツのトランスクリプトを生成する必要があります。彼らは、ストレージバケットに新しいビデオファイルがアップロードされると関数をトリガーするサーバーレスワークフローを作成します。この関数は、クラウドベースのAI文字起こしサービス(AWS TranscribeやGoogle Speech-to-Textなど)を呼び出し、ビデオファイルの場所を渡します。文字起こしサービスは非同期でオーディオを処理します。文字起こしが完了すると、通知が送信され、2番目のサーバーレス関数がトリガーされます。この2番目の関数は、トランスクリプトテキストを取得し、標準の字幕ファイル(.srtなど)にフォーマットし、元のビデオと同じバケットに保存します。このプロセス全体は自動化され、スケーラブルでコスト効率が高く、新しいコンテンツが追加されたときにのみ実行されます。