レート制限とスロットリング
1. API コール制限(最大リクエスト数)
公平な使用を保証し、システムの過負荷を防ぐために、API にはユーザーが 1 分あたりに行えるリクエスト数の制限があります。一般的な制限は次の通りです:
- 一般的な API エンドポイント:1 分あたり 100 リクエスト。
- 敏感なエンドポイント(例:関数作成):1 分あたり 10 リクエスト。
2. レート制限超過の対応(リトライ、バックオフ)
レート制限を超過した場合、サーバーは 429 Too Many Requests
ステータスで応答します。この場合、ユーザーは次のように対処できます:
- リトライ:
指定されたクールダウン期間後にリクエストをリトライする(通常はレスポンスヘッダーにクールダウン時間が含まれます)。 - バックオフ:
短いインターバルでリクエストを繰り返さないよう、リクエスト間隔を徐々に増やす。
3. 過負荷時の対応プロセス
システムが多くの同時リクエストによって過負荷になると、リクエストを一時的に拒否することがあります。この場合、クライアントは次の対応をするべきです:
- リトライ:
短い遅延後にリクエストをリトライする。 - スロットリング:
同時リクエストの数を定義されたレート制限内に保つ。