Pour simplifier les recherches et améliorer votre expérience avec la documentation, nous divisons les documentations consacrées à la 1re génération et à la 2e génération en ensembles distincts.

Quotas

Ce document décrit les limites de quota pour Google Cloud Functions.

Les quotas relatifs à Google Cloud Functions sont divisés en trois catégories :

Limites de ressources

Ces limites concernent la quantité totale de ressources que vos fonctions peuvent consommer.
Limites de durée

Ces limites concernent les durées d'exécution.
Limites de débit

Ces limites concernent la fréquence à laquelle vous pouvez appeler l'API Cloud Functions pour gérer vos fonctions.

Les différents types de limites sont décrits plus en détail ci-dessous. Les différences entre les limites de Cloud Functions (1st gen) et de Cloud Functions (2nd gen) sont indiquées, le cas échéant.

Limites de ressources

Les limites de ressources affectent la quantité totale de ressources que vos fonctions peuvent consommer. Le champ d'application régional est défini par projet, et chaque projet conserve ses propres limites.

Quota	Description	Limite (1re génération)	Limite (2e génération)	Augmentation possible	Champ d'application
Nombre de fonctions	Nombre total de fonctions pouvant être déployées par région	1 000	1 000 moins le nombre de services Cloud Run déployés	Non	Par région
Taille maximale des déploiements	Taille maximale d'un déploiement d'une seule fonction	100 Mo (compressé) pour les sources 500 Mo (non compressé) pour les sources et les modules	N/A	Non	Par fonction
Taille maximale des requêtes HTTP non compressées	Données envoyées aux fonctions HTTP dans une requête HTTP	10 Mo	32 Mo	Non	Par appel
Taille maximale des réponses HTTP non compressées	Données envoyées à partir de fonctions HTTP dans une réponse HTTP	10 Mo	10 Mo pour les réponses en streaming. 32 Mo pour les réponses sans streaming.	Non	Par appel
Taille maximale des événements pour les fonctions basées sur des événements	Données envoyées dans des événements aux fonctions d'arrière-plan	10 Mo	512 Ko pour les événements Eventarc. 10 Mo pour les anciens événements.	Non	Par événement
Mémoire maximale de la fonction	Quantité de mémoire que chaque instance de fonction peut utiliser	8 Gio	32 Gio	Non	Par fonction
Mémoire maximale du projet	Quantité de mémoire, en octets, qu'un projet peut utiliser. Elle est mesurée par la somme totale de mémoire demandée par l'utilisateur pour toutes les instances de fonction sur une période d'une minute.	Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes.	N/A	Oui	Par projet et par région
CPU maximal du projet	Quantité de processeurs, en millièmes de vCPU, qu'un projet peut utiliser. Elle est mesurée par la somme totale de processeur demandé par l'utilisateur pour toutes les instances de fonction sur une période d'une minute.	Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes.	N/A	Oui	Par projet et par région

Limites de durée

Quota	Description	Limite (1re génération)	Limite (2e génération)	Augmentation possible	Champ d'application
Durée maximale de la fonction	Durée maximale d'exécution d'une fonction avant son arrêt automatique	540 secondes	60 minutes pour les fonctions HTTP. 9 minutes pour les fonctions basées sur des événements.	Non	Par appel

Limites de débit

Quota	Description	Limite (1re génération)	Limite (2e génération)	Augmentation possible	Champ d'application
Appels d'API (LECTURE)	Appels pour décrire ou répertorier des fonctions via l'API Cloud Functions	5 000 pour 100 secondes	1 200 pour 60 secondes	Uniquement pour la 1re génération	Par projet (1re génération) par région (2e génération)
Appels d'API (ÉCRITURE)	Appels pour déployer ou supprimer des fonctions via l'API Cloud Functions	80 pour 100 secondes	60 pour 60 secondes	Non¹	Par projet (1re génération) par région (2e génération)
Appels d'API (APPEL)	Appels à l'API d'appel	16 pour 100 secondes	N/A	Non²	Par projet

Évolutivité

Les fonctions Cloud Functions appelées par des requêtes HTTP évoluent rapidement à la hausse pour gérer le trafic entrant, tandis que les fonctions d'arrière-plan s'adaptent plus progressivement. La capacité d'une fonction à évoluer à la hausse est déterminée par plusieurs facteurs, parmi lesquels :

Temps nécessaire pour l'exécution d'une fonction (les fonctions de courte durée pouvant généralement évoluer à la hausse pour traiter plus de requêtes simultanées)
Temps nécessaire à l'initialisation d'une fonction à partir d'un démarrage à froid
Taux d'erreur de la fonction
Facteurs temporaires, tels que la charge régionale et la capacité du centre de données
Votre configuration telle que définie par le nombre minimal d'instances, le nombre maximal d'instances et la simultanéité (simultanéité de 2e génération uniquement).

Les fonctions d'arrière-plan sont soumises à d'autres limites, comme expliqué ci-dessous. Ces limites ne s'appliquent pas aux fonctions HTTP de 1re génération. Le nombre maximal d'instances par défaut pour les fonctions HTTP de 2e génération est de 100, et il peut être augmenté jusqu'à 1 000. Il n'y a pas de nombre maximal d'instances par défaut pour les fonctions HTTP de 1re génération. Pour éviter les événements de scaling illimité avec les fonctions HTTP de 1re génération, nous vous recommandons de définir un nombre maximal, par exemple 3 000.

Quotas supplémentaires pour les fonctions d'arrière-plan

Quota	Description	Limite	Augmentation possible	Champ d'application	Version du produit
Nombre maximal d'appels simultanés	Nombre maximal d'appels simultanés pour une seule fonction Exemple : si le traitement d'un événement prend 100 secondes, la fréquence d'appels sera limitée à 30 par seconde en moyenne.	3 000	Oui	Par fonction	1re génération uniquement
Fréquence maximale d'appels	Fréquence maximale d'événements traités par une seule fonction Exemple : si le traitement d'un événement prend 100 ms, la fréquence d'appels sera limitée à 1 000 par seconde, même si seulement 100 requêtes, en moyenne, sont traitées en parallèle.	1 000 par seconde	Non	Par fonction	1re génération uniquement
Taille maximale des données d'événements simultanés	Taille totale maximale des événements entrants pour des appels simultanés d'une seule fonction Exemple : si la taille des événements est de 1 Mo et que leur traitement prend 10 secondes, le taux moyen sera d'un événement par seconde, car le traitement du 11e événement ne commencera pas tant que celui de l'un des 10 premiers événements ne sera pas terminé.	10 Mo	Non	Par fonction	1re et 2e générations
Débit maximal des événements entrants	Débit maximal des événements entrants vers une seule fonction Exemple : si la taille des événements est de 1 Mo, la fréquence d'appels peut être au maximum de 10 par seconde, même si les fonctions s'exécutent en moins de 100 ms.	10 Mo par seconde	Non	Par fonction	1re et 2e générations

Limite de quota atteinte

Lorsqu'une fonction consomme toute une ressource allouée, la ressource devient indisponible jusqu'à ce que le quota soit renouvelé ou augmenté. Cela peut signifier que votre fonction et toutes les autres présentes dans le même projet ne seront pas opérationnelles d'ici là. Une fonction renvoie un code d'erreur HTTP 500 lorsqu'elle ne peut pas être exécutée en raison du dépassement du quota de l'une des ressources.

Pour augmenter les quotas par défaut indiqués dans ce document, accédez à la page Quotas Cloud Functions et sélectionnez ceux que vous souhaitez modifier. Cliquez sur MODIFIER LES QUOTAS. Si vous y êtes invité, indiquez vos informations utilisateur. Enfin, saisissez une nouvelle limite pour chaque quota sélectionné.