Le Quantum volume est un bon outil pour évaluer la capacité d’une plateforme quantique. Cela consiste à exécuter des circuits carrés toujours plus grands jusqu'à ce que nous atteignons les limitations matérielles.
Ces circuits carrés, par exemple 24x24 ou 30x30, désignant respectivement le nombre de qubits et la profondeur (le nombre de portes quantiques), sont composés de portes sélectionnées aléatoirement parmi Pauli X, Y, Z, Hadamard et des portes à 2 qubits comme CX et CZ. Les circuits, conçus sur Qiskit et Cirq, ont été exécutés sur des configurations locales et sur notre Quantum as a Service sur différentes plateformes hébergées (toujours en statevector avec une double précision flottante).
Comme vous pouvez le constater dans la Figure 2, nos plateformes QaaS sur CPU ont exécuté les algorithmes de 2 à 10 fois plus rapidement que les configurations locales pour les benchmarks à quelques qubits.
De plus, dans le cas des configurations locales, nous rencontrons des limitations pour les circuits carrés à plus de 30 qubits émulés. Cela est dû à la demande excessive de mémoire vive. En revanche, la plateforme QaaS dotée de 512 Go de mémoire nous permet d'étendre jusqu'à 34 qubits en moins de temps qu'une configuration locale de 30 qubits.
Pour aller plus loin, nous avons également testé nos plateformes compatibles GPU. Comme le montre la Figure 3, elles surpassent de loin les plateformes QaaS basées sur CPU: l’exécution d’un circuit de 34 qubits passe de 150 secondes sur notre configuration C64512M à 12 secondes sur notre configuration 8-L80S, offrant ainsi une accélération d’un facteur 12.
De plus, ces plateformes multi-GPU permettent d'atteindre jusqu'à 36 qubits, ce peut s'avérer nécessaire pour faire avancer dans l'exploration de l’informatique quantique. Pour rappel, notre benchmark utilise une double précision flottante, il est donc possible d’avoir un qubit supplémentaire en passant à une précision flottante simple.
Nous avons également effectué quelques tests sur Qsim. Qsim est un simulateur de fonction d'onde écrit en C++. Il utilise la fusion de portes, les instructions vectorielles et le multi-threading OpenMP pour réaliser des simulations de vecteurs d'état de circuits quantiques performantes.
La Figure 4 nous montre des performances vraiment optimales sur les configurations CPU. La performance moyenne est deux fois plus rapide que sur l'émulation Aer et offre un qubit supplémentaire pour la même configuration matérielle.
Pour une exécution encore plus rapide de Qsim, nous fournissons des plateformes GPU optimisées par Nvidia cuQuantum.
Quand nous effectuons des benchmarks sur le backend Exqalibur fait par Quandela, on remarque que nos plateformes accélérées par GPU présentent une accélération substantielle pour une taille de circuit équivalente, prenant moins d'une seconde par rapport à 241 secondes pour Apple M2 ou 695 secondes pour un Intel i7.
Nous remarquons également que, dans les configurations locales, nous rencontrons des limitations en exécutant des circuits avec plus de 11 qubits en raison d'une forte exigence de mémoire. En revanche, notre plateforme accélérée par GPU H100 nous permet d'étendre jusqu'à 31 qubits en 2 heures