2.0/_modules/torch/cuda.html



<!DOCTYPE html>
<!--[if IE 8]><html class="no-js lt-ie9" lang="en" > <![endif]-->
<!--[if gt IE 8]><!--> <html class="no-js" lang="en" > <!--<![endif]-->
<head>
  <meta name="robots" content="noindex">
  <meta name="robots" content="noindex">
  <meta charset="utf-8">
  
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  
  <title>torch.cuda &mdash; PyTorch 2.0 documentation</title>
  

    <link rel="canonical" href="https://pytorch.org/docs/stable/_modules/torch/cuda.html"/>
  

  <link rel="stylesheet" href="../../_static/css/theme.css" type="text/css" />
  <!-- <link rel="stylesheet" href="../../_static/pygments.css" type="text/css" /> -->
  <link rel="stylesheet" href="../../_static/pygments.css" type="text/css" />
  <link rel="stylesheet" href="../../_static/css/theme.css" type="text/css" />
  <link rel="stylesheet" href="../../_static/copybutton.css" type="text/css" />
  <link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex@0.10.0-beta/dist/katex.min.css" type="text/css" />
  <link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex@0.13.11/dist/katex.min.css" type="text/css" />
  <link rel="stylesheet" href="../../_static/katex-math.css" type="text/css" />
  <link rel="stylesheet" href="../../_static/sphinx-dropdown.css" type="text/css" />
  <link rel="stylesheet" href="../../_static/panels-bootstrap.min.css" type="text/css" />
  <link rel="stylesheet" href="../../_static/css/jit.css" type="text/css" />
    <link rel="index" title="Index" href="../../genindex.html" />
    <link rel="search" title="Search" href="../../search.html" />


  <!-- Google Analytics -->
  
    <script async src="https://www.googletagmanager.com/gtag/js?id=UA-117752657-2"></script>
    <script>
      window.dataLayer = window.dataLayer || [];
      function gtag(){dataLayer.push(arguments);}
      gtag('js', new Date());

      gtag('config', 'UA-117752657-2');
    </script>
  
  <!-- End Google Analytics -->
  

  <script src="../../_static/js/modernizr.min.js"></script>

  <!-- Preload the theme fonts -->

<link rel="preload" href="../../_static/fonts/FreightSans/freight-sans-book.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="../../_static/fonts/FreightSans/freight-sans-medium.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="../../_static/fonts/IBMPlexMono/IBMPlexMono-Medium.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="../../_static/fonts/FreightSans/freight-sans-bold.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="../../_static/fonts/FreightSans/freight-sans-medium-italic.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="../../_static/fonts/IBMPlexMono/IBMPlexMono-SemiBold.woff2" as="font" type="font/woff2" crossorigin="anonymous">

<!-- Preload the katex fonts -->

<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Math-Italic.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Main-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Main-Bold.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size1-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size4-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size2-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size3-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Caligraphic-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
  <link rel="stylesheet" href="https://use.fontawesome.com/releases/v5.15.2/css/all.css" integrity="sha384-vSIIfh2YWi9wW0r9iZe7RJPrKwp6bG+s9QZMoITbCckVJqGCCRhc+ccxNcdpHuYu" crossorigin="anonymous">
</head>

<div class="container-fluid header-holder tutorials-header" id="header-holder">
  <div class="container">
    <div class="header-container">
      <a class="header-logo" href="https://pytorch.org/" aria-label="PyTorch"></a>

      <div class="main-menu">
        <ul>
          <li>
            <a href="https://pytorch.org/get-started">Get Started</a>
          </li>

          <li>
            <a href="https://pytorch.org/ecosystem">Ecosystem</a>
          </li>

          <li>
            <a href="https://pytorch.org/mobile">Mobile</a>
          </li>

          <li>
            <a href="https://pytorch.org/blog/">Blog</a>
          </li>

          <li>
            <a href="https://pytorch.org/tutorials">Tutorials</a>
          </li>

          <li class="active docs-active">
            <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="resource-option with-down-orange-arrow">
                Docs
              </a>
              <div class="resources-dropdown-menu">
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/docs/stable/index.html">
                  <span class="dropdown-title">PyTorch</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/audio/stable/index.html">
                  <span class="dropdown-title">torchaudio</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/text/stable/index.html">
                  <span class="dropdown-title">torchtext</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/vision/stable/index.html">
                  <span class="dropdown-title">torchvision</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/torcharrow">
                  <span class="dropdown-title">torcharrow</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/data">
                  <span class="dropdown-title">TorchData</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/torchrec">
                  <span class="dropdown-title">TorchRec</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/serve/">
                  <span class="dropdown-title">TorchServe</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/torchx/">
                  <span class="dropdown-title">TorchX</span>
                  <p></p>
                </a>
                <a class="doc-dropdown-option nav-dropdown-item" href="https://pytorch.org/xla">
                  <span class="dropdown-title">PyTorch on XLA Devices</span>
                  <p></p>
                </a>
            </div>
          </li>

          <li>
            <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="resource-option with-down-arrow">
                Resources
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/features">
                  <span class="dropdown-title">About</span>
                  <p>Learn about PyTorch’s features and capabilities</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/foundation">
                  <span class="dropdown-title">PyTorch Foundation</span>
                  <p>Learn about the PyTorch foundation</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/#community-module">
                  <span class="dropdown-title">Community</span>
                  <p>Join the PyTorch developer community to contribute, learn, and get your questions answered.</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/community-stories">
                  <span class="dropdown-title">Community Stories</span>
                  <p>Learn how our community solves real, everyday machine learning problems with PyTorch.</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/resources">
                  <span class="dropdown-title">Developer Resources</span>
                  <p>Find resources and get questions answered</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/events">
                  <span class="dropdown-title">Events</span>
                  <p>Find events, webinars, and podcasts</p>
                </a>
                <a class="nav-dropdown-item" href="https://discuss.pytorch.org/" target="_blank">
                  <span class="dropdown-title">Forums</span>
                  <p>A place to discuss PyTorch code, issues, install, research</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/hub">
                  <span class="dropdown-title">Models (Beta)</span>
                  <p>Discover, publish, and reuse pre-trained models</p>
                </a>
              </div>
            </div>
          </li>

          <li>
            <a href="https://github.com/pytorch/pytorch">GitHub</a>
          </li>
        </ul>
      </div>

      <a class="main-menu-open-button" href="#" data-behavior="open-mobile-menu"></a>
    </div>
  </div>
</div>

<body class="pytorch-body">

   
    <div class="table-of-contents-link-wrapper">
      <span>Table of Contents</span>
      <a href="#" class="toggle-table-of-contents" data-behavior="toggle-table-of-contents"></a>
    </div>

    <nav data-toggle="wy-nav-shift" class="pytorch-left-menu" id="pytorch-left-menu">
      <div class="pytorch-side-scroll">
        <div class="pytorch-menu pytorch-menu-vertical" data-spy="affix" role="navigation" aria-label="main navigation">
          <div class="pytorch-left-menu-search">
            
    <div class="version">
      <a href='https://pytorch.org/docs/versions.html'>2.0 &#x25BC</a>
    </div>
    

<div role="search">
  <form id="rtd-search-form" class="wy-form" action="../../search.html" method="get">
    <input type="text" name="q" placeholder="Search Docs" />
    <input type="hidden" name="check_keywords" value="yes" />
    <input type="hidden" name="area" value="default" />
  </form>
</div>

          </div>

          
              <p class="caption" role="heading"><span class="caption-text">Community</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="../../community/build_ci_governance.html">PyTorch Governance | Build + CI</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../community/contribution_guide.html">PyTorch Contribution Guide</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../community/design.html">PyTorch Design Philosophy</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../community/governance.html">PyTorch Governance | Mechanics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../community/persons_of_interest.html">PyTorch Governance | Maintainers</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Developer Notes</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="../../notes/amp_examples.html">CUDA Automatic Mixed Precision examples</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/autograd.html">Autograd mechanics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/broadcasting.html">Broadcasting semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/cpu_threading_torchscript_inference.html">CPU threading and TorchScript inference</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/cuda.html">CUDA semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/ddp.html">Distributed Data Parallel</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/extending.html">Extending PyTorch</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/extending.func.html">Extending torch.func with autograd.Function</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/faq.html">Frequently Asked Questions</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/gradcheck.html">Gradcheck mechanics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/hip.html">HIP (ROCm) semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/large_scale_deployments.html">Features for large-scale deployments</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/modules.html">Modules</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/mps.html">MPS backend</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/multiprocessing.html">Multiprocessing best practices</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/numerical_accuracy.html">Numerical accuracy</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/randomness.html">Reproducibility</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/serialization.html">Serialization semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../notes/windows.html">Windows FAQ</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">torch.compile</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/index.html">TorchDynamo Overview</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/installation.html">Installing TorchDynamo</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/get-started.html">Getting Started</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/guards-overview.html">Guards Overview</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/custom-backends.html">Custom Backends</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/deep-dive.html">TorchDynamo Deeper Dive</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/troubleshooting.html">TorchDynamo Troubleshooting</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dynamo/faq.html">Frequently Asked Questions</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../ir.html">IRs</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Language Bindings</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="../../cpp_index.html">C++</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/javadoc/">Javadoc</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../deploy.html">torch::deploy</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Python API</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="../../torch.html">torch</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../nn.html">torch.nn</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../nn.functional.html">torch.nn.functional</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../tensors.html">torch.Tensor</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../tensor_attributes.html">Tensor Attributes</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../tensor_view.html">Tensor Views</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../amp.html">torch.amp</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../autograd.html">torch.autograd</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../library.html">torch.library</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../cuda.html">torch.cuda</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../mps.html">torch.mps</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../backends.html">torch.backends</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributed.html">torch.distributed</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributed.algorithms.join.html">torch.distributed.algorithms.join</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributed.elastic.html">torch.distributed.elastic</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../fsdp.html">torch.distributed.fsdp</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributed.optim.html">torch.distributed.optim</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributed.tensor.parallel.html">torch.distributed.tensor.parallel</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributed.checkpoint.html">torch.distributed.checkpoint</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../distributions.html">torch.distributions</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../_dynamo.html">torch._dynamo</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../fft.html">torch.fft</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../func.html">torch.func</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../futures.html">torch.futures</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../fx.html">torch.fx</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../hub.html">torch.hub</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../jit.html">torch.jit</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../linalg.html">torch.linalg</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../monitor.html">torch.monitor</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../signal.html">torch.signal</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../special.html">torch.special</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../torch.overrides.html">torch.overrides</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../package.html">torch.package</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../profiler.html">torch.profiler</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../nn.init.html">torch.nn.init</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../onnx.html">torch.onnx</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../onnx_diagnostics.html">torch.onnx diagnostics</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../optim.html">torch.optim</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../complex_numbers.html">Complex Numbers</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../ddp_comm_hooks.html">DDP Communication Hooks</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../pipeline.html">Pipeline Parallelism</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../quantization.html">Quantization</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../rpc.html">Distributed RPC Framework</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../random.html">torch.random</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../masked.html">torch.masked</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../nested.html">torch.nested</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../sparse.html">torch.sparse</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../storage.html">torch.Storage</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../testing.html">torch.testing</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../benchmark_utils.html">torch.utils.benchmark</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../bottleneck.html">torch.utils.bottleneck</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../checkpoint.html">torch.utils.checkpoint</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../cpp_extension.html">torch.utils.cpp_extension</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../data.html">torch.utils.data</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../jit_utils.html">torch.utils.jit</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../dlpack.html">torch.utils.dlpack</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../mobile_optimizer.html">torch.utils.mobile_optimizer</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../model_zoo.html">torch.utils.model_zoo</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../tensorboard.html">torch.utils.tensorboard</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../type_info.html">Type Info</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../named_tensor.html">Named Tensors</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../name_inference.html">Named Tensors operator coverage</a></li>
<li class="toctree-l1"><a class="reference internal" href="../../config_mod.html">torch.__config__</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Libraries</span></p>
<ul>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/audio/stable">torchaudio</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/data">TorchData</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/torchrec">TorchRec</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/serve">TorchServe</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/text/stable">torchtext</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/vision/stable">torchvision</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/xla/">PyTorch on XLA Devices</a></li>
</ul>

            
        </div>
      </div>
    </nav>

    <div class="pytorch-container">
      <div class="pytorch-page-level-bar" id="pytorch-page-level-bar">
        <div class="pytorch-breadcrumbs-wrapper">
          

<div role="navigation" aria-label="breadcrumbs navigation">

  <ul class="pytorch-breadcrumbs">
    
      <li>
        <a href="../../index.html">
          
            Docs
          
        </a> &gt;
      </li>

        
          <li><a href="../index.html">Module code</a> &gt;</li>
        
          <li><a href="../torch.html">torch</a> &gt;</li>
        
      <li>torch.cuda</li>
    
    
      <li class="pytorch-breadcrumbs-aside">
        
      </li>
    
  </ul>

  
</div>
        </div>

        <div class="pytorch-shortcuts-wrapper" id="pytorch-shortcuts-wrapper">
          Shortcuts
        </div>
      </div>

      <section data-toggle="wy-nav-shift" id="pytorch-content-wrap" class="pytorch-content-wrap">
        <div class="pytorch-content-left">

        
          <div class="rst-content">
          
            <div role="main" class="main-content" itemscope="itemscope" itemtype="http://schema.org/Article">
             <article itemprop="articleBody" id="pytorch-article" class="pytorch-article">
              
  <h1>Source code for torch.cuda</h1><div class="highlight"><pre>
<span></span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
<span class="sd">This package adds support for CUDA tensor types, that implement the same</span>
<span class="sd">function as CPU tensors, but they utilize GPUs for computation.</span>

<span class="sd">It is lazily initialized, so you can always import it, and use</span>
<span class="sd">:func:`is_available()` to determine if your system supports CUDA.</span>

<span class="sd">:ref:`cuda-semantics` has more details about working with CUDA.</span>
<span class="sd">&quot;&quot;&quot;</span>

<span class="kn">import</span> <span class="nn">contextlib</span>
<span class="kn">import</span> <span class="nn">os</span>
<span class="kn">import</span> <span class="nn">torch</span>
<span class="kn">from</span> <span class="nn">torch.types</span> <span class="kn">import</span> <span class="n">Device</span>
<span class="kn">import</span> <span class="nn">traceback</span>
<span class="kn">import</span> <span class="nn">warnings</span>
<span class="kn">import</span> <span class="nn">threading</span>
<span class="kn">from</span> <span class="nn">functools</span> <span class="kn">import</span> <span class="n">lru_cache</span>
<span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span><span class="p">,</span> <span class="n">List</span><span class="p">,</span> <span class="n">Optional</span><span class="p">,</span> <span class="n">Tuple</span><span class="p">,</span> <span class="n">Union</span><span class="p">,</span> <span class="n">cast</span>
<span class="kn">from</span> <span class="nn">._utils</span> <span class="kn">import</span> <span class="n">_get_device_index</span><span class="p">,</span> <span class="n">_dummy_type</span>
<span class="kn">from</span> <span class="nn">.._utils</span> <span class="kn">import</span> <span class="n">classproperty</span>
<span class="kn">from</span> <span class="nn">.graphs</span> <span class="kn">import</span> <span class="n">CUDAGraph</span><span class="p">,</span> <span class="n">graph_pool_handle</span><span class="p">,</span> <span class="n">graph</span><span class="p">,</span> \
    <span class="n">make_graphed_callables</span><span class="p">,</span> <span class="n">is_current_stream_capturing</span>
<span class="kn">from</span> <span class="nn">.streams</span> <span class="kn">import</span> <span class="n">ExternalStream</span><span class="p">,</span> <span class="n">Stream</span><span class="p">,</span> <span class="n">Event</span>
<span class="kn">from</span> <span class="nn">..</span> <span class="kn">import</span> <span class="n">device</span> <span class="k">as</span> <span class="n">_device</span>
<span class="kn">import</span> <span class="nn">torch._C</span>

<span class="k">try</span><span class="p">:</span>
    <span class="kn">from</span> <span class="nn">torch._C</span> <span class="kn">import</span> <span class="n">_cudart</span>  <span class="c1"># type: ignore[attr-defined]</span>
<span class="k">except</span> <span class="ne">ImportError</span><span class="p">:</span>
    <span class="n">_cudart</span> <span class="o">=</span> <span class="kc">None</span>

<span class="n">_initialized</span> <span class="o">=</span> <span class="kc">False</span>
<span class="n">_tls</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">local</span><span class="p">()</span>
<span class="n">_initialization_lock</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Lock</span><span class="p">()</span>
<span class="n">_queued_calls</span> <span class="o">=</span> <span class="p">[]</span>  <span class="c1"># don&#39;t invoke these until initialization occurs</span>
<span class="n">_is_in_bad_fork</span> <span class="o">=</span> <span class="nb">getattr</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="p">,</span> <span class="s2">&quot;_cuda_isInBadFork&quot;</span><span class="p">,</span> <span class="k">lambda</span><span class="p">:</span> <span class="kc">False</span><span class="p">)</span>
<span class="n">_device_t</span> <span class="o">=</span> <span class="n">Union</span><span class="p">[</span><span class="n">_device</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="kc">None</span><span class="p">]</span>


<span class="k">class</span> <span class="nc">_LazySeedTracker</span><span class="p">:</span>
    <span class="c1"># Since seeding is memory-less, only track the latest seed.</span>
    <span class="c1"># Note: `manual_seed_all` followed by `manual_seed` overwrites</span>
    <span class="c1"># the seed on current device. We track the order of **latest**</span>
    <span class="c1"># calls between these two API.</span>
    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_all_cb</span> <span class="o">=</span> <span class="kc">None</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_cb</span> <span class="o">=</span> <span class="kc">None</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">call_order</span> <span class="o">=</span> <span class="p">[]</span>

    <span class="k">def</span> <span class="nf">queue_seed_all</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cb</span><span class="p">,</span> <span class="n">traceback</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_all_cb</span> <span class="o">=</span> <span class="p">(</span><span class="n">cb</span><span class="p">,</span> <span class="n">traceback</span><span class="p">)</span>
        <span class="c1"># update seed_all to be latest</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">call_order</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_cb</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_all_cb</span><span class="p">]</span>

    <span class="k">def</span> <span class="nf">queue_seed</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cb</span><span class="p">,</span> <span class="n">traceback</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_cb</span> <span class="o">=</span> <span class="p">(</span><span class="n">cb</span><span class="p">,</span> <span class="n">traceback</span><span class="p">)</span>
        <span class="c1"># update seed to be latest</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">call_order</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_all_cb</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">manual_seed_cb</span><span class="p">]</span>

    <span class="k">def</span> <span class="nf">get_calls</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">:</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">call_order</span>


<span class="n">_lazy_seed_tracker</span> <span class="o">=</span> <span class="n">_LazySeedTracker</span><span class="p">()</span>

<span class="c1"># Define dummy _CudaDeviceProperties type if PyTorch was compiled without CUDA</span>
<span class="k">if</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="p">,</span> <span class="s1">&#39;_CudaDeviceProperties&#39;</span><span class="p">):</span>
    <span class="n">_CudaDeviceProperties</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_CudaDeviceProperties</span>
<span class="k">else</span><span class="p">:</span>
    <span class="n">_CudaDeviceProperties</span> <span class="o">=</span> <span class="n">_dummy_type</span><span class="p">(</span><span class="s1">&#39;_CudaDeviceProperties&#39;</span><span class="p">)</span>  <span class="c1"># type: ignore[assignment, misc]</span>

<span class="k">if</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="p">,</span> <span class="s1">&#39;_cuda_exchangeDevice&#39;</span><span class="p">):</span>
    <span class="n">_exchange_device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_exchangeDevice</span>
<span class="k">else</span><span class="p">:</span>
    <span class="k">def</span> <span class="nf">_exchange_device</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
        <span class="k">if</span> <span class="n">device</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
            <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;PyTorch was compiled without CUDA support&quot;</span><span class="p">)</span>


<span class="c1"># Global variables dynamically populated by native code</span>
<span class="n">has_magma</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>
<span class="n">has_half</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>
<span class="n">default_generators</span><span class="p">:</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">Generator</span><span class="p">]</span> <span class="o">=</span> <span class="p">()</span>  <span class="c1"># type: ignore[assignment]</span>

<span class="k">def</span> <span class="nf">_is_compiled</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns true if compile with CUDA support.&quot;&quot;&quot;</span>
    <span class="k">return</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="p">,</span> <span class="s1">&#39;_cuda_getDeviceCount&#39;</span><span class="p">)</span>

<span class="k">def</span> <span class="nf">_nvml_based_avail</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
    <span class="k">return</span> <span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s1">&#39;PYTORCH_NVML_BASED_CUDA_CHECK&#39;</span><span class="p">)</span> <span class="o">==</span> <span class="s1">&#39;1&#39;</span>

<div class="viewcode-block" id="is_available"><a class="viewcode-back" href="../../generated/torch.cuda.is_available.html#torch.cuda.is_available">[docs]</a><span class="k">def</span> <span class="nf">is_available</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns a bool indicating if CUDA is currently available.&quot;&quot;&quot;</span>
    <span class="k">if</span> <span class="ow">not</span> <span class="n">_is_compiled</span><span class="p">():</span>
        <span class="k">return</span> <span class="kc">False</span>
    <span class="k">if</span> <span class="n">_nvml_based_avail</span><span class="p">():</span>
        <span class="c1"># The user has set an env variable to request this availability check that attempts to avoid fork poisoning by</span>
        <span class="c1"># using NVML at the cost of a weaker CUDA availability assessment. Note that if NVML discovery/initialization</span>
        <span class="c1"># fails, this assessment falls back to the default CUDA Runtime API assessment (`cudaGetDeviceCount`)</span>
        <span class="k">return</span> <span class="n">device_count</span><span class="p">()</span> <span class="o">&gt;</span> <span class="mi">0</span>
    <span class="k">else</span><span class="p">:</span>
        <span class="c1"># The default availability inspection never throws and returns 0 if the driver is missing or can&#39;t</span>
        <span class="c1"># be initialized. This uses the CUDA Runtime API `cudaGetDeviceCount` which in turn initializes the CUDA Driver</span>
        <span class="c1"># API via `cuInit`</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getDeviceCount</span><span class="p">()</span> <span class="o">&gt;</span> <span class="mi">0</span></div>


<span class="k">def</span> <span class="nf">is_bf16_supported</span><span class="p">():</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns a bool indicating if the current CUDA/ROCm device supports dtype bfloat16&quot;&quot;&quot;</span>
    <span class="c1"># Check for ROCm, if true return true, no ROCM_VERSION check required,</span>
    <span class="c1"># since it is supported on AMD GPU archs.</span>
    <span class="k">if</span> <span class="n">torch</span><span class="o">.</span><span class="n">version</span><span class="o">.</span><span class="n">hip</span><span class="p">:</span>
        <span class="k">return</span> <span class="kc">True</span>

    <span class="n">cu_vers</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">version</span><span class="o">.</span><span class="n">cuda</span>
    <span class="k">if</span> <span class="n">cu_vers</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
        <span class="n">cuda_maj_decide</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">cu_vers</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;.&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">])</span> <span class="o">&gt;=</span> <span class="mi">11</span>
    <span class="k">else</span><span class="p">:</span>
        <span class="n">cuda_maj_decide</span> <span class="o">=</span> <span class="kc">False</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">get_device_properties</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">current_device</span><span class="p">())</span><span class="o">.</span><span class="n">major</span> <span class="o">&gt;=</span> <span class="mi">8</span> <span class="ow">and</span> <span class="n">cuda_maj_decide</span>

<span class="k">def</span> <span class="nf">_sleep</span><span class="p">(</span><span class="n">cycles</span><span class="p">):</span>
    <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_sleep</span><span class="p">(</span><span class="n">cycles</span><span class="p">)</span>


<span class="k">def</span> <span class="nf">_check_capability</span><span class="p">():</span>
    <span class="n">incorrect_binary_warn</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
<span class="s2">    Found GPU</span><span class="si">%d</span><span class="s2"> </span><span class="si">%s</span><span class="s2"> which requires CUDA_VERSION &gt;= </span><span class="si">%d</span><span class="s2"> to</span>
<span class="s2">     work properly, but your PyTorch was compiled</span>
<span class="s2">     with CUDA_VERSION </span><span class="si">%d</span><span class="s2">. Please install the correct PyTorch binary</span>
<span class="s2">     using instructions from https://pytorch.org</span>
<span class="s2">    &quot;&quot;&quot;</span>

    <span class="n">old_gpu_warn</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
<span class="s2">    Found GPU</span><span class="si">%d</span><span class="s2"> </span><span class="si">%s</span><span class="s2"> which is of cuda capability </span><span class="si">%d</span><span class="s2">.</span><span class="si">%d</span><span class="s2">.</span>
<span class="s2">    PyTorch no longer supports this GPU because it is too old.</span>
<span class="s2">    The minimum cuda capability supported by this library is </span><span class="si">%d</span><span class="s2">.</span><span class="si">%d</span><span class="s2">.</span>
<span class="s2">    &quot;&quot;&quot;</span>

    <span class="k">if</span> <span class="n">torch</span><span class="o">.</span><span class="n">version</span><span class="o">.</span><span class="n">cuda</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>  <span class="c1"># on ROCm we don&#39;t want this check</span>
        <span class="n">CUDA_VERSION</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getCompiledVersion</span><span class="p">()</span>
        <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">device_count</span><span class="p">()):</span>
            <span class="n">capability</span> <span class="o">=</span> <span class="n">get_device_capability</span><span class="p">(</span><span class="n">d</span><span class="p">)</span>
            <span class="n">major</span> <span class="o">=</span> <span class="n">capability</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
            <span class="n">minor</span> <span class="o">=</span> <span class="n">capability</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
            <span class="n">name</span> <span class="o">=</span> <span class="n">get_device_name</span><span class="p">(</span><span class="n">d</span><span class="p">)</span>
            <span class="n">current_arch</span> <span class="o">=</span> <span class="n">major</span> <span class="o">*</span> <span class="mi">10</span> <span class="o">+</span> <span class="n">minor</span>
            <span class="n">min_arch</span> <span class="o">=</span> <span class="nb">min</span><span class="p">((</span><span class="nb">int</span><span class="p">(</span><span class="n">arch</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;_&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">])</span> <span class="k">for</span> <span class="n">arch</span> <span class="ow">in</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">get_arch_list</span><span class="p">()),</span> <span class="n">default</span><span class="o">=</span><span class="mi">35</span><span class="p">)</span>
            <span class="k">if</span> <span class="n">current_arch</span> <span class="o">&lt;</span> <span class="n">min_arch</span><span class="p">:</span>
                <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="n">old_gpu_warn</span> <span class="o">%</span> <span class="p">(</span><span class="n">d</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">major</span><span class="p">,</span> <span class="n">minor</span><span class="p">,</span> <span class="n">min_arch</span> <span class="o">//</span> <span class="mi">10</span><span class="p">,</span> <span class="n">min_arch</span> <span class="o">%</span> <span class="mi">10</span><span class="p">))</span>

<span class="k">def</span> <span class="nf">_check_cubins</span><span class="p">():</span>
    <span class="n">incompatible_device_warn</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
<span class="si">{}</span><span class="s2"> with CUDA capability sm_</span><span class="si">{}</span><span class="s2"> is not compatible with the current PyTorch installation.</span>
<span class="s2">The current PyTorch install supports CUDA capabilities </span><span class="si">{}</span><span class="s2">.</span>
<span class="s2">If you want to use the </span><span class="si">{}</span><span class="s2"> GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/</span>
<span class="s2">&quot;&quot;&quot;</span>
    <span class="k">if</span> <span class="n">torch</span><span class="o">.</span><span class="n">version</span><span class="o">.</span><span class="n">cuda</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>  <span class="c1"># on ROCm we don&#39;t want this check</span>
        <span class="k">return</span>
    <span class="n">arch_list</span> <span class="o">=</span> <span class="n">get_arch_list</span><span class="p">()</span>
    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arch_list</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
        <span class="k">return</span>
    <span class="n">supported_sm</span> <span class="o">=</span> <span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="n">arch</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;_&#39;</span><span class="p">)[</span><span class="mi">1</span><span class="p">])</span> <span class="k">for</span> <span class="n">arch</span> <span class="ow">in</span> <span class="n">arch_list</span> <span class="k">if</span> <span class="s1">&#39;sm_&#39;</span> <span class="ow">in</span> <span class="n">arch</span><span class="p">]</span>
    <span class="k">for</span> <span class="n">idx</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">device_count</span><span class="p">()):</span>
        <span class="n">cap_major</span><span class="p">,</span> <span class="n">cap_minor</span> <span class="o">=</span> <span class="n">get_device_capability</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
        <span class="c1"># NVIDIA GPU compute architectures are backward compatible within major version</span>
        <span class="n">supported</span> <span class="o">=</span> <span class="nb">any</span><span class="p">([</span><span class="n">sm</span> <span class="o">//</span> <span class="mi">10</span> <span class="o">==</span> <span class="n">cap_major</span> <span class="k">for</span> <span class="n">sm</span> <span class="ow">in</span> <span class="n">supported_sm</span><span class="p">])</span>
        <span class="k">if</span> <span class="ow">not</span> <span class="n">supported</span><span class="p">:</span>
            <span class="n">device_name</span> <span class="o">=</span> <span class="n">get_device_name</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
            <span class="n">capability</span> <span class="o">=</span> <span class="n">cap_major</span> <span class="o">*</span> <span class="mi">10</span> <span class="o">+</span> <span class="n">cap_minor</span>
            <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="n">incompatible_device_warn</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">device_name</span><span class="p">,</span> <span class="n">capability</span><span class="p">,</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">arch_list</span><span class="p">),</span> <span class="n">device_name</span><span class="p">))</span>


<div class="viewcode-block" id="is_initialized"><a class="viewcode-back" href="../../generated/torch.cuda.is_initialized.html#torch.cuda.is_initialized">[docs]</a><span class="k">def</span> <span class="nf">is_initialized</span><span class="p">():</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns whether PyTorch&#39;s CUDA state has been initialized.&quot;&quot;&quot;</span>
    <span class="k">return</span> <span class="n">_initialized</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">_is_in_bad_fork</span><span class="p">()</span></div>


<span class="k">def</span> <span class="nf">_lazy_call</span><span class="p">(</span><span class="n">callable</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
    <span class="k">if</span> <span class="n">is_initialized</span><span class="p">():</span>
        <span class="n">callable</span><span class="p">()</span>
    <span class="k">else</span><span class="p">:</span>
        <span class="c1"># TODO(torch_deploy): this accesses linecache, which attempts to read the</span>
        <span class="c1"># file system to get traceback info. Patch linecache or do something</span>
        <span class="c1"># else here if this ends up being important.</span>
        <span class="k">global</span> <span class="n">_lazy_seed_tracker</span>
        <span class="k">if</span> <span class="n">kwargs</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;seed_all&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">):</span>
            <span class="n">_lazy_seed_tracker</span><span class="o">.</span><span class="n">queue_seed_all</span><span class="p">(</span><span class="n">callable</span><span class="p">,</span> <span class="n">traceback</span><span class="o">.</span><span class="n">format_stack</span><span class="p">())</span>
        <span class="k">elif</span> <span class="n">kwargs</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;seed&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">):</span>
            <span class="n">_lazy_seed_tracker</span><span class="o">.</span><span class="n">queue_seed</span><span class="p">(</span><span class="n">callable</span><span class="p">,</span> <span class="n">traceback</span><span class="o">.</span><span class="n">format_stack</span><span class="p">())</span>
        <span class="k">else</span><span class="p">:</span>
            <span class="c1"># Don&#39;t store the actual traceback to avoid memory cycle</span>
            <span class="n">_queued_calls</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">callable</span><span class="p">,</span> <span class="n">traceback</span><span class="o">.</span><span class="n">format_stack</span><span class="p">()))</span>

<span class="n">_lazy_call</span><span class="p">(</span><span class="n">_check_capability</span><span class="p">)</span>
<span class="n">_lazy_call</span><span class="p">(</span><span class="n">_check_cubins</span><span class="p">)</span>


<span class="k">class</span> <span class="nc">DeferredCudaCallError</span><span class="p">(</span><span class="ne">Exception</span><span class="p">):</span>
    <span class="k">pass</span>

<span class="n">OutOfMemoryError</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_OutOfMemoryError</span>

<div class="viewcode-block" id="init"><a class="viewcode-back" href="../../generated/torch.cuda.init.html#torch.cuda.init">[docs]</a><span class="k">def</span> <span class="nf">init</span><span class="p">():</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Initialize PyTorch&#39;s CUDA state.  You may need to call</span>
<span class="sd">    this explicitly if you are interacting with PyTorch via</span>
<span class="sd">    its C API, as Python bindings for CUDA functionality will not</span>
<span class="sd">    be available until this initialization takes place.  Ordinary users</span>
<span class="sd">    should not need this, as all of PyTorch&#39;s CUDA methods</span>
<span class="sd">    automatically initialize CUDA state on-demand.</span>

<span class="sd">    Does nothing if the CUDA state is already initialized.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span></div>


<span class="k">def</span> <span class="nf">_lazy_init</span><span class="p">():</span>
    <span class="k">global</span> <span class="n">_initialized</span><span class="p">,</span> <span class="n">_queued_calls</span>
    <span class="k">if</span> <span class="n">is_initialized</span><span class="p">()</span> <span class="ow">or</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">_tls</span><span class="p">,</span> <span class="s1">&#39;is_initializing&#39;</span><span class="p">):</span>
        <span class="k">return</span>
    <span class="k">with</span> <span class="n">_initialization_lock</span><span class="p">:</span>
        <span class="c1"># We be double-checked locking, boys!  This is OK because</span>
        <span class="c1"># the above test was GIL protected anyway.  The inner test</span>
        <span class="c1"># is for when a thread blocked on some other thread which was</span>
        <span class="c1"># doing the initialization; when they get the lock, they will</span>
        <span class="c1"># find there is nothing left to do.</span>
        <span class="k">if</span> <span class="n">is_initialized</span><span class="p">():</span>
            <span class="k">return</span>
        <span class="c1"># It is important to prevent other threads from entering _lazy_init</span>
        <span class="c1"># immediately, while we are still guaranteed to have the GIL, because some</span>
        <span class="c1"># of the C calls we make below will release the GIL</span>
        <span class="k">if</span> <span class="n">_is_in_bad_fork</span><span class="p">():</span>
            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span>
                <span class="s2">&quot;Cannot re-initialize CUDA in forked subprocess. To use CUDA with &quot;</span>
                <span class="s2">&quot;multiprocessing, you must use the &#39;spawn&#39; start method&quot;</span><span class="p">)</span>
        <span class="k">if</span> <span class="ow">not</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="p">,</span> <span class="s1">&#39;_cuda_getDeviceCount&#39;</span><span class="p">):</span>
            <span class="k">raise</span> <span class="ne">AssertionError</span><span class="p">(</span><span class="s2">&quot;Torch not compiled with CUDA enabled&quot;</span><span class="p">)</span>
        <span class="k">if</span> <span class="n">_cudart</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
            <span class="k">raise</span> <span class="ne">AssertionError</span><span class="p">(</span>
                <span class="s2">&quot;libcudart functions unavailable. It looks like you have a broken build?&quot;</span><span class="p">)</span>
        <span class="c1"># This function throws if there&#39;s a driver initialization error, no GPUs</span>
        <span class="c1"># are found or any other error occurs</span>
        <span class="k">if</span> <span class="s1">&#39;CUDA_MODULE_LOADING&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">:</span>
            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s1">&#39;CUDA_MODULE_LOADING&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;LAZY&#39;</span>
        <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_init</span><span class="p">()</span>
        <span class="c1"># Some of the queued calls may reentrantly call _lazy_init();</span>
        <span class="c1"># we need to just return without initializing in that case.</span>
        <span class="c1"># However, we must not let any *other* threads in!</span>
        <span class="n">_tls</span><span class="o">.</span><span class="n">is_initializing</span> <span class="o">=</span> <span class="kc">True</span>

        <span class="k">for</span> <span class="n">calls</span> <span class="ow">in</span> <span class="n">_lazy_seed_tracker</span><span class="o">.</span><span class="n">get_calls</span><span class="p">():</span>
            <span class="k">if</span> <span class="n">calls</span><span class="p">:</span>
                <span class="n">_queued_calls</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">calls</span><span class="p">)</span>

        <span class="k">try</span><span class="p">:</span>
            <span class="k">for</span> <span class="n">queued_call</span><span class="p">,</span> <span class="n">orig_traceback</span> <span class="ow">in</span> <span class="n">_queued_calls</span><span class="p">:</span>
                <span class="k">try</span><span class="p">:</span>
                    <span class="n">queued_call</span><span class="p">()</span>
                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
                    <span class="n">msg</span> <span class="o">=</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot;CUDA call failed lazily at initialization with error: </span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">)</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span>
                           <span class="sa">f</span><span class="s2">&quot;CUDA call was originally invoked at:</span><span class="se">\n\n</span><span class="si">{</span><span class="n">orig_traceback</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
                    <span class="k">raise</span> <span class="n">DeferredCudaCallError</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
        <span class="k">finally</span><span class="p">:</span>
            <span class="nb">delattr</span><span class="p">(</span><span class="n">_tls</span><span class="p">,</span> <span class="s1">&#39;is_initializing&#39;</span><span class="p">)</span>
        <span class="n">_initialized</span> <span class="o">=</span> <span class="kc">True</span>


<span class="k">def</span> <span class="nf">cudart</span><span class="p">():</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">return</span> <span class="n">_cudart</span>


<span class="k">class</span> <span class="nc">cudaStatus</span><span class="p">:</span>
    <span class="n">SUCCESS</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
    <span class="n">ERROR_NOT_READY</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">34</span>

<span class="k">class</span> <span class="nc">CudaError</span><span class="p">(</span><span class="ne">RuntimeError</span><span class="p">):</span>
    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">code</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
        <span class="n">msg</span> <span class="o">=</span> <span class="n">_cudart</span><span class="o">.</span><span class="n">cudaGetErrorString</span><span class="p">(</span><span class="n">_cudart</span><span class="o">.</span><span class="n">cudaError</span><span class="p">(</span><span class="n">code</span><span class="p">))</span>
        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">{0}</span><span class="s1"> (</span><span class="si">{1}</span><span class="s1">)&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">msg</span><span class="p">,</span> <span class="n">code</span><span class="p">))</span>


<span class="k">def</span> <span class="nf">check_error</span><span class="p">(</span><span class="n">res</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
    <span class="k">if</span> <span class="n">res</span> <span class="o">!=</span> <span class="n">_cudart</span><span class="o">.</span><span class="n">cudaError</span><span class="o">.</span><span class="n">success</span><span class="p">:</span>
        <span class="k">raise</span> <span class="n">CudaError</span><span class="p">(</span><span class="n">res</span><span class="p">)</span>


<span class="k">class</span> <span class="nc">_DeviceGuard</span><span class="p">:</span>
    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="o">=</span> <span class="n">index</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">prev_idx</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>

    <span class="k">def</span> <span class="fm">__enter__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">prev_idx</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">_exchange_device</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">idx</span><span class="p">)</span>

    <span class="k">def</span> <span class="fm">__exit__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">type</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">traceback</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
        <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">_exchange_device</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prev_idx</span><span class="p">)</span>
        <span class="k">return</span> <span class="kc">False</span>


<div class="viewcode-block" id="device"><a class="viewcode-back" href="../../generated/torch.cuda.device.html#torch.cuda.device">[docs]</a><span class="k">class</span> <span class="nc">device</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Context-manager that changes the selected device.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int): device index to select. It&#39;s a no-op if</span>
<span class="sd">            this argument is a negative integer or ``None``.</span>
<span class="sd">    &quot;&quot;&quot;</span>

    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">device</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">prev_idx</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>

    <span class="k">def</span> <span class="fm">__enter__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">prev_idx</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">_exchange_device</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">idx</span><span class="p">)</span>

    <span class="k">def</span> <span class="fm">__exit__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">type</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">traceback</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
        <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">_exchange_device</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prev_idx</span><span class="p">)</span>
        <span class="k">return</span> <span class="kc">False</span></div>


<div class="viewcode-block" id="device_of"><a class="viewcode-back" href="../../generated/torch.cuda.device_of.html#torch.cuda.device_of">[docs]</a><span class="k">class</span> <span class="nc">device_of</span><span class="p">(</span><span class="n">device</span><span class="p">):</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Context-manager that changes the current device to that of given object.</span>

<span class="sd">    You can use both tensors and storages as arguments. If a given object is</span>
<span class="sd">    not allocated on a GPU, this is a no-op.</span>

<span class="sd">    Args:</span>
<span class="sd">        obj (Tensor or Storage): object allocated on the selected device.</span>
<span class="sd">    &quot;&quot;&quot;</span>

    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">obj</span><span class="p">):</span>
        <span class="n">idx</span> <span class="o">=</span> <span class="n">obj</span><span class="o">.</span><span class="n">get_device</span><span class="p">()</span> <span class="k">if</span> <span class="n">obj</span><span class="o">.</span><span class="n">is_cuda</span> <span class="k">else</span> <span class="o">-</span><span class="mi">1</span>
        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span></div>


<div class="viewcode-block" id="set_device"><a class="viewcode-back" href="../../generated/torch.cuda.set_device.html#torch.cuda.set_device">[docs]</a><span class="k">def</span> <span class="nf">set_device</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">_device_t</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Sets the current device.</span>

<span class="sd">    Usage of this function is discouraged in favor of :any:`device`. In most</span>
<span class="sd">    cases it&#39;s better to use ``CUDA_VISIBLE_DEVICES`` environmental variable.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int): selected device. This function is a no-op</span>
<span class="sd">            if this argument is negative.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">device</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">device</span> <span class="o">&gt;=</span> <span class="mi">0</span><span class="p">:</span>
        <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_setDevice</span><span class="p">(</span><span class="n">device</span><span class="p">)</span></div>


<div class="viewcode-block" id="get_device_name"><a class="viewcode-back" href="../../generated/torch.cuda.get_device_name.html#torch.cuda.get_device_name">[docs]</a><span class="k">def</span> <span class="nf">get_device_name</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">_device_t</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Gets the name of a device.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): device for which to return the</span>
<span class="sd">            name. This function is a no-op if this argument is a negative</span>
<span class="sd">            integer. It uses the current device, given by :func:`~torch.cuda.current_device`,</span>
<span class="sd">            if :attr:`device` is ``None`` (default).</span>

<span class="sd">    Returns:</span>
<span class="sd">        str: the name of the device</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="k">return</span> <span class="n">get_device_properties</span><span class="p">(</span><span class="n">device</span><span class="p">)</span><span class="o">.</span><span class="n">name</span></div>


<div class="viewcode-block" id="get_device_capability"><a class="viewcode-back" href="../../generated/torch.cuda.get_device_capability.html#torch.cuda.get_device_capability">[docs]</a><span class="k">def</span> <span class="nf">get_device_capability</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">_device_t</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Gets the cuda capability of a device.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): device for which to return the</span>
<span class="sd">            device capability. This function is a no-op if this argument is</span>
<span class="sd">            a negative integer. It uses the current device, given by</span>
<span class="sd">            :func:`~torch.cuda.current_device`, if :attr:`device` is ``None``</span>
<span class="sd">            (default).</span>

<span class="sd">    Returns:</span>
<span class="sd">        tuple(int, int): the major and minor cuda capability of the device</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">prop</span> <span class="o">=</span> <span class="n">get_device_properties</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">prop</span><span class="o">.</span><span class="n">major</span><span class="p">,</span> <span class="n">prop</span><span class="o">.</span><span class="n">minor</span></div>


<div class="viewcode-block" id="get_device_properties"><a class="viewcode-back" href="../../generated/torch.cuda.get_device_properties.html#torch.cuda.get_device_properties">[docs]</a><span class="k">def</span> <span class="nf">get_device_properties</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">_device_t</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">_CudaDeviceProperties</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Gets the properties of a device.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int or str): device for which to return the</span>
<span class="sd">            properties of the device.</span>

<span class="sd">    Returns:</span>
<span class="sd">        _CudaDeviceProperties: the properties of the device</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>  <span class="c1"># will define _get_device_properties</span>
    <span class="n">device</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">device</span> <span class="o">&lt;</span> <span class="mi">0</span> <span class="ow">or</span> <span class="n">device</span> <span class="o">&gt;=</span> <span class="n">device_count</span><span class="p">():</span>
        <span class="k">raise</span> <span class="ne">AssertionError</span><span class="p">(</span><span class="s2">&quot;Invalid device id&quot;</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">_get_device_properties</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>  <span class="c1"># type: ignore[name-defined]</span></div>

<div class="viewcode-block" id="can_device_access_peer"><a class="viewcode-back" href="../../generated/torch.cuda.can_device_access_peer.html#torch.cuda.can_device_access_peer">[docs]</a><span class="k">def</span> <span class="nf">can_device_access_peer</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">_device_t</span><span class="p">,</span> <span class="n">peer_device</span><span class="p">:</span> <span class="n">_device_t</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Checks if peer access between two devices is possible.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="n">device</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
    <span class="n">peer_device</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">peer_device</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">device</span> <span class="o">&lt;</span> <span class="mi">0</span> <span class="ow">or</span> <span class="n">device</span> <span class="o">&gt;=</span> <span class="n">device_count</span><span class="p">():</span>
        <span class="k">raise</span> <span class="ne">AssertionError</span><span class="p">(</span><span class="s2">&quot;Invalid device id&quot;</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">peer_device</span> <span class="o">&lt;</span> <span class="mi">0</span> <span class="ow">or</span> <span class="n">peer_device</span> <span class="o">&gt;=</span> <span class="n">device_count</span><span class="p">():</span>
        <span class="k">raise</span> <span class="ne">AssertionError</span><span class="p">(</span><span class="s2">&quot;Invalid peer device id&quot;</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_canDeviceAccessPeer</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">peer_device</span><span class="p">)</span></div>


<div class="viewcode-block" id="StreamContext"><a class="viewcode-back" href="../../generated/torch.cuda.StreamContext.html#torch.cuda.StreamContext">[docs]</a><span class="k">class</span> <span class="nc">StreamContext</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Context-manager that selects a given stream.</span>

<span class="sd">    All CUDA kernels queued within its context will be enqueued on a selected</span>
<span class="sd">    stream.</span>

<span class="sd">    Args:</span>
<span class="sd">        Stream (Stream): selected stream. This manager is a no-op if it&#39;s</span>
<span class="sd">            ``None``.</span>
<span class="sd">    .. note:: Streams are per-device.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">cur_stream</span> <span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;torch.cuda.Stream&#39;</span><span class="p">]</span>

    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">stream</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;torch.cuda.Stream&#39;</span><span class="p">]):</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">stream</span> <span class="o">=</span> <span class="n">stream</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
        <span class="k">if</span> <span class="ow">not</span> <span class="n">torch</span><span class="o">.</span><span class="n">jit</span><span class="o">.</span><span class="n">is_scripting</span><span class="p">():</span>
            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
                <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>

        <span class="bp">self</span><span class="o">.</span><span class="n">src_prev_stream</span> <span class="o">=</span> <span class="kc">None</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">torch</span><span class="o">.</span><span class="n">jit</span><span class="o">.</span><span class="n">is_scripting</span><span class="p">()</span> <span class="k">else</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">default_stream</span><span class="p">(</span><span class="kc">None</span><span class="p">)</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">dst_prev_stream</span> <span class="o">=</span> <span class="kc">None</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">torch</span><span class="o">.</span><span class="n">jit</span><span class="o">.</span><span class="n">is_scripting</span><span class="p">()</span> <span class="k">else</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">default_stream</span><span class="p">(</span><span class="kc">None</span><span class="p">)</span>

    <span class="k">def</span> <span class="fm">__enter__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="c1"># Local cur_stream variable for type refinement</span>
        <span class="n">cur_stream</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">stream</span>
        <span class="c1"># Return if stream is None or CUDA device not available</span>
        <span class="k">if</span> <span class="n">cur_stream</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="o">==</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
            <span class="k">return</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">src_prev_stream</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">current_stream</span><span class="p">(</span><span class="kc">None</span><span class="p">)</span>

        <span class="c1"># If the stream is not on the current device, then</span>
        <span class="c1"># set the current stream on the device</span>
        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">src_prev_stream</span><span class="o">.</span><span class="n">device</span> <span class="o">!=</span> <span class="n">cur_stream</span><span class="o">.</span><span class="n">device</span><span class="p">:</span>
            <span class="k">with</span> <span class="n">device</span><span class="p">(</span><span class="n">cur_stream</span><span class="o">.</span><span class="n">device</span><span class="p">):</span>
                <span class="bp">self</span><span class="o">.</span><span class="n">dst_prev_stream</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">current_stream</span><span class="p">(</span><span class="n">cur_stream</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
        <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">set_stream</span><span class="p">(</span><span class="n">cur_stream</span><span class="p">)</span>

    <span class="k">def</span> <span class="fm">__exit__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">type</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">traceback</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
        <span class="c1"># Local cur_stream variable for type refinement</span>
        <span class="n">cur_stream</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">stream</span>
        <span class="c1"># If stream is None or no CUDA device available, return</span>
        <span class="k">if</span> <span class="n">cur_stream</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">idx</span> <span class="o">==</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
            <span class="k">return</span>

        <span class="c1"># Reset the stream on the original device</span>
        <span class="c1"># and destination device</span>
        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">src_prev_stream</span><span class="o">.</span><span class="n">device</span> <span class="o">!=</span> <span class="n">cur_stream</span><span class="o">.</span><span class="n">device</span><span class="p">:</span>  <span class="c1"># type: ignore[union-attr]</span>
            <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">set_stream</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dst_prev_stream</span><span class="p">)</span>  <span class="c1"># type: ignore[arg-type]</span>
        <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">set_stream</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">src_prev_stream</span><span class="p">)</span>  <span class="c1"># type: ignore[arg-type]</span></div>

<div class="viewcode-block" id="stream"><a class="viewcode-back" href="../../generated/torch.cuda.stream.html#torch.cuda.stream">[docs]</a><span class="k">def</span> <span class="nf">stream</span><span class="p">(</span><span class="n">stream</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;torch.cuda.Stream&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">StreamContext</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Wrapper around the Context-manager StreamContext that</span>
<span class="sd">    selects a given stream.</span>

<span class="sd">    Arguments:</span>
<span class="sd">        stream (Stream): selected stream. This manager is a no-op if it&#39;s</span>
<span class="sd">            ``None``.</span>
<span class="sd">    ..Note:: In eager mode stream is of type Stream class while in JIT it is</span>
<span class="sd">    an object of the custom class ``torch.classes.cuda.Stream``.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="k">return</span> <span class="n">StreamContext</span><span class="p">(</span><span class="n">stream</span><span class="p">)</span></div>

<div class="viewcode-block" id="set_stream"><a class="viewcode-back" href="../../generated/torch.cuda.set_stream.html#torch.cuda.set_stream">[docs]</a><span class="k">def</span> <span class="nf">set_stream</span><span class="p">(</span><span class="n">stream</span><span class="p">:</span> <span class="n">Stream</span><span class="p">):</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Sets the current stream.This is a wrapper API to set the stream.</span>
<span class="sd">        Usage of this function is discouraged in favor of the ``stream``</span>
<span class="sd">        context manager.</span>

<span class="sd">    Args:</span>
<span class="sd">        stream (Stream): selected stream. This function is a no-op</span>
<span class="sd">            if this argument is ``None``.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="k">if</span> <span class="n">stream</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
        <span class="k">return</span>
    <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_setStream</span><span class="p">(</span><span class="n">stream_id</span><span class="o">=</span><span class="n">stream</span><span class="o">.</span><span class="n">stream_id</span><span class="p">,</span> <span class="n">device_index</span><span class="o">=</span><span class="n">stream</span><span class="o">.</span><span class="n">device_index</span><span class="p">,</span> <span class="n">device_type</span><span class="o">=</span><span class="n">stream</span><span class="o">.</span><span class="n">device_type</span><span class="p">)</span></div>


<span class="k">def</span> <span class="nf">_parse_visible_devices</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">Union</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
    <span class="sd">&quot;&quot;&quot;Parse CUDA_VISIBLE_DEVICES environment variable.&quot;&quot;&quot;</span>
    <span class="n">var</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s2">&quot;CUDA_VISIBLE_DEVICES&quot;</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
        <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="mi">64</span><span class="p">))</span>

    <span class="k">def</span> <span class="nf">_strtoul</span><span class="p">(</span><span class="n">s</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
        <span class="sd">&quot;&quot;&quot;Return -1 or positive integer sequence string starts with,&quot;&quot;&quot;</span>
        <span class="k">if</span> <span class="ow">not</span> <span class="n">s</span><span class="p">:</span>
            <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="n">c</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">s</span><span class="p">):</span>
            <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span><span class="n">c</span><span class="o">.</span><span class="n">isdigit</span><span class="p">()</span> <span class="ow">or</span> <span class="p">(</span><span class="n">idx</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">c</span> <span class="ow">in</span> <span class="s1">&#39;+-&#39;</span><span class="p">)):</span>
                <span class="k">break</span>
            <span class="k">if</span> <span class="n">idx</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">s</span><span class="p">):</span>
                <span class="n">idx</span> <span class="o">+=</span> <span class="mi">1</span>
        <span class="k">return</span> <span class="nb">int</span><span class="p">(</span><span class="n">s</span><span class="p">[:</span><span class="n">idx</span><span class="p">])</span> <span class="k">if</span> <span class="n">idx</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="o">-</span><span class="mi">1</span>

    <span class="k">def</span> <span class="nf">parse_list_with_prefix</span><span class="p">(</span><span class="n">lst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">prefix</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
        <span class="n">rcs</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
        <span class="k">for</span> <span class="n">elem</span> <span class="ow">in</span> <span class="n">lst</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">):</span>
            <span class="c1"># Repeated id results in empty set</span>
            <span class="k">if</span> <span class="n">elem</span> <span class="ow">in</span> <span class="n">rcs</span><span class="p">:</span>
                <span class="k">return</span> <span class="n">cast</span><span class="p">(</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="p">[])</span>
            <span class="c1"># Anything other but prefix is ignored</span>
            <span class="k">if</span> <span class="ow">not</span> <span class="n">elem</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="n">prefix</span><span class="p">):</span>
                <span class="k">break</span>
            <span class="n">rcs</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">elem</span><span class="p">)</span>
        <span class="k">return</span> <span class="n">rcs</span>

    <span class="k">if</span> <span class="n">var</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;GPU-&quot;</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">parse_list_with_prefix</span><span class="p">(</span><span class="n">var</span><span class="p">,</span> <span class="s2">&quot;GPU-&quot;</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">var</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;MIG-&quot;</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">parse_list_with_prefix</span><span class="p">(</span><span class="n">var</span><span class="p">,</span> <span class="s2">&quot;MIG-&quot;</span><span class="p">)</span>
    <span class="c1"># CUDA_VISIBLE_DEVICES uses something like strtoul</span>
    <span class="c1"># which makes `1gpu2,2ampere` is equivalent to `1,2`</span>
    <span class="n">rc</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
    <span class="k">for</span> <span class="n">elem</span> <span class="ow">in</span> <span class="n">var</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">):</span>
        <span class="n">x</span> <span class="o">=</span> <span class="n">_strtoul</span><span class="p">(</span><span class="n">elem</span><span class="o">.</span><span class="n">strip</span><span class="p">())</span>
        <span class="c1"># Repeated ordinal results in empty set</span>
        <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">rc</span><span class="p">:</span>
            <span class="k">return</span> <span class="n">cast</span><span class="p">(</span><span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="p">[])</span>
        <span class="c1"># Negative value aborts the sequence</span>
        <span class="k">if</span> <span class="n">x</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
            <span class="k">break</span>
        <span class="n">rc</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">rc</span>


<span class="k">def</span> <span class="nf">_raw_device_count_nvml</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sd">&quot;&quot;&quot;Return number of devices as reported by NVML</span>
<span class="sd">    or negative value if NVML discovery/initialization failed.&quot;&quot;&quot;</span>
    <span class="kn">from</span> <span class="nn">ctypes</span> <span class="kn">import</span> <span class="n">CDLL</span><span class="p">,</span> <span class="n">c_int</span><span class="p">,</span> <span class="n">byref</span>
    <span class="n">nvml_h</span> <span class="o">=</span> <span class="n">CDLL</span><span class="p">(</span><span class="s2">&quot;libnvidia-ml.so.1&quot;</span><span class="p">)</span>
    <span class="n">rc</span> <span class="o">=</span> <span class="n">nvml_h</span><span class="o">.</span><span class="n">nvmlInit</span><span class="p">()</span>
    <span class="k">if</span> <span class="n">rc</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
        <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Can&#39;t initialize NVML&quot;</span><span class="p">)</span>
        <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
    <span class="n">dev_count</span> <span class="o">=</span> <span class="n">c_int</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">)</span>
    <span class="n">rc</span> <span class="o">=</span> <span class="n">nvml_h</span><span class="o">.</span><span class="n">nvmlDeviceGetCount_v2</span><span class="p">(</span><span class="n">byref</span><span class="p">(</span><span class="n">dev_count</span><span class="p">))</span>
    <span class="k">if</span> <span class="n">rc</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
        <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Can&#39;t get nvml device count&quot;</span><span class="p">)</span>
        <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
    <span class="k">del</span> <span class="n">nvml_h</span>
    <span class="k">return</span> <span class="n">dev_count</span><span class="o">.</span><span class="n">value</span>


<span class="k">def</span> <span class="nf">_raw_device_uuid_nvml</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
    <span class="sd">&quot;&quot;&quot;Return list of device UUID as reported by NVML</span>
<span class="sd">    or None if NVM discovery/initialization failed.&quot;&quot;&quot;</span>
    <span class="kn">from</span> <span class="nn">ctypes</span> <span class="kn">import</span> <span class="n">CDLL</span><span class="p">,</span> <span class="n">c_int</span><span class="p">,</span> <span class="n">c_void_p</span><span class="p">,</span> <span class="n">create_string_buffer</span><span class="p">,</span> <span class="n">byref</span>
    <span class="n">nvml_h</span> <span class="o">=</span> <span class="n">CDLL</span><span class="p">(</span><span class="s2">&quot;libnvidia-ml.so.1&quot;</span><span class="p">)</span>
    <span class="n">rc</span> <span class="o">=</span> <span class="n">nvml_h</span><span class="o">.</span><span class="n">nvmlInit</span><span class="p">()</span>
    <span class="k">if</span> <span class="n">rc</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
        <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Can&#39;t initialize NVML&quot;</span><span class="p">)</span>
        <span class="k">return</span> <span class="kc">None</span>
    <span class="n">dev_count</span> <span class="o">=</span> <span class="n">c_int</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">)</span>
    <span class="n">rc</span> <span class="o">=</span> <span class="n">nvml_h</span><span class="o">.</span><span class="n">nvmlDeviceGetCount_v2</span><span class="p">(</span><span class="n">byref</span><span class="p">(</span><span class="n">dev_count</span><span class="p">))</span>
    <span class="k">if</span> <span class="n">rc</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
        <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Can&#39;t get nvml device count&quot;</span><span class="p">)</span>
        <span class="k">return</span> <span class="kc">None</span>
    <span class="n">uuids</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
    <span class="k">for</span> <span class="n">idx</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">dev_count</span><span class="o">.</span><span class="n">value</span><span class="p">):</span>
        <span class="n">dev_id</span> <span class="o">=</span> <span class="n">c_void_p</span><span class="p">()</span>
        <span class="n">rc</span> <span class="o">=</span> <span class="n">nvml_h</span><span class="o">.</span><span class="n">nvmlDeviceGetHandleByIndex_v2</span><span class="p">(</span><span class="n">idx</span><span class="p">,</span> <span class="n">byref</span><span class="p">(</span><span class="n">dev_id</span><span class="p">))</span>
        <span class="k">if</span> <span class="n">rc</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
            <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Can&#39;t get device handle&quot;</span><span class="p">)</span>
            <span class="k">return</span> <span class="kc">None</span>
        <span class="n">buf_len</span> <span class="o">=</span> <span class="mi">96</span>
        <span class="n">buf</span> <span class="o">=</span> <span class="n">create_string_buffer</span><span class="p">(</span><span class="n">buf_len</span><span class="p">)</span>
        <span class="n">rc</span> <span class="o">=</span> <span class="n">nvml_h</span><span class="o">.</span><span class="n">nvmlDeviceGetUUID</span><span class="p">(</span><span class="n">dev_id</span><span class="p">,</span> <span class="n">buf</span><span class="p">,</span> <span class="n">buf_len</span><span class="p">)</span>
        <span class="k">if</span> <span class="n">rc</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
            <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Can&#39;t get device UUID&quot;</span><span class="p">)</span>
            <span class="k">return</span> <span class="kc">None</span>
        <span class="n">uuids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">buf</span><span class="o">.</span><span class="n">raw</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s2">&quot;ascii&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">strip</span><span class="p">(</span><span class="s1">&#39;</span><span class="se">\0</span><span class="s1">&#39;</span><span class="p">))</span>
    <span class="k">del</span> <span class="n">nvml_h</span>
    <span class="k">return</span> <span class="n">uuids</span>


<span class="k">def</span> <span class="nf">_transform_uuid_to_ordinals</span><span class="p">(</span><span class="n">candidates</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">uuids</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]:</span>
    <span class="sd">&quot;&quot;&quot;Given the set of partial uuids and list of known uuids builds</span>
<span class="sd">    a set of ordinals excluding ambiguous partials IDs&quot;&quot;&quot;</span>
    <span class="k">def</span> <span class="nf">uuid_to_orinal</span><span class="p">(</span><span class="n">candidate</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">uuids</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
        <span class="n">best_match</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="n">uuid</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">uuids</span><span class="p">):</span>
            <span class="k">if</span> <span class="ow">not</span> <span class="n">uuid</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="n">candidate</span><span class="p">):</span>
                <span class="k">continue</span>
            <span class="c1"># Ambigous candidate</span>
            <span class="k">if</span> <span class="n">best_match</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
                <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
            <span class="n">best_match</span> <span class="o">=</span> <span class="n">idx</span>
        <span class="k">return</span> <span class="n">best_match</span>

    <span class="n">rc</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
    <span class="k">for</span> <span class="n">candidate</span> <span class="ow">in</span> <span class="n">candidates</span><span class="p">:</span>
        <span class="n">idx</span> <span class="o">=</span> <span class="n">uuid_to_orinal</span><span class="p">(</span><span class="n">candidate</span><span class="p">,</span> <span class="n">uuids</span><span class="p">)</span>
        <span class="c1"># First invalid ordinal stops parsing</span>
        <span class="k">if</span> <span class="n">idx</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
            <span class="k">break</span>
        <span class="c1"># Duplicates result in empty set</span>
        <span class="k">if</span> <span class="n">idx</span> <span class="ow">in</span> <span class="n">rc</span><span class="p">:</span>
            <span class="k">return</span> <span class="n">cast</span><span class="p">(</span><span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="p">[])</span>
        <span class="n">rc</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">rc</span>


<span class="k">def</span> <span class="nf">_device_count_nvml</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sd">&quot;&quot;&quot;Return number of devices as reported by NVML taking CUDA_VISIBLE_DEVICES into account.</span>
<span class="sd">    Negative value is returned if NVML discovery or initialization has failed.&quot;&quot;&quot;</span>
    <span class="n">visible_devices</span> <span class="o">=</span> <span class="n">_parse_visible_devices</span><span class="p">()</span>
    <span class="k">if</span> <span class="ow">not</span> <span class="n">visible_devices</span><span class="p">:</span>
        <span class="k">return</span> <span class="mi">0</span>
    <span class="k">try</span><span class="p">:</span>
        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">visible_devices</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="ow">is</span> <span class="nb">str</span><span class="p">:</span>
            <span class="c1"># Skip MIG parsing</span>
            <span class="k">if</span> <span class="n">visible_devices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;MIG-&quot;</span><span class="p">):</span>
                <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
            <span class="n">uuids</span> <span class="o">=</span> <span class="n">_raw_device_uuid_nvml</span><span class="p">()</span>
            <span class="k">if</span> <span class="n">uuids</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
                <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
            <span class="n">visible_devices</span> <span class="o">=</span> <span class="n">_transform_uuid_to_ordinals</span><span class="p">(</span><span class="n">cast</span><span class="p">(</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">visible_devices</span><span class="p">),</span> <span class="n">uuids</span><span class="p">)</span>
        <span class="k">else</span><span class="p">:</span>
            <span class="n">raw_cnt</span> <span class="o">=</span> <span class="n">_raw_device_count_nvml</span><span class="p">()</span>
            <span class="k">if</span> <span class="n">raw_cnt</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">:</span>
                <span class="k">return</span> <span class="n">raw_cnt</span>
            <span class="c1"># Trim the list up to a maximum available device</span>
            <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="n">val</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">visible_devices</span><span class="p">):</span>
                <span class="k">if</span> <span class="n">cast</span><span class="p">(</span><span class="nb">int</span><span class="p">,</span> <span class="n">val</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">raw_cnt</span><span class="p">:</span>
                    <span class="k">return</span> <span class="n">idx</span>
    <span class="k">except</span> <span class="ne">OSError</span><span class="p">:</span>
        <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
    <span class="k">except</span> <span class="ne">AttributeError</span><span class="p">:</span>
        <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
    <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="n">visible_devices</span><span class="p">)</span>

<div class="viewcode-block" id="device_count"><a class="viewcode-back" href="../../generated/torch.cuda.device_count.html#torch.cuda.device_count">[docs]</a><span class="nd">@lru_cache</span><span class="p">(</span><span class="n">maxsize</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
<span class="k">def</span> <span class="nf">device_count</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns the number of GPUs available.&quot;&quot;&quot;</span>
    <span class="k">if</span> <span class="ow">not</span> <span class="n">_is_compiled</span><span class="p">():</span>
        <span class="k">return</span> <span class="mi">0</span>
    <span class="n">nvml_count</span> <span class="o">=</span> <span class="n">_device_count_nvml</span><span class="p">()</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getDeviceCount</span><span class="p">()</span> <span class="k">if</span> <span class="n">nvml_count</span> <span class="o">&lt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="n">nvml_count</span></div>

<div class="viewcode-block" id="get_arch_list"><a class="viewcode-back" href="../../generated/torch.cuda.get_arch_list.html#torch.cuda.get_arch_list">[docs]</a><span class="k">def</span> <span class="nf">get_arch_list</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns list CUDA architectures this library was compiled for.&quot;&quot;&quot;</span>
    <span class="k">if</span> <span class="ow">not</span> <span class="n">is_available</span><span class="p">():</span>
        <span class="k">return</span> <span class="p">[]</span>
    <span class="n">arch_flags</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getArchFlags</span><span class="p">()</span>
    <span class="k">if</span> <span class="n">arch_flags</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
        <span class="k">return</span> <span class="p">[]</span>
    <span class="k">return</span> <span class="n">arch_flags</span><span class="o">.</span><span class="n">split</span><span class="p">()</span></div>

<div class="viewcode-block" id="get_gencode_flags"><a class="viewcode-back" href="../../generated/torch.cuda.get_gencode_flags.html#torch.cuda.get_gencode_flags">[docs]</a><span class="k">def</span> <span class="nf">get_gencode_flags</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns NVCC gencode flags this library was compiled with.&quot;&quot;&quot;</span>
    <span class="n">arch_list</span> <span class="o">=</span> <span class="n">get_arch_list</span><span class="p">()</span>
    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arch_list</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
        <span class="k">return</span> <span class="s2">&quot;&quot;</span>
    <span class="n">arch_list_</span> <span class="o">=</span> <span class="p">[</span><span class="n">arch</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;_&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">arch</span> <span class="ow">in</span> <span class="n">arch_list</span><span class="p">]</span>
    <span class="k">return</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="sa">f</span><span class="s2">&quot;-gencode compute=compute_</span><span class="si">{</span><span class="n">arch</span><span class="si">}</span><span class="s2">,code=</span><span class="si">{</span><span class="n">kind</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">arch</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">for</span> <span class="p">(</span><span class="n">kind</span><span class="p">,</span> <span class="n">arch</span><span class="p">)</span> <span class="ow">in</span> <span class="n">arch_list_</span><span class="p">])</span></div>


<div class="viewcode-block" id="current_device"><a class="viewcode-back" href="../../generated/torch.cuda.current_device.html#torch.cuda.current_device">[docs]</a><span class="k">def</span> <span class="nf">current_device</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns the index of a currently selected device.&quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getDevice</span><span class="p">()</span></div>


<div class="viewcode-block" id="synchronize"><a class="viewcode-back" href="../../generated/torch.cuda.synchronize.html#torch.cuda.synchronize">[docs]</a><span class="k">def</span> <span class="nf">synchronize</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">_device_t</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Waits for all kernels in all streams on a CUDA device to complete.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): device for which to synchronize.</span>
<span class="sd">            It uses the current device, given by :func:`~torch.cuda.current_device`,</span>
<span class="sd">            if :attr:`device` is ``None`` (default).</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">device</span><span class="p">(</span><span class="n">device</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_synchronize</span><span class="p">()</span></div>


<div class="viewcode-block" id="ipc_collect"><a class="viewcode-back" href="../../generated/torch.cuda.ipc_collect.html#torch.cuda.ipc_collect">[docs]</a><span class="k">def</span> <span class="nf">ipc_collect</span><span class="p">():</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Force collects GPU memory after it has been released by CUDA IPC.</span>

<span class="sd">    .. note::</span>
<span class="sd">        Checks if any sent CUDA tensors could be cleaned from the memory. Force</span>
<span class="sd">        closes shared memory file used for reference counting if there is no</span>
<span class="sd">        active counters. Useful when the producer process stopped actively sending</span>
<span class="sd">        tensors and want to release unused memory.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_ipc_collect</span><span class="p">()</span></div>


<div class="viewcode-block" id="current_stream"><a class="viewcode-back" href="../../generated/torch.cuda.current_stream.html#torch.cuda.current_stream">[docs]</a><span class="k">def</span> <span class="nf">current_stream</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">_device_t</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Stream</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns the currently selected :class:`Stream` for a given device.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): selected device. Returns</span>
<span class="sd">            the currently selected :class:`Stream` for the current device, given</span>
<span class="sd">            by :func:`~torch.cuda.current_device`, if :attr:`device` is ``None``</span>
<span class="sd">            (default).</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="n">streamdata</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getCurrentStream</span><span class="p">(</span>
        <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">))</span>
    <span class="k">return</span> <span class="n">Stream</span><span class="p">(</span><span class="n">stream_id</span><span class="o">=</span><span class="n">streamdata</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">device_index</span><span class="o">=</span><span class="n">streamdata</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">device_type</span><span class="o">=</span><span class="n">streamdata</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span></div>


<div class="viewcode-block" id="default_stream"><a class="viewcode-back" href="../../generated/torch.cuda.default_stream.html#torch.cuda.default_stream">[docs]</a><span class="k">def</span> <span class="nf">default_stream</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">_device_t</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Stream</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns the default :class:`Stream` for a given device.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): selected device. Returns</span>
<span class="sd">            the default :class:`Stream` for the current device, given by</span>
<span class="sd">            :func:`~torch.cuda.current_device`, if :attr:`device` is ``None``</span>
<span class="sd">            (default).</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="n">streamdata</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getDefaultStream</span><span class="p">(</span>
        <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">))</span>
    <span class="k">return</span> <span class="n">Stream</span><span class="p">(</span><span class="n">stream_id</span><span class="o">=</span><span class="n">streamdata</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">device_index</span><span class="o">=</span><span class="n">streamdata</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">device_type</span><span class="o">=</span><span class="n">streamdata</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span></div>


<div class="viewcode-block" id="current_blas_handle"><a class="viewcode-back" href="../../generated/torch.cuda.current_blas_handle.html#torch.cuda.current_blas_handle">[docs]</a><span class="k">def</span> <span class="nf">current_blas_handle</span><span class="p">():</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns cublasHandle_t pointer to current cuBLAS handle&quot;&quot;&quot;</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_getCurrentBlasHandle</span><span class="p">()</span></div>

<div class="viewcode-block" id="set_sync_debug_mode"><a class="viewcode-back" href="../../generated/torch.cuda.set_sync_debug_mode.html#torch.cuda.set_sync_debug_mode">[docs]</a><span class="k">def</span> <span class="nf">set_sync_debug_mode</span><span class="p">(</span><span class="n">debug_mode</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Sets the debug mode for cuda synchronizing operations.</span>

<span class="sd">    Args:</span>
<span class="sd">        debug_mode(str or int): if &quot;default&quot; or 0, don&#39;t error or warn on synchronizing operations,</span>
<span class="sd">            if &quot;warn&quot; or 1, warn on synchronizing operations, if &quot;error&quot; or 2, error out synchronizing operations.</span>

<span class="sd">    Warning:</span>
<span class="sd">        This is an experimental feature, and not all synchronizing operations will trigger warning or error. In</span>
<span class="sd">        particular, operations in torch.distributed and torch.sparse namespaces are not covered yet.</span>
<span class="sd">    &quot;&quot;&quot;</span>

    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">debug_mode</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
        <span class="k">if</span> <span class="n">debug_mode</span> <span class="o">==</span> <span class="s2">&quot;default&quot;</span><span class="p">:</span>
            <span class="n">debug_mode</span> <span class="o">=</span> <span class="mi">0</span>
        <span class="k">elif</span> <span class="n">debug_mode</span> <span class="o">==</span> <span class="s2">&quot;warn&quot;</span><span class="p">:</span>
            <span class="n">debug_mode</span> <span class="o">=</span> <span class="mi">1</span>
        <span class="k">elif</span> <span class="n">debug_mode</span> <span class="o">==</span> <span class="s2">&quot;error&quot;</span><span class="p">:</span>
            <span class="n">debug_mode</span> <span class="o">=</span> <span class="mi">2</span>
        <span class="k">else</span><span class="p">:</span>
            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;invalid value of debug_mode, expected one of `default`, `warn`, `error`&quot;</span><span class="p">)</span>

    <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_set_sync_debug_mode</span><span class="p">(</span><span class="n">debug_mode</span><span class="p">)</span></div>

<div class="viewcode-block" id="get_sync_debug_mode"><a class="viewcode-back" href="../../generated/torch.cuda.get_sync_debug_mode.html#torch.cuda.get_sync_debug_mode">[docs]</a><span class="k">def</span> <span class="nf">get_sync_debug_mode</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns current value of debug mode for cuda synchronizing operations.&quot;&quot;&quot;</span>

    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_cuda_get_sync_debug_mode</span><span class="p">()</span></div>


<div class="viewcode-block" id="memory_usage"><a class="viewcode-back" href="../../generated/torch.cuda.memory_usage.html#torch.cuda.memory_usage">[docs]</a><span class="k">def</span> <span class="nf">memory_usage</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="n">Device</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns the percent of time over the past sample period during which global (device)</span>
<span class="sd">    memory was being read or written. as given by `nvidia-smi`.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): selected device. Returns</span>
<span class="sd">            statistic for the current device, given by :func:`~torch.cuda.current_device`,</span>
<span class="sd">            if :attr:`device` is ``None`` (default).</span>

<span class="sd">    Warning: Each sample period may be between 1 second and 1/6 second,</span>
<span class="sd">    depending on the product being queried.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="k">try</span><span class="p">:</span>
        <span class="kn">import</span> <span class="nn">pynvml</span>  <span class="c1"># type: ignore[import]</span>
    <span class="k">except</span> <span class="ne">ModuleNotFoundError</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
        <span class="k">raise</span> <span class="ne">ModuleNotFoundError</span><span class="p">(</span><span class="s2">&quot;pynvml module not found, please install pynvml&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
    <span class="kn">from</span> <span class="nn">pynvml</span> <span class="kn">import</span> <span class="n">NVMLError_DriverNotLoaded</span>
    <span class="k">try</span><span class="p">:</span>
        <span class="n">pynvml</span><span class="o">.</span><span class="n">nvmlInit</span><span class="p">()</span>
    <span class="k">except</span> <span class="n">NVMLError_DriverNotLoaded</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;cuda driver can&#39;t be loaded, is cuda enabled?&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
    <span class="n">device</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
    <span class="n">handle</span> <span class="o">=</span> <span class="n">pynvml</span><span class="o">.</span><span class="n">nvmlDeviceGetHandleByIndex</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">pynvml</span><span class="o">.</span><span class="n">nvmlDeviceGetUtilizationRates</span><span class="p">(</span><span class="n">handle</span><span class="p">)</span><span class="o">.</span><span class="n">memory</span></div>


<div class="viewcode-block" id="utilization"><a class="viewcode-back" href="../../generated/torch.cuda.utilization.html#torch.cuda.utilization">[docs]</a><span class="k">def</span> <span class="nf">utilization</span><span class="p">(</span><span class="n">device</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="n">Device</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sa">r</span><span class="sd">&quot;&quot;&quot;Returns the percent of time over the past sample period during which one or</span>
<span class="sd">    more kernels was executing on the GPU as given by `nvidia-smi`.</span>

<span class="sd">    Args:</span>
<span class="sd">        device (torch.device or int, optional): selected device. Returns</span>
<span class="sd">            statistic for the current device, given by :func:`~torch.cuda.current_device`,</span>
<span class="sd">            if :attr:`device` is ``None`` (default).</span>

<span class="sd">    Warning: Each sample period may be between 1 second and 1/6 second,</span>
<span class="sd">    depending on the product being queried.</span>
<span class="sd">    &quot;&quot;&quot;</span>
    <span class="k">try</span><span class="p">:</span>
        <span class="kn">import</span> <span class="nn">pynvml</span>  <span class="c1"># type: ignore[import]</span>
    <span class="k">except</span> <span class="ne">ModuleNotFoundError</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
        <span class="k">raise</span> <span class="ne">ModuleNotFoundError</span><span class="p">(</span><span class="s2">&quot;pynvml module not found, please install pynvml&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
    <span class="kn">from</span> <span class="nn">pynvml</span> <span class="kn">import</span> <span class="n">NVMLError_DriverNotLoaded</span>
    <span class="k">try</span><span class="p">:</span>
        <span class="n">pynvml</span><span class="o">.</span><span class="n">nvmlInit</span><span class="p">()</span>
    <span class="k">except</span> <span class="n">NVMLError_DriverNotLoaded</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;cuda driver can&#39;t be loaded, is cuda enabled?&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
    <span class="n">device</span> <span class="o">=</span> <span class="n">_get_device_index</span><span class="p">(</span><span class="n">device</span><span class="p">,</span> <span class="n">optional</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
    <span class="n">handle</span> <span class="o">=</span> <span class="n">pynvml</span><span class="o">.</span><span class="n">nvmlDeviceGetHandleByIndex</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
    <span class="k">return</span> <span class="n">pynvml</span><span class="o">.</span><span class="n">nvmlDeviceGetUtilizationRates</span><span class="p">(</span><span class="n">handle</span><span class="p">)</span><span class="o">.</span><span class="n">gpu</span></div>


<span class="kn">from</span> <span class="nn">.memory</span> <span class="kn">import</span> <span class="o">*</span>  <span class="c1"># noqa: F403</span>


<span class="kn">from</span> <span class="nn">.random</span> <span class="kn">import</span> <span class="o">*</span>  <span class="c1"># noqa: F403</span>

<span class="c1">################################################################################</span>
<span class="c1"># Define Storage and Tensor classes</span>
<span class="c1">################################################################################</span>

<span class="nd">@staticmethod</span>  <span class="c1"># type: ignore[misc]</span>
<span class="k">def</span> <span class="nf">_lazy_new</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
    <span class="n">_lazy_init</span><span class="p">()</span>
    <span class="c1"># We may need to call lazy init again if we are a forked child</span>
    <span class="c1"># del _CudaBase.__new__</span>
    <span class="k">return</span> <span class="nb">super</span><span class="p">(</span><span class="n">_CudaBase</span><span class="p">,</span> <span class="bp">cls</span><span class="p">)</span><span class="o">.</span><span class="fm">__new__</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>


<span class="k">class</span> <span class="nc">_CudaBase</span><span class="p">:</span>
    <span class="n">is_cuda</span> <span class="o">=</span> <span class="kc">True</span>
    <span class="n">is_sparse</span> <span class="o">=</span> <span class="kc">False</span>

    <span class="k">def</span> <span class="nf">type</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
        <span class="c1"># We could use a Protocol here to tell mypy that self has `get_device` method</span>
        <span class="c1"># but it is only available in the typing module on Python &gt;= 3.8</span>
        <span class="c1"># or on typing_extensions module on Python &gt;= 3.6</span>
        <span class="k">with</span> <span class="n">device</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_device</span><span class="p">()):</span>  <span class="c1"># type: ignore[attr-defined]</span>
            <span class="k">return</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">type</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>  <span class="c1"># type: ignore[misc]</span>

    <span class="fm">__new__</span> <span class="o">=</span> <span class="n">_lazy_new</span>

<span class="kn">from</span> <span class="nn">torch.storage</span> <span class="kn">import</span> <span class="n">_LegacyStorage</span><span class="p">,</span> <span class="n">_warn_typed_storage_removal</span>

<span class="k">class</span> <span class="nc">_CudaLegacyStorage</span><span class="p">(</span><span class="n">_LegacyStorage</span><span class="p">):</span>
    <span class="nd">@classmethod</span>
    <span class="k">def</span> <span class="nf">from_buffer</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s1">&#39;from_buffer: Not available for CUDA storage&#39;</span><span class="p">)</span>

    <span class="nd">@classmethod</span>
    <span class="k">def</span> <span class="nf">_new_with_weak_ptr</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s1">&#39;_new_with_weak_ptr: Not available for CUDA storage&#39;</span><span class="p">)</span>

    <span class="nd">@classmethod</span>
    <span class="k">def</span> <span class="nf">_new_shared_filename</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">manager</span><span class="p">,</span> <span class="n">obj</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s1">&#39;_new_shared_filename: Not available for CUDA storage&#39;</span><span class="p">)</span>

<span class="k">class</span> <span class="nc">ByteStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">uint8</span>

<span class="k">class</span> <span class="nc">DoubleStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">double</span>

<span class="k">class</span> <span class="nc">FloatStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">float</span>

<span class="k">class</span> <span class="nc">HalfStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">half</span>

<span class="k">class</span> <span class="nc">LongStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">long</span>

<span class="k">class</span> <span class="nc">IntStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">int</span>

<span class="k">class</span> <span class="nc">ShortStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">short</span>

<span class="k">class</span> <span class="nc">CharStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">int8</span>

<span class="k">class</span> <span class="nc">BoolStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">bool</span>

<span class="k">class</span> <span class="nc">BFloat16Storage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">bfloat16</span>

<span class="k">class</span> <span class="nc">ComplexDoubleStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">cdouble</span>

<span class="k">class</span> <span class="nc">ComplexFloatStorage</span><span class="p">(</span><span class="n">_CudaLegacyStorage</span><span class="p">):</span>
    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="n">_warn_typed_storage_removal</span><span class="p">()</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span>

    <span class="nd">@classproperty</span>
    <span class="k">def</span> <span class="nf">_dtype</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">cfloat</span>

<span class="k">del</span> <span class="n">_LegacyStorage</span>
<span class="k">del</span> <span class="n">_CudaLegacyStorage</span>

<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">DoubleStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">FloatStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">LongStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">IntStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">ShortStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">CharStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">ByteStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">HalfStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">BoolStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">BFloat16Storage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">ComplexDoubleStorage</span><span class="p">)</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_storage_classes</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">ComplexFloatStorage</span><span class="p">)</span>

<span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">sparse</span>
<span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">profiler</span>
<span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">nvtx</span>
<span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">amp</span>
<span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">jiterator</span>

<span class="n">__all__</span> <span class="o">=</span> <span class="p">[</span>
    <span class="c1"># Typed storage and tensors</span>
    <span class="s1">&#39;BFloat16Storage&#39;</span><span class="p">,</span> <span class="s1">&#39;BFloat16Tensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;BoolStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;BoolTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;ByteStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;ByteTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;CharStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;CharTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;ComplexDoubleStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;ComplexFloatStorage&#39;</span><span class="p">,</span>
    <span class="s1">&#39;DoubleStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;DoubleTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;FloatStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;FloatTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;HalfStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;HalfTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;IntStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;IntTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;LongStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;LongTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;ShortStorage&#39;</span><span class="p">,</span> <span class="s1">&#39;ShortTensor&#39;</span><span class="p">,</span>
    <span class="s1">&#39;CUDAGraph&#39;</span><span class="p">,</span> <span class="s1">&#39;CudaError&#39;</span><span class="p">,</span> <span class="s1">&#39;DeferredCudaCallError&#39;</span><span class="p">,</span> <span class="s1">&#39;Event&#39;</span><span class="p">,</span> <span class="s1">&#39;ExternalStream&#39;</span><span class="p">,</span> <span class="s1">&#39;OutOfMemoryError&#39;</span><span class="p">,</span>
    <span class="s1">&#39;Stream&#39;</span><span class="p">,</span> <span class="s1">&#39;StreamContext&#39;</span><span class="p">,</span> <span class="s1">&#39;amp&#39;</span><span class="p">,</span> <span class="s1">&#39;caching_allocator_alloc&#39;</span><span class="p">,</span> <span class="s1">&#39;caching_allocator_delete&#39;</span><span class="p">,</span> <span class="s1">&#39;can_device_access_peer&#39;</span><span class="p">,</span>
    <span class="s1">&#39;check_error&#39;</span><span class="p">,</span> <span class="s1">&#39;cudaStatus&#39;</span><span class="p">,</span> <span class="s1">&#39;cudart&#39;</span><span class="p">,</span> <span class="s1">&#39;current_blas_handle&#39;</span><span class="p">,</span> <span class="s1">&#39;current_device&#39;</span><span class="p">,</span> <span class="s1">&#39;current_stream&#39;</span><span class="p">,</span> <span class="s1">&#39;default_generators&#39;</span><span class="p">,</span>
    <span class="s1">&#39;default_stream&#39;</span><span class="p">,</span> <span class="s1">&#39;device&#39;</span><span class="p">,</span> <span class="s1">&#39;device_count&#39;</span><span class="p">,</span> <span class="s1">&#39;device_of&#39;</span><span class="p">,</span> <span class="s1">&#39;empty_cache&#39;</span><span class="p">,</span> <span class="s1">&#39;get_allocator_backend&#39;</span><span class="p">,</span> <span class="s1">&#39;CUDAPluggableAllocator&#39;</span><span class="p">,</span>
    <span class="s1">&#39;change_current_allocator&#39;</span><span class="p">,</span> <span class="s1">&#39;get_arch_list&#39;</span><span class="p">,</span> <span class="s1">&#39;get_device_capability&#39;</span><span class="p">,</span> <span class="s1">&#39;get_device_name&#39;</span><span class="p">,</span> <span class="s1">&#39;get_device_properties&#39;</span><span class="p">,</span>
    <span class="s1">&#39;get_gencode_flags&#39;</span><span class="p">,</span> <span class="s1">&#39;get_rng_state&#39;</span><span class="p">,</span> <span class="s1">&#39;get_rng_state_all&#39;</span><span class="p">,</span> <span class="s1">&#39;get_sync_debug_mode&#39;</span><span class="p">,</span> <span class="s1">&#39;graph&#39;</span><span class="p">,</span> <span class="s1">&#39;graph_pool_handle&#39;</span><span class="p">,</span> <span class="s1">&#39;graphs&#39;</span><span class="p">,</span>
    <span class="s1">&#39;has_half&#39;</span><span class="p">,</span> <span class="s1">&#39;has_magma&#39;</span><span class="p">,</span> <span class="s1">&#39;init&#39;</span><span class="p">,</span> <span class="s1">&#39;initial_seed&#39;</span><span class="p">,</span> <span class="s1">&#39;ipc_collect&#39;</span><span class="p">,</span> <span class="s1">&#39;is_available&#39;</span><span class="p">,</span> <span class="s1">&#39;is_bf16_supported&#39;</span><span class="p">,</span>
    <span class="s1">&#39;is_current_stream_capturing&#39;</span><span class="p">,</span> <span class="s1">&#39;is_initialized&#39;</span><span class="p">,</span> <span class="s1">&#39;jiterator&#39;</span><span class="p">,</span> <span class="s1">&#39;list_gpu_processes&#39;</span><span class="p">,</span> <span class="s1">&#39;make_graphed_callables&#39;</span><span class="p">,</span>
    <span class="s1">&#39;manual_seed&#39;</span><span class="p">,</span> <span class="s1">&#39;manual_seed_all&#39;</span><span class="p">,</span> <span class="s1">&#39;max_memory_allocated&#39;</span><span class="p">,</span> <span class="s1">&#39;max_memory_cached&#39;</span><span class="p">,</span> <span class="s1">&#39;max_memory_reserved&#39;</span><span class="p">,</span>
    <span class="s1">&#39;mem_get_info&#39;</span><span class="p">,</span> <span class="s1">&#39;memory&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_allocated&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_cached&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_reserved&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_snapshot&#39;</span><span class="p">,</span>
    <span class="s1">&#39;memory_stats&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_stats_as_nested_dict&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_summary&#39;</span><span class="p">,</span> <span class="s1">&#39;memory_usage&#39;</span><span class="p">,</span> <span class="s1">&#39;nccl&#39;</span><span class="p">,</span> <span class="s1">&#39;nvtx&#39;</span><span class="p">,</span> <span class="s1">&#39;profiler&#39;</span><span class="p">,</span>
    <span class="s1">&#39;random&#39;</span><span class="p">,</span> <span class="s1">&#39;reset_accumulated_memory_stats&#39;</span><span class="p">,</span> <span class="s1">&#39;reset_max_memory_allocated&#39;</span><span class="p">,</span> <span class="s1">&#39;reset_max_memory_cached&#39;</span><span class="p">,</span>
    <span class="s1">&#39;reset_peak_memory_stats&#39;</span><span class="p">,</span> <span class="s1">&#39;seed&#39;</span><span class="p">,</span> <span class="s1">&#39;seed_all&#39;</span><span class="p">,</span> <span class="s1">&#39;set_device&#39;</span><span class="p">,</span> <span class="s1">&#39;set_per_process_memory_fraction&#39;</span><span class="p">,</span> <span class="s1">&#39;set_rng_state&#39;</span><span class="p">,</span>
    <span class="s1">&#39;set_rng_state_all&#39;</span><span class="p">,</span> <span class="s1">&#39;set_stream&#39;</span><span class="p">,</span> <span class="s1">&#39;set_sync_debug_mode&#39;</span><span class="p">,</span> <span class="s1">&#39;sparse&#39;</span><span class="p">,</span> <span class="s1">&#39;stream&#39;</span><span class="p">,</span> <span class="s1">&#39;streams&#39;</span><span class="p">,</span> <span class="s1">&#39;synchronize&#39;</span><span class="p">,</span> <span class="s1">&#39;utilization&#39;</span><span class="p">]</span>
</pre></div>

             </article>
             
            </div>
            <footer>
  

    <hr>

  
  <div role="contentinfo">
    <p>
        &copy; Copyright 2023, PyTorch Contributors.

    </p>
  </div>
    
      <div>
        Built with <a href="http://sphinx-doc.org/">Sphinx</a> using a <a href="https://github.com/rtfd/sphinx_rtd_theme">theme</a> provided by <a href="https://readthedocs.org">Read the Docs</a>.
      </div>
     

</footer>

          </div>
<script>

var match = window.location.href.match(/\/_[a-zA-Z0-9_]*.html|_dynamo/gi);
var url = window.location.href.lastIndexOf(match[match.length-1]);

if (url)
  {
    var div = '<div class="admonition note"><p class="admonition-title">Note</p><p><i class="fa fa-exclamation-circle" aria-hidden="true">&nbsp</i> This page describes an internal API which is not intended to be used outside of the PyTorch codebase and can be modified or removed without notice.</p></div>'
    document.getElementById("pytorch-article").insertAdjacentHTML('afterBegin', div)
  }
</script>
        </div>

        <div class="pytorch-content-right" id="pytorch-content-right">
          <div class="pytorch-right-menu" id="pytorch-right-menu">
            <div class="pytorch-side-scroll" id="pytorch-side-scroll-right">
              
            </div>
          </div>
        </div>
      </section>
    </div>

  
       <script type="text/javascript" id="documentation_options" data-url_root="../../" src="../../_static/documentation_options.js"></script>
         <script data-url_root="../../" id="documentation_options" src="../../_static/documentation_options.js"></script>
         <script src="../../_static/jquery.js"></script>
         <script src="../../_static/underscore.js"></script>
         <script src="../../_static/_sphinx_javascript_frameworks_compat.js"></script>
         <script src="../../_static/doctools.js"></script>
         <script src="../../_static/clipboard.min.js"></script>
         <script src="../../_static/copybutton.js"></script>
     

  <script type="text/javascript" src="../../_static/js/vendor/popper.min.js"></script>
  <script type="text/javascript" src="../../_static/js/vendor/bootstrap.min.js"></script>
  <script src="https://cdnjs.cloudflare.com/ajax/libs/list.js/1.5.0/list.min.js"></script>
  <script type="text/javascript" src="../../_static/js/theme.js"></script>

  <script type="text/javascript">
      jQuery(function () {
          SphinxRtdTheme.Navigation.enable(true);
      });
  </script>
 
<script script type="text/javascript">
  var collapsedSections = ['Developer Notes', 'Language Bindings', 'Libraries', 'Community'];
</script>

<img height="1" width="1" style="border-style:none;" alt="" src="https://www.googleadservices.com/pagead/conversion/795629140/?label=txkmCPmdtosBENSssfsC&amp;guid=ON&amp;script=0"/>


  <!-- Begin Footer -->

  <div class="container-fluid docs-tutorials-resources" id="docs-tutorials-resources">
    <div class="container">
      <div class="row">
        <div class="col-md-4 text-center">
          <h2>Docs</h2>
          <p>Access comprehensive developer documentation for PyTorch</p>
          <a class="with-right-arrow" href="https://pytorch.org/docs/stable/index.html">View Docs</a>
        </div>

        <div class="col-md-4 text-center">
          <h2>Tutorials</h2>
          <p>Get in-depth tutorials for beginners and advanced developers</p>
          <a class="with-right-arrow" href="https://pytorch.org/tutorials">View Tutorials</a>
        </div>

        <div class="col-md-4 text-center">
          <h2>Resources</h2>
          <p>Find development resources and get your questions answered</p>
          <a class="with-right-arrow" href="https://pytorch.org/resources">View Resources</a>
        </div>
      </div>
    </div>
  </div>

  <footer class="site-footer">
    <div class="container footer-container">
      <div class="footer-logo-wrapper">
        <a href="https://pytorch.org/" class="footer-logo"></a>
      </div>

      <div class="footer-links-wrapper">
        <div class="footer-links-col">
          <ul>
            <li class="list-title"><a href="https://pytorch.org/">PyTorch</a></li>
            <li><a href="https://pytorch.org/get-started">Get Started</a></li>
            <li><a href="https://pytorch.org/features">Features</a></li>
            <li><a href="https://pytorch.org/ecosystem">Ecosystem</a></li>
            <li><a href="https://pytorch.org/blog/">Blog</a></li>
            <li><a href="https://github.com/pytorch/pytorch/blob/master/CONTRIBUTING.md">Contributing</a></li>
          </ul>
        </div>

        <div class="footer-links-col">
          <ul>
            <li class="list-title"><a href="https://pytorch.org/resources">Resources</a></li>
            <li><a href="https://pytorch.org/tutorials">Tutorials</a></li>
            <li><a href="https://pytorch.org/docs/stable/index.html">Docs</a></li>
            <li><a href="https://discuss.pytorch.org" target="_blank">Discuss</a></li>
            <li><a href="https://github.com/pytorch/pytorch/issues" target="_blank">Github Issues</a></li>
            <li><a href="https://pytorch.org/assets/brand-guidelines/PyTorch-Brand-Guidelines.pdf" target="_blank">Brand Guidelines</a></li>
          </ul>
        </div>

        <div class="footer-links-col">
          <ul>
            <li class="list-title">Stay up to date</li>
            <li><a href="https://www.facebook.com/pytorch" target="_blank">Facebook</a></li>
            <li><a href="https://twitter.com/pytorch" target="_blank">Twitter</a></li>
            <li><a href="https://www.youtube.com/pytorch" target="_blank">YouTube</a></li>
            <li><a href="https://www.linkedin.com/company/pytorch" target="_blank">LinkedIn</a></li>
          </ul>  
          </div>

        <div class="footer-links-col">
          <ul>
            <li class="list-title">PyTorch Podcasts</li>
            <li><a href="https://open.spotify.com/show/6UzHKeiy368jKfQMKKvJY5" target="_blank">Spotify</a></li>
            <li><a href="https://podcasts.apple.com/us/podcast/pytorch-developer-podcast/id1566080008" target="_blank">Apple</a></li>
            <li><a href="https://www.google.com/podcasts?feed=aHR0cHM6Ly9mZWVkcy5zaW1wbGVjYXN0LmNvbS9PQjVGa0lsOA%3D%3D" target="_blank">Google</a></li>
            <li><a href="https://music.amazon.com/podcasts/7a4e6f0e-26c2-49e9-a478-41bd244197d0/PyTorch-Developer-Podcast?" target="_blank">Amazon</a></li>
          </ul>
         </div>
        </div>
        
        <div class="privacy-policy">
          <ul>
            <li class="privacy-policy-links"><a href="https://www.linuxfoundation.org/terms/" target="_blank">Terms</a></li>
            <li class="privacy-policy-links">|</li>
            <li class="privacy-policy-links"><a href="https://www.linuxfoundation.org/privacy-policy/" target="_blank">Privacy</a></li>
          </ul>
        </div>
        <div class="copyright">
        <p>© Copyright The Linux Foundation. The PyTorch Foundation is a project of The Linux Foundation.
          For web site terms of use, trademark policy and other policies applicable to The PyTorch Foundation please see
          <a href="www.linuxfoundation.org/policies/">www.linuxfoundation.org/policies/</a>. The PyTorch Foundation supports the PyTorch open source
          project, which has been established as PyTorch Project a Series of LF Projects, LLC. For policies applicable to the PyTorch Project a Series of LF Projects, LLC,
          please see <a href="www.lfprojects.org/policies/">www.lfprojects.org/policies/</a>.</p>
      </div>
     </div>

  </footer>

  <div class="cookie-banner-wrapper">
  <div class="container">
    <p class="gdpr-notice">To analyze traffic and optimize your experience, we serve cookies on this site. By clicking or navigating, you agree to allow our usage of cookies. As the current maintainers of this site, Facebook’s Cookies Policy applies. Learn more, including about available controls: <a href="https://www.facebook.com/policies/cookies/">Cookies Policy</a>.</p>
    <img class="close-button" src="../../_static/images/pytorch-x.svg">
  </div>
</div>

  <!-- End Footer -->

  <!-- Begin Mobile Menu -->

  <div class="mobile-main-menu">
    <div class="container-fluid">
      <div class="container">
        <div class="mobile-main-menu-header-container">
          <a class="header-logo" href="https://pytorch.org/" aria-label="PyTorch"></a>
          <a class="main-menu-close-button" href="#" data-behavior="close-mobile-menu"></a>
        </div>
      </div>
    </div>

    <div class="mobile-main-menu-links-container">
      <div class="main-menu">
        <ul>
          <li>
            <a href="https://pytorch.org/get-started">Get Started</a>
          </li>

          <li>
            <a href="https://pytorch.org/ecosystem">Ecosystem</a>
          </li>
            
          <li>
            <a href="https://pytorch.org/mobile">Mobile</a>
          </li>

          <li>
            <a href="https://pytorch.org/blog/">Blog</a>
          </li>

          <li>
            <a href="https://pytorch.org/tutorials">Tutorials</a>
          </li>

          <li class="resources-mobile-menu-title" class="active">
            Docs
          </li>

          <ul class="resources-mobile-menu-items">
            <li>
              <a href="https://pytorch.org/docs/stable/index.html">PyTorch</a>
            </li>

            <li>
              <a href="https://pytorch.org/audio/stable/index.html">torchaudio</a>
            </li>

            <li>
              <a href="https://pytorch.org/text/stable/index.html">torchtext</a>
            </li>

            <li>
              <a href="https://pytorch.org/vision/stable/index.html">torchvision</a>
            </li>

            <li>
              <a href="https://pytorch.org/torcharrow">torcharrow</a>
            </li>

            <li>
              <a href="https://pytorch.org/data">TorchData</a>
            </li>

            <li>
              <a href="https://pytorch.org/torchrec">TorchRec</a>
            </li>

            <li>
              <a href="https://pytorch.org/serve/">TorchServe</a>
            </li>

            <li>
              <a href="https://pytorch.org/torchx/">TorchX</a>
            </li>

            <li>
              <a href="https://pytorch.org/xla">PyTorch on XLA Devices</a>
            </li>
          </ul>

          <li class="resources-mobile-menu-title">
            Resources
          </li>
            
           <ul class="resources-mobile-menu-items">

            <li>
              <a href="https://pytorch.org/features">About</a>
            </li>

            <li>
              <a href="https://pytorch.org/foundation">PyTorch Foundation</a>
            </li>

            <li>
              <a href="https://pytorch.org/#community-module">Community</a>
            </li>

            <li>
              <a href="https://pytorch.org/community-stories">Community Stories</a>
            </li>

            <li>
              <a href="https://pytorch.org/resources">Developer Resources</a>
            </li>

            <li>
              <a href="https://pytorch.org/events">Events</a>
            </li>

            <li>
              <a href="https://discuss.pytorch.org/">Forums</a>
            </li>

            <li>
              <a href="https://pytorch.org/hub">Models (Beta)</a>
            </li>
          </ul>

          <li>
            <a href="https://github.com/pytorch/pytorch">Github</a>
          </li>
        </ul>
      </div>
    </div>
  </div>

  <!-- End Mobile Menu -->

  <script type="text/javascript" src="../../_static/js/vendor/anchor.min.js"></script>

  <script type="text/javascript">
    $(document).ready(function() {
      mobileMenu.bind();
      mobileTOC.bind();
      pytorchAnchors.bind();
      sideMenus.bind();
      scrollToAnchor.bind();
      highlightNavigation.bind();
      mainMenuDropdown.bind();
      filterTags.bind();

      // Add class to links that have code blocks, since we cannot create links in code blocks
      $("article.pytorch-article a span.pre").each(function(e) {
        $(this).closest("a").addClass("has-code");
      });
    })
  </script>
</body>
</html>