2.4/amp.html



<!DOCTYPE html>
<!--[if IE 8]><html class="no-js lt-ie9" lang="en" > <![endif]-->
<!--[if gt IE 8]><!--> <html class="no-js" lang="en" > <!--<![endif]-->
<head>
  <meta name="robots" content="noindex">
  <meta charset="utf-8">
  
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  
  <title>Automatic Mixed Precision package - torch.amp &mdash; PyTorch 2.4 documentation</title>
  

    <link rel="canonical" href="https://pytorch.org/docs/stable/amp.html"/>
  

  <link rel="stylesheet" href="_static/css/theme.css" type="text/css" />
  <!-- <link rel="stylesheet" href="_static/pygments.css" type="text/css" /> -->
  <link rel="stylesheet" href="_static/pygments.css" type="text/css" />
  <link rel="stylesheet" href="_static/css/theme.css" type="text/css" />
  <link rel="stylesheet" href="_static/copybutton.css" type="text/css" />
  <link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex@0.10.0-beta/dist/katex.min.css" type="text/css" />
  <link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex@0.13.11/dist/katex.min.css" type="text/css" />
  <link rel="stylesheet" href="_static/katex-math.css" type="text/css" />
  <link rel="stylesheet" href="_static/sphinx-dropdown.css" type="text/css" />
  <link rel="stylesheet" href="_static/panels-bootstrap.min.css" type="text/css" />
  <link rel="stylesheet" href="_static/css/jit.css" type="text/css" />
    <link rel="index" title="Index" href="genindex.html" />
    <link rel="search" title="Search" href="search.html" />
    <link rel="next" title="Automatic differentiation package - torch.autograd" href="autograd.html" />
    <link rel="prev" title="Tensor Views" href="tensor_view.html" />


  <!-- Google Tag Manager -->
    <script>(function(w,d,s,l,i){w[l]=w[l]||[];w[l].push({'gtm.start':
    new Date().getTime(),event:'gtm.js'});var f=d.getElementsByTagName(s)[0],
    j=d.createElement(s),dl=l!='dataLayer'?'&l='+l:'';j.async=true;j.src=
    'https://www.googletagmanager.com/gtm.js?id='+i+dl;f.parentNode.insertBefore(j,f);
    })(window,document,'script','dataLayer','GTM-T8XT4PS');</script>
    <!-- End Google Tag Manager -->
  

  <script src="_static/js/modernizr.min.js"></script>

  <!-- Preload the theme fonts -->

<link rel="preload" href="_static/fonts/FreightSans/freight-sans-book.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="_static/fonts/FreightSans/freight-sans-medium.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="_static/fonts/IBMPlexMono/IBMPlexMono-Medium.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="_static/fonts/FreightSans/freight-sans-bold.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="_static/fonts/FreightSans/freight-sans-medium-italic.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="_static/fonts/IBMPlexMono/IBMPlexMono-SemiBold.woff2" as="font" type="font/woff2" crossorigin="anonymous">

<!-- Preload the katex fonts -->

<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Math-Italic.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Main-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Main-Bold.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size1-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size4-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size2-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Size3-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
<link rel="preload" href="https://cdn.jsdelivr.net/npm/katex@0.10.0/dist/fonts/KaTeX_Caligraphic-Regular.woff2" as="font" type="font/woff2" crossorigin="anonymous">
  <link rel="stylesheet" href="https://use.fontawesome.com/releases/v5.15.2/css/all.css" integrity="sha384-vSIIfh2YWi9wW0r9iZe7RJPrKwp6bG+s9QZMoITbCckVJqGCCRhc+ccxNcdpHuYu" crossorigin="anonymous">
</head>

<div class="container-fluid header-holder tutorials-header" id="header-holder">
  <div class="container">
    <div class="header-container">
      <a class="header-logo" href="https://pytorch.org/" aria-label="PyTorch"></a>

      <div class="main-menu">
        <ul>

          <li class="main-menu-item">
          <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="with-down-arrow">
                Learn
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/get-started">
                  <span class=dropdown-title>Get Started</span>
                  <p>Run PyTorch locally or get started quickly with one of the supported cloud platforms</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/tutorials">
                  <span class="dropdown-title">Tutorials</span>
                  <p>Whats new in PyTorch tutorials</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/tutorials/beginner/basics/intro.html">
                  <span class="dropdown-title">Learn the Basics</span>
                  <p>Familiarize yourself with PyTorch concepts and modules</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/tutorials/recipes/recipes_index.html">
                  <span class="dropdown-title">PyTorch Recipes</span>
                  <p>Bite-size, ready-to-deploy PyTorch code examples</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/tutorials/beginner/introyt.html">
                  <span class="dropdown-title">Intro to PyTorch - YouTube Series</span>
                  <p>Master PyTorch basics with our engaging YouTube tutorial series</p>
                </a>
              </div>
            </div>
          </li>

          <li>
          <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="with-down-arrow">
                Ecosystem
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/ecosystem">
                  <span class="dropdown-title">Tools</span>
                  <p>Learn about the tools and frameworks in the PyTorch Ecosystem</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/#community-module">
                  <span class=dropdown-title>Community</span>
                  <p>Join the PyTorch developer community to contribute, learn, and get your questions answered</p>
                </a>
                <a class="nav-dropdown-item" href="https://discuss.pytorch.org/" target="_blank">
                  <span class=dropdown-title>Forums</span>
                  <p>A place to discuss PyTorch code, issues, install, research</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/resources">
                  <span class=dropdown-title>Developer Resources</span>
                  <p>Find resources and get questions answered</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/ecosystem/contributor-awards-2023">
                  <span class="dropdown-title">Contributor Awards - 2023</span>
                  <p>Award winners announced at this year's PyTorch Conference</p>
                </a>
              </div>
            </div>
          </li>

          <li>
          <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="with-down-arrow">
                Edge
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/edge">
                  <span class="dropdown-title">About PyTorch Edge</span>
                  <p>Build innovative and privacy-aware AI experiences for edge devices</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/executorch-overview">
                  <span class="dropdown-title">ExecuTorch</span>
                  <p>End-to-end solution for enabling on-device inference capabilities across mobile and edge devices</p>
                </a>
              </div>
            </div>  
          </li>

          <li class="main-menu-item">
            <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="with-down-arrow">
                Docs
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/docs/stable/index.html">
                  <span class="dropdown-title">PyTorch</span>
                  <p>Explore the documentation for comprehensive guidance on how to use PyTorch</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/pytorch-domains">
                  <span class="dropdown-title">PyTorch Domains</span>
                  <p>Read the PyTorch Domains documentation to learn more about domain-specific libraries</p>
                </a>
              </div>
            </div>
          </li>

          <li>
            <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="with-down-arrow">
                Blogs & News 
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/blog/">
                  <span class="dropdown-title">PyTorch Blog</span>
                  <p>Catch up on the latest technical news and happenings</p>
                </a>
                 <a class="nav-dropdown-item" href="https://pytorch.org/community-blog">
                  <span class="dropdown-title">Community Blog</span>
                  <p>Stories from the PyTorch ecosystem</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/videos">
                  <span class="dropdown-title">Videos</span>
                  <p>Learn about the latest PyTorch tutorials, new, and more </p>
                <a class="nav-dropdown-item" href="https://pytorch.org/community-stories">
                  <span class="dropdown-title">Community Stories</span>
                  <p>Learn how our community solves real, everyday machine learning problems with PyTorch</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/events">
                  <span class="dropdown-title">Events</span>
                  <p>Find events, webinars, and podcasts</p>
                </a>
            </div>
          </li>

          <li>
            <div id="resourcesDropdownButton" data-toggle="resources-dropdown" class="resources-dropdown">
              <a class="with-down-arrow">
                About
              </a>
              <div class="resources-dropdown-menu">
                <a class="nav-dropdown-item" href="https://pytorch.org/foundation">
                  <span class="dropdown-title">PyTorch Foundation</span>
                  <p>Learn more about the PyTorch Foundation</p>
                </a>
                <a class="nav-dropdown-item" href="https://pytorch.org/governing-board">
                  <span class="dropdown-title">Governing Board</span>
                  <p></p>
                </a>
              </div>
            </div>
          </li>

          <li class="main-menu-item">
            <div class="no-dropdown">
              <a href="https://pytorch.org/join" data-cta="join">
                Become a Member
              </a>
            </div>
          </li>
          <li>
           <div class="main-menu-item">
             <a href="https://github.com/pytorch/pytorch" class="github-icon">
             </a>
           </div>
          </li>
          <!--- TODO: This block adds the search icon to the nav bar. We will enable it later. 
          <li>
            <div class="main-menu-item">
             <a href="https://github.com/pytorch/pytorch" class="search-icon">
             </a>
            </div>
          </li>
          --->
        </ul>
      </div>

      <a class="main-menu-open-button" href="#" data-behavior="open-mobile-menu"></a>
    </div>
  </div>
</div>

<body class="pytorch-body">

   
    <div class="table-of-contents-link-wrapper">
      <span>Table of Contents</span>
      <a href="#" class="toggle-table-of-contents" data-behavior="toggle-table-of-contents"></a>
    </div>

    <nav data-toggle="wy-nav-shift" class="pytorch-left-menu" id="pytorch-left-menu">
      <div class="pytorch-side-scroll">
        <div class="pytorch-menu pytorch-menu-vertical" data-spy="affix" role="navigation" aria-label="main navigation">
          <div class="pytorch-left-menu-search">
            
    <div class="version">
      <a href='https://pytorch.org/docs/versions.html'>2.4 &#x25BC</a>
    </div>
    

<div role="search">
  <form id="rtd-search-form" class="wy-form" action="search.html" method="get">
    <input type="text" name="q" placeholder="Search Docs" />
    <input type="hidden" name="check_keywords" value="yes" />
    <input type="hidden" name="area" value="default" />
  </form>
</div>

          </div>

          
              <p class="caption" role="heading"><span class="caption-text">Community</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="community/build_ci_governance.html">PyTorch Governance | Build + CI</a></li>
<li class="toctree-l1"><a class="reference internal" href="community/contribution_guide.html">PyTorch Contribution Guide</a></li>
<li class="toctree-l1"><a class="reference internal" href="community/design.html">PyTorch Design Philosophy</a></li>
<li class="toctree-l1"><a class="reference internal" href="community/governance.html">PyTorch Governance | Mechanics</a></li>
<li class="toctree-l1"><a class="reference internal" href="community/persons_of_interest.html">PyTorch Governance | Maintainers</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Developer Notes</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="notes/amp_examples.html">Automatic Mixed Precision examples</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/autograd.html">Autograd mechanics</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/broadcasting.html">Broadcasting semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/cpu_threading_torchscript_inference.html">CPU threading and TorchScript inference</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/cuda.html">CUDA semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/custom_operators.html">PyTorch Custom Operators Landing Page</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/ddp.html">Distributed Data Parallel</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/extending.html">Extending PyTorch</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/extending.func.html">Extending torch.func with autograd.Function</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/faq.html">Frequently Asked Questions</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/fsdp.html">FSDP Notes</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/get_start_xpu.html">Pytorch 2.4: Getting Started on Intel GPU</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/gradcheck.html">Gradcheck mechanics</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/hip.html">HIP (ROCm) semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/large_scale_deployments.html">Features for large-scale deployments</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/modules.html">Modules</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/mps.html">MPS backend</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/multiprocessing.html">Multiprocessing best practices</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/numerical_accuracy.html">Numerical accuracy</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/randomness.html">Reproducibility</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/serialization.html">Serialization semantics</a></li>
<li class="toctree-l1"><a class="reference internal" href="notes/windows.html">Windows FAQ</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Language Bindings</span></p>
<ul>
<li class="toctree-l1"><a class="reference internal" href="cpp_index.html">C++</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/javadoc/">Javadoc</a></li>
<li class="toctree-l1"><a class="reference internal" href="deploy.html">torch::deploy</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Python API</span></p>
<ul class="current">
<li class="toctree-l1"><a class="reference internal" href="torch.html">torch</a></li>
<li class="toctree-l1"><a class="reference internal" href="nn.html">torch.nn</a></li>
<li class="toctree-l1"><a class="reference internal" href="nn.functional.html">torch.nn.functional</a></li>
<li class="toctree-l1"><a class="reference internal" href="tensors.html">torch.Tensor</a></li>
<li class="toctree-l1"><a class="reference internal" href="tensor_attributes.html">Tensor Attributes</a></li>
<li class="toctree-l1"><a class="reference internal" href="tensor_view.html">Tensor Views</a></li>
<li class="toctree-l1 current"><a class="current reference internal" href="#">torch.amp</a></li>
<li class="toctree-l1"><a class="reference internal" href="autograd.html">torch.autograd</a></li>
<li class="toctree-l1"><a class="reference internal" href="library.html">torch.library</a></li>
<li class="toctree-l1"><a class="reference internal" href="cpu.html">torch.cpu</a></li>
<li class="toctree-l1"><a class="reference internal" href="cuda.html">torch.cuda</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch_cuda_memory.html">Understanding CUDA Memory Usage</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch_cuda_memory.html#generating-a-snapshot">Generating a Snapshot</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch_cuda_memory.html#using-the-visualizer">Using the visualizer</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch_cuda_memory.html#snapshot-api-reference">Snapshot API Reference</a></li>
<li class="toctree-l1"><a class="reference internal" href="mps.html">torch.mps</a></li>
<li class="toctree-l1"><a class="reference internal" href="xpu.html">torch.xpu</a></li>
<li class="toctree-l1"><a class="reference internal" href="mtia.html">torch.mtia</a></li>
<li class="toctree-l1"><a class="reference internal" href="meta.html">Meta device</a></li>
<li class="toctree-l1"><a class="reference internal" href="backends.html">torch.backends</a></li>
<li class="toctree-l1"><a class="reference internal" href="export.html">torch.export</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.html">torch.distributed</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.algorithms.join.html">torch.distributed.algorithms.join</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.elastic.html">torch.distributed.elastic</a></li>
<li class="toctree-l1"><a class="reference internal" href="fsdp.html">torch.distributed.fsdp</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.optim.html">torch.distributed.optim</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.pipelining.html">torch.distributed.pipelining</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.tensor.parallel.html">torch.distributed.tensor.parallel</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributed.checkpoint.html">torch.distributed.checkpoint</a></li>
<li class="toctree-l1"><a class="reference internal" href="distributions.html">torch.distributions</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch.compiler.html">torch.compiler</a></li>
<li class="toctree-l1"><a class="reference internal" href="fft.html">torch.fft</a></li>
<li class="toctree-l1"><a class="reference internal" href="func.html">torch.func</a></li>
<li class="toctree-l1"><a class="reference internal" href="futures.html">torch.futures</a></li>
<li class="toctree-l1"><a class="reference internal" href="fx.html">torch.fx</a></li>
<li class="toctree-l1"><a class="reference internal" href="fx.experimental.html">torch.fx.experimental</a></li>
<li class="toctree-l1"><a class="reference internal" href="hub.html">torch.hub</a></li>
<li class="toctree-l1"><a class="reference internal" href="jit.html">torch.jit</a></li>
<li class="toctree-l1"><a class="reference internal" href="linalg.html">torch.linalg</a></li>
<li class="toctree-l1"><a class="reference internal" href="monitor.html">torch.monitor</a></li>
<li class="toctree-l1"><a class="reference internal" href="signal.html">torch.signal</a></li>
<li class="toctree-l1"><a class="reference internal" href="special.html">torch.special</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch.overrides.html">torch.overrides</a></li>
<li class="toctree-l1"><a class="reference internal" href="package.html">torch.package</a></li>
<li class="toctree-l1"><a class="reference internal" href="profiler.html">torch.profiler</a></li>
<li class="toctree-l1"><a class="reference internal" href="nn.init.html">torch.nn.init</a></li>
<li class="toctree-l1"><a class="reference internal" href="nn.attention.html">torch.nn.attention</a></li>
<li class="toctree-l1"><a class="reference internal" href="onnx.html">torch.onnx</a></li>
<li class="toctree-l1"><a class="reference internal" href="optim.html">torch.optim</a></li>
<li class="toctree-l1"><a class="reference internal" href="complex_numbers.html">Complex Numbers</a></li>
<li class="toctree-l1"><a class="reference internal" href="ddp_comm_hooks.html">DDP Communication Hooks</a></li>
<li class="toctree-l1"><a class="reference internal" href="quantization.html">Quantization</a></li>
<li class="toctree-l1"><a class="reference internal" href="rpc.html">Distributed RPC Framework</a></li>
<li class="toctree-l1"><a class="reference internal" href="random.html">torch.random</a></li>
<li class="toctree-l1"><a class="reference internal" href="masked.html">torch.masked</a></li>
<li class="toctree-l1"><a class="reference internal" href="nested.html">torch.nested</a></li>
<li class="toctree-l1"><a class="reference internal" href="size.html">torch.Size</a></li>
<li class="toctree-l1"><a class="reference internal" href="sparse.html">torch.sparse</a></li>
<li class="toctree-l1"><a class="reference internal" href="storage.html">torch.Storage</a></li>
<li class="toctree-l1"><a class="reference internal" href="testing.html">torch.testing</a></li>
<li class="toctree-l1"><a class="reference internal" href="utils.html">torch.utils</a></li>
<li class="toctree-l1"><a class="reference internal" href="benchmark_utils.html">torch.utils.benchmark</a></li>
<li class="toctree-l1"><a class="reference internal" href="bottleneck.html">torch.utils.bottleneck</a></li>
<li class="toctree-l1"><a class="reference internal" href="checkpoint.html">torch.utils.checkpoint</a></li>
<li class="toctree-l1"><a class="reference internal" href="cpp_extension.html">torch.utils.cpp_extension</a></li>
<li class="toctree-l1"><a class="reference internal" href="data.html">torch.utils.data</a></li>
<li class="toctree-l1"><a class="reference internal" href="deterministic.html">torch.utils.deterministic</a></li>
<li class="toctree-l1"><a class="reference internal" href="jit_utils.html">torch.utils.jit</a></li>
<li class="toctree-l1"><a class="reference internal" href="dlpack.html">torch.utils.dlpack</a></li>
<li class="toctree-l1"><a class="reference internal" href="mobile_optimizer.html">torch.utils.mobile_optimizer</a></li>
<li class="toctree-l1"><a class="reference internal" href="model_zoo.html">torch.utils.model_zoo</a></li>
<li class="toctree-l1"><a class="reference internal" href="tensorboard.html">torch.utils.tensorboard</a></li>
<li class="toctree-l1"><a class="reference internal" href="module_tracker.html">torch.utils.module_tracker</a></li>
<li class="toctree-l1"><a class="reference internal" href="type_info.html">Type Info</a></li>
<li class="toctree-l1"><a class="reference internal" href="named_tensor.html">Named Tensors</a></li>
<li class="toctree-l1"><a class="reference internal" href="name_inference.html">Named Tensors operator coverage</a></li>
<li class="toctree-l1"><a class="reference internal" href="config_mod.html">torch.__config__</a></li>
<li class="toctree-l1"><a class="reference internal" href="future_mod.html">torch.__future__</a></li>
<li class="toctree-l1"><a class="reference internal" href="logging.html">torch._logging</a></li>
<li class="toctree-l1"><a class="reference internal" href="torch_environment_variables.html">Torch Environment Variables</a></li>
</ul>
<p class="caption" role="heading"><span class="caption-text">Libraries</span></p>
<ul>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/audio/stable">torchaudio</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/data">TorchData</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/torchrec">TorchRec</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/serve">TorchServe</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/text/stable">torchtext</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/vision/stable">torchvision</a></li>
<li class="toctree-l1"><a class="reference external" href="https://pytorch.org/xla/">PyTorch on XLA Devices</a></li>
</ul>

            
        </div>
      </div>
    </nav>

    <div class="pytorch-container">
      <div class="pytorch-page-level-bar" id="pytorch-page-level-bar">
        <div class="pytorch-breadcrumbs-wrapper">
          

<div role="navigation" aria-label="breadcrumbs navigation">

  <ul class="pytorch-breadcrumbs">
    
      <li>
        <a href="index.html">
          
            Docs
          
        </a> &gt;
      </li>

        
      <li>Automatic Mixed Precision package - torch.amp</li>
    
    
      <li class="pytorch-breadcrumbs-aside">
        
            
            <a href="_sources/amp.rst.txt" rel="nofollow"><img src="_static/images/view-page-source-icon.svg"></a>
          
        
      </li>
    
  </ul>

  
</div>
        </div>

        <div class="pytorch-shortcuts-wrapper" id="pytorch-shortcuts-wrapper">
          Shortcuts
        </div>
      </div>

      <section data-toggle="wy-nav-shift" id="pytorch-content-wrap" class="pytorch-content-wrap">
        <div class="pytorch-content-left">

        
          <!-- Google Tag Manager (noscript) -->
          <noscript><iframe src="https://www.googletagmanager.com/ns.html?id=GTM-T8XT4PS"
          height="0" width="0" style="display:none;visibility:hidden"></iframe></noscript>
          <!-- End Google Tag Manager (noscript) -->
          
          <div class="rst-content">
          
            <div role="main" class="main-content" itemscope="itemscope" itemtype="http://schema.org/Article">
             <article itemprop="articleBody" id="pytorch-article" class="pytorch-article">
              
  <div class="section" id="automatic-mixed-precision-package-torch-amp">
<h1>Automatic Mixed Precision package - torch.amp<a class="headerlink" href="#automatic-mixed-precision-package-torch-amp" title="Permalink to this heading">¶</a></h1>
<span class="target" id="module-torch.cpu.amp"></span><span class="target" id="module-torch.cuda.amp"></span><span class="target" id="module-torch.amp"></span><p><a class="reference internal" href="#module-torch.amp" title="torch.amp"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.amp</span></code></a> provides convenience methods for mixed precision,
where some operations use the <code class="docutils literal notranslate"><span class="pre">torch.float32</span></code> (<code class="docutils literal notranslate"><span class="pre">float</span></code>) datatype and other operations
use lower precision floating point datatype (<code class="docutils literal notranslate"><span class="pre">lower_precision_fp</span></code>): <code class="docutils literal notranslate"><span class="pre">torch.float16</span></code> (<code class="docutils literal notranslate"><span class="pre">half</span></code>) or <code class="docutils literal notranslate"><span class="pre">torch.bfloat16</span></code>. Some ops, like linear layers and convolutions,
are much faster in <code class="docutils literal notranslate"><span class="pre">lower_precision_fp</span></code>. Other ops, like reductions, often require the dynamic
range of <code class="docutils literal notranslate"><span class="pre">float32</span></code>.  Mixed precision tries to match each op to its appropriate datatype.</p>
<p>Ordinarily, “automatic mixed precision training” with datatype of <code class="docutils literal notranslate"><span class="pre">torch.float16</span></code> uses <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a> and
<code class="xref py py-class docutils literal notranslate"><span class="pre">torch.amp.GradScaler</span></code> together, as shown in the <a class="reference internal" href="notes/amp_examples.html#amp-examples"><span class="std std-ref">Automatic Mixed Precision examples</span></a>
and <a class="reference external" href="https://pytorch.org/tutorials/recipes/recipes/amp_recipe.html">Automatic Mixed Precision recipe</a>.
However, <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a> and <code class="xref py py-class docutils literal notranslate"><span class="pre">torch.GradScaler</span></code> are modular, and may be used separately if desired.
As shown in the CPU example section of <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a>, “automatic mixed precision training/inference” on CPU with
datatype of <code class="docutils literal notranslate"><span class="pre">torch.bfloat16</span></code> only uses <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a>.</p>
<div class="admonition warning">
<p class="admonition-title">Warning</p>
<p><code class="docutils literal notranslate"><span class="pre">torch.cuda.amp.autocast(args...)</span></code> and <code class="docutils literal notranslate"><span class="pre">torch.cpu.amp.autocast(args...)</span></code> will be deprecated. Please use <code class="docutils literal notranslate"><span class="pre">torch.autocast(&quot;cuda&quot;,</span> <span class="pre">args...)</span></code> or <code class="docutils literal notranslate"><span class="pre">torch.autocast(&quot;cpu&quot;,</span> <span class="pre">args...)</span></code> instead.
<code class="docutils literal notranslate"><span class="pre">torch.cuda.amp.GradScaler(args...)</span></code> and <code class="docutils literal notranslate"><span class="pre">torch.cpu.amp.GradScaler(args...)</span></code> will be deprecated. Please use <code class="docutils literal notranslate"><span class="pre">torch.GradScaler(&quot;cuda&quot;,</span> <span class="pre">args...)</span></code> or <code class="docutils literal notranslate"><span class="pre">torch.GradScaler(&quot;cpu&quot;,</span> <span class="pre">args...)</span></code> instead.</p>
</div>
<p><a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a> and <a class="reference internal" href="#torch.cpu.amp.autocast" title="torch.cpu.amp.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.cpu.amp.autocast</span></code></a> are new in version <cite>1.10</cite>.</p>
<div class="contents local topic" id="contents">
<ul class="simple">
<li><p><a class="reference internal" href="#autocasting" id="id4">Autocasting</a></p></li>
<li><p><a class="reference internal" href="#gradient-scaling" id="id5">Gradient Scaling</a></p></li>
<li><p><a class="reference internal" href="#autocast-op-reference" id="id6">Autocast Op Reference</a></p>
<ul>
<li><p><a class="reference internal" href="#op-eligibility" id="id7">Op Eligibility</a></p></li>
<li><p><a class="reference internal" href="#cuda-op-specific-behavior" id="id8">CUDA Op-Specific Behavior</a></p>
<ul>
<li><p><a class="reference internal" href="#cuda-ops-that-can-autocast-to-float16" id="id9">CUDA Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float16</span></code></a></p></li>
<li><p><a class="reference internal" href="#cuda-ops-that-can-autocast-to-float32" id="id10">CUDA Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a></p></li>
<li><p><a class="reference internal" href="#cuda-ops-that-promote-to-the-widest-input-type" id="id11">CUDA Ops that promote to the widest input type</a></p></li>
<li><p><a class="reference internal" href="#prefer-binary-cross-entropy-with-logits-over-binary-cross-entropy" id="id12">Prefer <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy_with_logits</span></code> over <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy</span></code></a></p></li>
</ul>
</li>
<li><p><a class="reference internal" href="#xpu-op-specific-behavior-experimental" id="id13">XPU Op-Specific Behavior (Experimental)</a></p>
<ul>
<li><p><a class="reference internal" href="#xpu-ops-that-can-autocast-to-float16" id="id14">XPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float16</span></code></a></p></li>
<li><p><a class="reference internal" href="#xpu-ops-that-can-autocast-to-float32" id="id15">XPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a></p></li>
<li><p><a class="reference internal" href="#xpu-ops-that-promote-to-the-widest-input-type" id="id16">XPU Ops that promote to the widest input type</a></p></li>
</ul>
</li>
<li><p><a class="reference internal" href="#cpu-op-specific-behavior" id="id17">CPU Op-Specific Behavior</a></p>
<ul>
<li><p><a class="reference internal" href="#cpu-ops-that-can-autocast-to-bfloat16" id="id18">CPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code></a></p></li>
<li><p><a class="reference internal" href="#cpu-ops-that-can-autocast-to-float32" id="id19">CPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a></p></li>
<li><p><a class="reference internal" href="#cpu-ops-that-promote-to-the-widest-input-type" id="id20">CPU Ops that promote to the widest input type</a></p></li>
</ul>
</li>
</ul>
</li>
</ul>
</div>
<div class="section" id="autocasting">
<span id="id1"></span><h2><a class="toc-backref" href="#id4">Autocasting</a><a class="headerlink" href="#autocasting" title="Permalink to this heading">¶</a></h2>
<dl class="py function">
<dt class="sig sig-object py" id="torch.amp.autocast_mode.is_autocast_available">
<span class="sig-prename descclassname"><span class="pre">torch.amp.autocast_mode.</span></span><span class="sig-name descname"><span class="pre">is_autocast_available</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device_type</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/amp/autocast_mode.html#is_autocast_available"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.amp.autocast_mode.is_autocast_available" title="Permalink to this definition">¶</a></dt>
<dd><p>Return a bool indicating if autocast is available on <code class="xref py py-attr docutils literal notranslate"><span class="pre">device_type</span></code>.</p>
<dl class="field-list simple">
<dt class="field-odd">Parameters</dt>
<dd class="field-odd"><p><strong>device_type</strong> (<a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><em>str</em></a>) – Device type to use. Possible values are: ‘cuda’, ‘cpu’, ‘xpu’ and so on.
The type is the same as the <cite>type</cite> attribute of a <a class="reference internal" href="tensor_attributes.html#torch.device" title="torch.device"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.device</span></code></a>.
Thus, you may obtain the device type of a tensor using <cite>Tensor.device.type</cite>.</p>
</dd>
<dt class="field-even">Return type</dt>
<dd class="field-even"><p><a class="reference external" href="https://docs.python.org/3/library/functions.html#bool" title="(in Python v3.12)">bool</a></p>
</dd>
</dl>
</dd></dl>

<dl class="py class">
<dt class="sig sig-object py" id="torch.autocast">
<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">torch.</span></span><span class="sig-name descname"><span class="pre">autocast</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device_type</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cache_enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/amp/autocast_mode.html#autocast"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.autocast" title="Permalink to this definition">¶</a></dt>
<dd><p>Instances of <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">autocast</span></code></a> serve as context managers or decorators that
allow regions of your script to run in mixed precision.</p>
<p>In these regions, ops run in an op-specific dtype chosen by autocast
to improve performance while maintaining accuracy.
See the <a class="reference internal" href="#autocast-op-reference"><span class="std std-ref">Autocast Op Reference</span></a> for details.</p>
<p>When entering an autocast-enabled region, Tensors may be any type.
You should not call <code class="docutils literal notranslate"><span class="pre">half()</span></code> or <code class="docutils literal notranslate"><span class="pre">bfloat16()</span></code> on your model(s) or inputs when using autocasting.</p>
<p><a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">autocast</span></code></a> should wrap only the forward pass(es) of your network, including the loss
computation(s).  Backward passes under autocast are not recommended.
Backward ops run in the same type that autocast used for corresponding forward ops.</p>
<p>Example for CUDA Devices:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="c1"># Creates model and optimizer in default precision</span>
<span class="n">model</span> <span class="o">=</span> <span class="n">Net</span><span class="p">()</span><span class="o">.</span><span class="n">cuda</span><span class="p">()</span>
<span class="n">optimizer</span> <span class="o">=</span> <span class="n">optim</span><span class="o">.</span><span class="n">SGD</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="o">...</span><span class="p">)</span>

<span class="k">for</span> <span class="nb">input</span><span class="p">,</span> <span class="n">target</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
    <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>

    <span class="c1"># Enables autocasting for the forward pass (model + loss)</span>
    <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">):</span>
        <span class="n">output</span> <span class="o">=</span> <span class="n">model</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_fn</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>

    <span class="c1"># Exits the context manager before backward()</span>
    <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
    <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
</pre></div>
</div>
<p>See the <a class="reference internal" href="notes/amp_examples.html#amp-examples"><span class="std std-ref">Automatic Mixed Precision examples</span></a> for usage (along with gradient scaling)
in more complex scenarios (e.g., gradient penalty, multiple models/losses, custom autograd functions).</p>
<p><a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">autocast</span></code></a> can also be used as a decorator, e.g., on the <code class="docutils literal notranslate"><span class="pre">forward</span></code> method of your model:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="k">class</span> <span class="nc">AutocastModel</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
    <span class="o">...</span>
    <span class="nd">@torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">):</span>
        <span class="o">...</span>
</pre></div>
</div>
<p>Floating-point Tensors produced in an autocast-enabled region may be <code class="docutils literal notranslate"><span class="pre">float16</span></code>.
After returning to an autocast-disabled region, using them with floating-point
Tensors of different dtypes may cause type mismatch errors.  If so, cast the Tensor(s)
produced in the autocast region back to <code class="docutils literal notranslate"><span class="pre">float32</span></code> (or other dtype if desired).
If a Tensor from the autocast region is already <code class="docutils literal notranslate"><span class="pre">float32</span></code>, the cast is a no-op,
and incurs no additional overhead.
CUDA Example:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="c1"># Creates some tensors in default dtype (here assumed to be float32)</span>
<span class="n">a_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
<span class="n">b_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
<span class="n">c_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
<span class="n">d_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>

<span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">):</span>
    <span class="c1"># torch.mm is on autocast&#39;s list of ops that should run in float16.</span>
    <span class="c1"># Inputs are float32, but the op runs in float16 and produces float16 output.</span>
    <span class="c1"># No manual casts are required.</span>
    <span class="n">e_float16</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span><span class="n">a_float32</span><span class="p">,</span> <span class="n">b_float32</span><span class="p">)</span>
    <span class="c1"># Also handles mixed input types</span>
    <span class="n">f_float16</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span><span class="n">d_float32</span><span class="p">,</span> <span class="n">e_float16</span><span class="p">)</span>

<span class="c1"># After exiting autocast, calls f_float16.float() to use with d_float32</span>
<span class="n">g_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span><span class="n">d_float32</span><span class="p">,</span> <span class="n">f_float16</span><span class="o">.</span><span class="n">float</span><span class="p">())</span>
</pre></div>
</div>
<p>CPU Training Example:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="c1"># Creates model and optimizer in default precision</span>
<span class="n">model</span> <span class="o">=</span> <span class="n">Net</span><span class="p">()</span>
<span class="n">optimizer</span> <span class="o">=</span> <span class="n">optim</span><span class="o">.</span><span class="n">SGD</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="o">...</span><span class="p">)</span>

<span class="k">for</span> <span class="n">epoch</span> <span class="ow">in</span> <span class="n">epochs</span><span class="p">:</span>
    <span class="k">for</span> <span class="nb">input</span><span class="p">,</span> <span class="n">target</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
        <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>

        <span class="c1"># Runs the forward pass with autocasting.</span>
        <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cpu&quot;</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">bfloat16</span><span class="p">):</span>
            <span class="n">output</span> <span class="o">=</span> <span class="n">model</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
            <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_fn</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>

        <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
        <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
</pre></div>
</div>
<p>CPU Inference Example:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="c1"># Creates model in default precision</span>
<span class="n">model</span> <span class="o">=</span> <span class="n">Net</span><span class="p">()</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>

<span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cpu&quot;</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">bfloat16</span><span class="p">):</span>
    <span class="k">for</span> <span class="nb">input</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
        <span class="c1"># Runs the forward pass with autocasting.</span>
        <span class="n">output</span> <span class="o">=</span> <span class="n">model</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
</pre></div>
</div>
<p>CPU Inference Example with Jit Trace:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="k">class</span> <span class="nc">TestModel</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_size</span><span class="p">,</span> <span class="n">num_classes</span><span class="p">):</span>
        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
        <span class="bp">self</span><span class="o">.</span><span class="n">fc1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">input_size</span><span class="p">,</span> <span class="n">num_classes</span><span class="p">)</span>
    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">fc1</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>

<span class="n">input_size</span> <span class="o">=</span> <span class="mi">2</span>
<span class="n">num_classes</span> <span class="o">=</span> <span class="mi">2</span>
<span class="n">model</span> <span class="o">=</span> <span class="n">TestModel</span><span class="p">(</span><span class="n">input_size</span><span class="p">,</span> <span class="n">num_classes</span><span class="p">)</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>

<span class="c1"># For now, we suggest to disable the Jit Autocast Pass,</span>
<span class="c1"># As the issue: https://github.com/pytorch/pytorch/issues/75956</span>
<span class="n">torch</span><span class="o">.</span><span class="n">_C</span><span class="o">.</span><span class="n">_jit_set_autocast_mode</span><span class="p">(</span><span class="kc">False</span><span class="p">)</span>

<span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cpu</span><span class="o">.</span><span class="n">amp</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">cache_enabled</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
    <span class="n">model</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">jit</span><span class="o">.</span><span class="n">trace</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">input_size</span><span class="p">))</span>
<span class="n">model</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">jit</span><span class="o">.</span><span class="n">freeze</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>
<span class="c1"># Models Run</span>
<span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">3</span><span class="p">):</span>
    <span class="n">model</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">input_size</span><span class="p">))</span>
</pre></div>
</div>
<p>Type mismatch errors <em>in</em> an autocast-enabled region are a bug; if this is what you observe,
please file an issue.</p>
<p><code class="docutils literal notranslate"><span class="pre">autocast(enabled=False)</span></code> subregions can be nested in autocast-enabled regions.
Locally disabling autocast can be useful, for example, if you want to force a subregion
to run in a particular <code class="docutils literal notranslate"><span class="pre">dtype</span></code>.  Disabling autocast gives you explicit control over
the execution type.  In the subregion, inputs from the surrounding region
should be cast to <code class="docutils literal notranslate"><span class="pre">dtype</span></code> before use:</p>
<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="c1"># Creates some tensors in default dtype (here assumed to be float32)</span>
<span class="n">a_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
<span class="n">b_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
<span class="n">c_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>
<span class="n">d_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">((</span><span class="mi">8</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">)</span>

<span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">):</span>
    <span class="n">e_float16</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span><span class="n">a_float32</span><span class="p">,</span> <span class="n">b_float32</span><span class="p">)</span>
    <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span><span class="n">device_type</span><span class="o">=</span><span class="s2">&quot;cuda&quot;</span><span class="p">,</span> <span class="n">enabled</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
        <span class="c1"># Calls e_float16.float() to ensure float32 execution</span>
        <span class="c1"># (necessary because e_float16 was created in an autocasted region)</span>
        <span class="n">f_float32</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span><span class="n">c_float32</span><span class="p">,</span> <span class="n">e_float16</span><span class="o">.</span><span class="n">float</span><span class="p">())</span>

    <span class="c1"># No manual casts are required when re-entering the autocast-enabled region.</span>
    <span class="c1"># torch.mm again runs in float16 and produces float16 output, regardless of input types.</span>
    <span class="n">g_float16</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span><span class="n">d_float32</span><span class="p">,</span> <span class="n">f_float32</span><span class="p">)</span>
</pre></div>
</div>
<p>The autocast state is thread-local.  If you want it enabled in a new thread, the context manager or decorator
must be invoked in that thread.  This affects <a class="reference internal" href="generated/torch.nn.DataParallel.html#torch.nn.DataParallel" title="torch.nn.DataParallel"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.DataParallel</span></code></a> and
<a class="reference internal" href="generated/torch.nn.parallel.DistributedDataParallel.html#torch.nn.parallel.DistributedDataParallel" title="torch.nn.parallel.DistributedDataParallel"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.parallel.DistributedDataParallel</span></code></a> when used with more than one GPU per process
(see <a class="reference internal" href="notes/amp_examples.html#amp-multigpu"><span class="std std-ref">Working with Multiple GPUs</span></a>).</p>
<dl class="field-list simple">
<dt class="field-odd">Parameters</dt>
<dd class="field-odd"><ul class="simple">
<li><p><strong>device_type</strong> (<a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><em>str</em></a><em>, </em><em>required</em>) – Device type to use. Possible values are: ‘cuda’, ‘cpu’, ‘xpu’ and ‘hpu’.
The type is the same as the <cite>type</cite> attribute of a <a class="reference internal" href="tensor_attributes.html#torch.device" title="torch.device"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.device</span></code></a>.
Thus, you may obtain the device type of a tensor using <cite>Tensor.device.type</cite>.</p></li>
<li><p><strong>enabled</strong> (<a class="reference external" href="https://docs.python.org/3/library/functions.html#bool" title="(in Python v3.12)"><em>bool</em></a><em>, </em><em>optional</em>) – Whether autocasting should be enabled in the region.
Default: <code class="docutils literal notranslate"><span class="pre">True</span></code></p></li>
<li><p><strong>dtype</strong> (<em>torch_dtype</em><em>, </em><em>optional</em>) – Data type for ops run in autocast. It uses the default value
(<code class="docutils literal notranslate"><span class="pre">torch.float16</span></code> for CUDA and <code class="docutils literal notranslate"><span class="pre">torch.bfloat16</span></code> for CPU), given by
<code class="xref py py-func docutils literal notranslate"><span class="pre">get_autocast_dtype()</span></code>, if <a class="reference internal" href="tensor_attributes.html#torch.dtype" title="torch.dtype"><code class="xref py py-attr docutils literal notranslate"><span class="pre">dtype</span></code></a> is <code class="docutils literal notranslate"><span class="pre">None</span></code>.
Default: <code class="docutils literal notranslate"><span class="pre">None</span></code></p></li>
<li><p><strong>cache_enabled</strong> (<a class="reference external" href="https://docs.python.org/3/library/functions.html#bool" title="(in Python v3.12)"><em>bool</em></a><em>, </em><em>optional</em>) – Whether the weight cache inside autocast should be enabled.
Default: <code class="docutils literal notranslate"><span class="pre">True</span></code></p></li>
</ul>
</dd>
</dl>
</dd></dl>

<dl class="py function">
<dt class="sig sig-object py" id="torch.amp.custom_fwd">
<span class="sig-prename descclassname"><span class="pre">torch.amp.</span></span><span class="sig-name descname"><span class="pre">custom_fwd</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">fwd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device_type</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cast_inputs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/amp/autocast_mode.html#custom_fwd"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.amp.custom_fwd" title="Permalink to this definition">¶</a></dt>
<dd><p>Create a helper decorator for <code class="docutils literal notranslate"><span class="pre">forward</span></code> methods of custom autograd functions.</p>
<p>Autograd functions are subclasses of <a class="reference internal" href="autograd.html#torch.autograd.Function" title="torch.autograd.Function"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autograd.Function</span></code></a>.
See the <a class="reference internal" href="notes/amp_examples.html#amp-custom-examples"><span class="std std-ref">example page</span></a> for more detail.</p>
<dl class="field-list simple">
<dt class="field-odd">Parameters</dt>
<dd class="field-odd"><ul class="simple">
<li><p><strong>device_type</strong> (<a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><em>str</em></a>) – Device type to use. ‘cuda’, ‘cpu’, ‘xpu’ and so on.
The type is the same as the <cite>type</cite> attribute of a <a class="reference internal" href="tensor_attributes.html#torch.device" title="torch.device"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.device</span></code></a>.
Thus, you may obtain the device type of a tensor using <cite>Tensor.device.type</cite>.</p></li>
<li><p><strong>cast_inputs</strong> (<a class="reference internal" href="tensor_attributes.html#torch.dtype" title="torch.dtype"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.dtype</span></code></a> or None, optional, default=None) – If not <code class="docutils literal notranslate"><span class="pre">None</span></code>,
when <code class="docutils literal notranslate"><span class="pre">forward</span></code> runs in an autocast-enabled region, casts incoming
floating-point Tensors to the target dtype (non-floating-point Tensors are not affected),
then executes <code class="docutils literal notranslate"><span class="pre">forward</span></code> with autocast disabled.
If <code class="docutils literal notranslate"><span class="pre">None</span></code>, <code class="docutils literal notranslate"><span class="pre">forward</span></code>’s internal ops execute with the current autocast state.</p></li>
</ul>
</dd>
</dl>
<div class="admonition note">
<p class="admonition-title">Note</p>
<p>If the decorated <code class="docutils literal notranslate"><span class="pre">forward</span></code> is called outside an autocast-enabled region,
<a class="reference internal" href="#torch.amp.custom_fwd" title="torch.amp.custom_fwd"><code class="xref py py-func docutils literal notranslate"><span class="pre">custom_fwd</span></code></a> is a no-op and <code class="docutils literal notranslate"><span class="pre">cast_inputs</span></code> has no effect.</p>
</div>
</dd></dl>

<dl class="py function">
<dt class="sig sig-object py" id="torch.amp.custom_bwd">
<span class="sig-prename descclassname"><span class="pre">torch.amp.</span></span><span class="sig-name descname"><span class="pre">custom_bwd</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">bwd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device_type</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/amp/autocast_mode.html#custom_bwd"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.amp.custom_bwd" title="Permalink to this definition">¶</a></dt>
<dd><p>Create a helper decorator for backward methods of custom autograd functions.</p>
<p>Autograd functions are subclasses of <a class="reference internal" href="autograd.html#torch.autograd.Function" title="torch.autograd.Function"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autograd.Function</span></code></a>.
Ensures that <code class="docutils literal notranslate"><span class="pre">backward</span></code> executes with the same autocast state as <code class="docutils literal notranslate"><span class="pre">forward</span></code>.
See the <a class="reference internal" href="notes/amp_examples.html#amp-custom-examples"><span class="std std-ref">example page</span></a> for more detail.</p>
<dl class="field-list simple">
<dt class="field-odd">Parameters</dt>
<dd class="field-odd"><p><strong>device_type</strong> (<a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><em>str</em></a>) – Device type to use. ‘cuda’, ‘cpu’, ‘xpu’ and so on.
The type is the same as the <cite>type</cite> attribute of a <a class="reference internal" href="tensor_attributes.html#torch.device" title="torch.device"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.device</span></code></a>.
Thus, you may obtain the device type of a tensor using <cite>Tensor.device.type</cite>.</p>
</dd>
</dl>
</dd></dl>

<dl class="py class">
<dt class="sig sig-object py" id="torch.cuda.amp.autocast">
<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">torch.cuda.amp.</span></span><span class="sig-name descname"><span class="pre">autocast</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float16</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cache_enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/cuda/amp/autocast_mode.html#autocast"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.cuda.amp.autocast" title="Permalink to this definition">¶</a></dt>
<dd><p>See <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a>.</p>
<p><code class="docutils literal notranslate"><span class="pre">torch.cuda.amp.autocast(args...)</span></code> is deprecated. Please use <code class="docutils literal notranslate"><span class="pre">torch.amp.autocast(&quot;cuda&quot;,</span> <span class="pre">args...)</span></code> instead.</p>
<dl class="field-list simple">
</dl>
</dd></dl>

<dl class="py function">
<dt class="sig sig-object py" id="torch.cuda.amp.custom_fwd">
<span class="sig-prename descclassname"><span class="pre">torch.cuda.amp.</span></span><span class="sig-name descname"><span class="pre">custom_fwd</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">fwd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cast_inputs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/cuda/amp/autocast_mode.html#custom_fwd"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.cuda.amp.custom_fwd" title="Permalink to this definition">¶</a></dt>
<dd><p><code class="docutils literal notranslate"><span class="pre">torch.cuda.amp.custom_fwd(args...)</span></code> is deprecated. Please use
<code class="docutils literal notranslate"><span class="pre">torch.amp.custom_fwd(args...,</span> <span class="pre">device_type='cuda')</span></code> instead.</p>
</dd></dl>

<dl class="py function">
<dt class="sig sig-object py" id="torch.cuda.amp.custom_bwd">
<span class="sig-prename descclassname"><span class="pre">torch.cuda.amp.</span></span><span class="sig-name descname"><span class="pre">custom_bwd</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">bwd</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/cuda/amp/autocast_mode.html#custom_bwd"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.cuda.amp.custom_bwd" title="Permalink to this definition">¶</a></dt>
<dd><p><code class="docutils literal notranslate"><span class="pre">torch.cuda.amp.custom_bwd(args...)</span></code> is deprecated. Please use
<code class="docutils literal notranslate"><span class="pre">torch.amp.custom_bwd(args...,</span> <span class="pre">device_type='cuda')</span></code> instead.</p>
</dd></dl>

<dl class="py class">
<dt class="sig sig-object py" id="torch.cpu.amp.autocast">
<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">torch.cpu.amp.</span></span><span class="sig-name descname"><span class="pre">autocast</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.bfloat16</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cache_enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/cpu/amp/autocast_mode.html#autocast"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.cpu.amp.autocast" title="Permalink to this definition">¶</a></dt>
<dd><p>See <a class="reference internal" href="#torch.autocast" title="torch.autocast"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autocast</span></code></a>.
<code class="docutils literal notranslate"><span class="pre">torch.cpu.amp.autocast(args...)</span></code> is deprecated. Please use <code class="docutils literal notranslate"><span class="pre">torch.amp.autocast(&quot;cpu&quot;,</span> <span class="pre">args...)</span></code> instead.</p>
<dl class="field-list simple">
</dl>
</dd></dl>

</div>
<div class="section" id="gradient-scaling">
<span id="id2"></span><h2><a class="toc-backref" href="#id5">Gradient Scaling</a><a class="headerlink" href="#gradient-scaling" title="Permalink to this heading">¶</a></h2>
<p>If the forward pass for a particular op has <code class="docutils literal notranslate"><span class="pre">float16</span></code> inputs, the backward pass for
that op will produce <code class="docutils literal notranslate"><span class="pre">float16</span></code> gradients.
Gradient values with small magnitudes may not be representable in <code class="docutils literal notranslate"><span class="pre">float16</span></code>.
These values will flush to zero (“underflow”), so the update for the corresponding parameters will be lost.</p>
<p>To prevent underflow, “gradient scaling” multiplies the network’s loss(es) by a scale factor and
invokes a backward pass on the scaled loss(es).  Gradients flowing backward through the network are
then scaled by the same factor.  In other words, gradient values have a larger magnitude,
so they don’t flush to zero.</p>
<p>Each parameter’s gradient (<code class="docutils literal notranslate"><span class="pre">.grad</span></code> attribute) should be unscaled before the optimizer
updates the parameters, so the scale factor does not interfere with the learning rate.</p>
<div class="admonition note">
<p class="admonition-title">Note</p>
<p>AMP/fp16 may not work for every model! For example, most bf16-pretrained models cannot operate in
the fp16 numerical range of max 65504 and will cause gradients to overflow instead of underflow. In
this case, the scale factor may decrease under 1 as an attempt to bring gradients to a number
representable in the fp16 dynamic range. While one may expect the scale to always be above 1, our
GradScaler does NOT make this guarantee to maintain performance. If you encounter NaNs in your loss
or gradients when running with AMP/fp16, verify your model is compatible.</p>
</div>
<dl class="py class">
<dt class="sig sig-object py" id="torch.cuda.amp.GradScaler">
<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">torch.cuda.amp.</span></span><span class="sig-name descname"><span class="pre">GradScaler</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_scale</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">65536.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">growth_factor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">backoff_factor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">growth_interval</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="_modules/torch/cuda/amp/grad_scaler.html#GradScaler"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#torch.cuda.amp.GradScaler" title="Permalink to this definition">¶</a></dt>
<dd><p>See <code class="xref py py-class docutils literal notranslate"><span class="pre">torch.amp.GradScaler</span></code>.
<code class="docutils literal notranslate"><span class="pre">torch.cuda.amp.GradScaler(args...)</span></code> is deprecated. Please use <code class="docutils literal notranslate"><span class="pre">torch.amp.GradScaler(&quot;cuda&quot;,</span> <span class="pre">args...)</span></code> instead.</p>
<dl class="field-list simple">
</dl>
</dd></dl>

</div>
<div class="section" id="autocast-op-reference">
<span id="id3"></span><h2><a class="toc-backref" href="#id6">Autocast Op Reference</a><a class="headerlink" href="#autocast-op-reference" title="Permalink to this heading">¶</a></h2>
<div class="section" id="op-eligibility">
<span id="autocast-eligibility"></span><h3><a class="toc-backref" href="#id7">Op Eligibility</a><a class="headerlink" href="#op-eligibility" title="Permalink to this heading">¶</a></h3>
<p>Ops that run in <code class="docutils literal notranslate"><span class="pre">float64</span></code> or non-floating-point dtypes are not eligible, and will
run in these types whether or not autocast is enabled.</p>
<p>Only out-of-place ops and Tensor methods are eligible.
In-place variants and calls that explicitly supply an <code class="docutils literal notranslate"><span class="pre">out=...</span></code> Tensor
are allowed in autocast-enabled regions, but won’t go through autocasting.
For example, in an autocast-enabled region <code class="docutils literal notranslate"><span class="pre">a.addmm(b,</span> <span class="pre">c)</span></code> can autocast,
but <code class="docutils literal notranslate"><span class="pre">a.addmm_(b,</span> <span class="pre">c)</span></code> and <code class="docutils literal notranslate"><span class="pre">a.addmm(b,</span> <span class="pre">c,</span> <span class="pre">out=d)</span></code> cannot.
For best performance and stability, prefer out-of-place ops in autocast-enabled
regions.</p>
<p>Ops called with an explicit <code class="docutils literal notranslate"><span class="pre">dtype=...</span></code> argument are not eligible,
and will produce output that respects the <code class="docutils literal notranslate"><span class="pre">dtype</span></code> argument.</p>
</div>
<div class="section" id="cuda-op-specific-behavior">
<span id="autocast-cuda-op-reference"></span><h3><a class="toc-backref" href="#id8">CUDA Op-Specific Behavior</a><a class="headerlink" href="#cuda-op-specific-behavior" title="Permalink to this heading">¶</a></h3>
<p>The following lists describe the behavior of eligible ops in autocast-enabled regions.
These ops always go through autocasting whether they are invoked as part of a <a class="reference internal" href="generated/torch.nn.Module.html#torch.nn.Module" title="torch.nn.Module"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.Module</span></code></a>,
as a function, or as a <a class="reference internal" href="tensors.html#torch.Tensor" title="torch.Tensor"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.Tensor</span></code></a> method. If functions are exposed in multiple namespaces,
they go through autocasting regardless of the namespace.</p>
<p>Ops not listed below do not go through autocasting.  They run in the type
defined by their inputs.  However, autocasting may still change the type
in which unlisted ops run if they’re downstream from autocasted ops.</p>
<p>If an op is unlisted, we assume it’s numerically stable in <code class="docutils literal notranslate"><span class="pre">float16</span></code>.
If you believe an unlisted op is numerically unstable in <code class="docutils literal notranslate"><span class="pre">float16</span></code>,
please file an issue.</p>
<div class="section" id="cuda-ops-that-can-autocast-to-float16">
<h4><a class="toc-backref" href="#id9">CUDA Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float16</span></code></a><a class="headerlink" href="#cuda-ops-that-can-autocast-to-float16" title="Permalink to this heading">¶</a></h4>
<p><code class="docutils literal notranslate"><span class="pre">__matmul__</span></code>,
<code class="docutils literal notranslate"><span class="pre">addbmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">addmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">addmv</span></code>,
<code class="docutils literal notranslate"><span class="pre">addr</span></code>,
<code class="docutils literal notranslate"><span class="pre">baddbmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">bmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">chain_matmul</span></code>,
<code class="docutils literal notranslate"><span class="pre">multi_dot</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">GRUCell</span></code>,
<code class="docutils literal notranslate"><span class="pre">linear</span></code>,
<code class="docutils literal notranslate"><span class="pre">LSTMCell</span></code>,
<code class="docutils literal notranslate"><span class="pre">matmul</span></code>,
<code class="docutils literal notranslate"><span class="pre">mm</span></code>,
<code class="docutils literal notranslate"><span class="pre">mv</span></code>,
<code class="docutils literal notranslate"><span class="pre">prelu</span></code>,
<code class="docutils literal notranslate"><span class="pre">RNNCell</span></code></p>
</div>
<div class="section" id="cuda-ops-that-can-autocast-to-float32">
<h4><a class="toc-backref" href="#id10">CUDA Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a><a class="headerlink" href="#cuda-ops-that-can-autocast-to-float32" title="Permalink to this heading">¶</a></h4>
<p><code class="docutils literal notranslate"><span class="pre">__pow__</span></code>,
<code class="docutils literal notranslate"><span class="pre">__rdiv__</span></code>,
<code class="docutils literal notranslate"><span class="pre">__rpow__</span></code>,
<code class="docutils literal notranslate"><span class="pre">__rtruediv__</span></code>,
<code class="docutils literal notranslate"><span class="pre">acos</span></code>,
<code class="docutils literal notranslate"><span class="pre">asin</span></code>,
<code class="docutils literal notranslate"><span class="pre">binary_cross_entropy_with_logits</span></code>,
<code class="docutils literal notranslate"><span class="pre">cosh</span></code>,
<code class="docutils literal notranslate"><span class="pre">cosine_embedding_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">cdist</span></code>,
<code class="docutils literal notranslate"><span class="pre">cosine_similarity</span></code>,
<code class="docutils literal notranslate"><span class="pre">cross_entropy</span></code>,
<code class="docutils literal notranslate"><span class="pre">cumprod</span></code>,
<code class="docutils literal notranslate"><span class="pre">cumsum</span></code>,
<code class="docutils literal notranslate"><span class="pre">dist</span></code>,
<code class="docutils literal notranslate"><span class="pre">erfinv</span></code>,
<code class="docutils literal notranslate"><span class="pre">exp</span></code>,
<code class="docutils literal notranslate"><span class="pre">expm1</span></code>,
<code class="docutils literal notranslate"><span class="pre">group_norm</span></code>,
<code class="docutils literal notranslate"><span class="pre">hinge_embedding_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">kl_div</span></code>,
<code class="docutils literal notranslate"><span class="pre">l1_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">layer_norm</span></code>,
<code class="docutils literal notranslate"><span class="pre">log</span></code>,
<code class="docutils literal notranslate"><span class="pre">log_softmax</span></code>,
<code class="docutils literal notranslate"><span class="pre">log10</span></code>,
<code class="docutils literal notranslate"><span class="pre">log1p</span></code>,
<code class="docutils literal notranslate"><span class="pre">log2</span></code>,
<code class="docutils literal notranslate"><span class="pre">margin_ranking_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">mse_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">multilabel_margin_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">multi_margin_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">nll_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">norm</span></code>,
<code class="docutils literal notranslate"><span class="pre">normalize</span></code>,
<code class="docutils literal notranslate"><span class="pre">pdist</span></code>,
<code class="docutils literal notranslate"><span class="pre">poisson_nll_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">pow</span></code>,
<code class="docutils literal notranslate"><span class="pre">prod</span></code>,
<code class="docutils literal notranslate"><span class="pre">reciprocal</span></code>,
<code class="docutils literal notranslate"><span class="pre">rsqrt</span></code>,
<code class="docutils literal notranslate"><span class="pre">sinh</span></code>,
<code class="docutils literal notranslate"><span class="pre">smooth_l1_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">soft_margin_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">softmax</span></code>,
<code class="docutils literal notranslate"><span class="pre">softmin</span></code>,
<code class="docutils literal notranslate"><span class="pre">softplus</span></code>,
<code class="docutils literal notranslate"><span class="pre">sum</span></code>,
<code class="docutils literal notranslate"><span class="pre">renorm</span></code>,
<code class="docutils literal notranslate"><span class="pre">tan</span></code>,
<code class="docutils literal notranslate"><span class="pre">triplet_margin_loss</span></code></p>
</div>
<div class="section" id="cuda-ops-that-promote-to-the-widest-input-type">
<h4><a class="toc-backref" href="#id11">CUDA Ops that promote to the widest input type</a><a class="headerlink" href="#cuda-ops-that-promote-to-the-widest-input-type" title="Permalink to this heading">¶</a></h4>
<p>These ops don’t require a particular dtype for stability, but take multiple inputs
and require that the inputs’ dtypes match.  If all of the inputs are
<code class="docutils literal notranslate"><span class="pre">float16</span></code>, the op runs in <code class="docutils literal notranslate"><span class="pre">float16</span></code>.  If any of the inputs is <code class="docutils literal notranslate"><span class="pre">float32</span></code>,
autocast casts all inputs to <code class="docutils literal notranslate"><span class="pre">float32</span></code> and runs the op in <code class="docutils literal notranslate"><span class="pre">float32</span></code>.</p>
<p><code class="docutils literal notranslate"><span class="pre">addcdiv</span></code>,
<code class="docutils literal notranslate"><span class="pre">addcmul</span></code>,
<code class="docutils literal notranslate"><span class="pre">atan2</span></code>,
<code class="docutils literal notranslate"><span class="pre">bilinear</span></code>,
<code class="docutils literal notranslate"><span class="pre">cross</span></code>,
<code class="docutils literal notranslate"><span class="pre">dot</span></code>,
<code class="docutils literal notranslate"><span class="pre">grid_sample</span></code>,
<code class="docutils literal notranslate"><span class="pre">index_put</span></code>,
<code class="docutils literal notranslate"><span class="pre">scatter_add</span></code>,
<code class="docutils literal notranslate"><span class="pre">tensordot</span></code></p>
<p>Some ops not listed here (e.g., binary ops like <code class="docutils literal notranslate"><span class="pre">add</span></code>) natively promote
inputs without autocasting’s intervention.  If inputs are a mixture of <code class="docutils literal notranslate"><span class="pre">float16</span></code>
and <code class="docutils literal notranslate"><span class="pre">float32</span></code>, these ops run in <code class="docutils literal notranslate"><span class="pre">float32</span></code> and produce <code class="docutils literal notranslate"><span class="pre">float32</span></code> output,
regardless of whether autocast is enabled.</p>
</div>
<div class="section" id="prefer-binary-cross-entropy-with-logits-over-binary-cross-entropy">
<h4><a class="toc-backref" href="#id12">Prefer <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy_with_logits</span></code> over <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy</span></code></a><a class="headerlink" href="#prefer-binary-cross-entropy-with-logits-over-binary-cross-entropy" title="Permalink to this heading">¶</a></h4>
<p>The backward passes of <a class="reference internal" href="generated/torch.nn.functional.binary_cross_entropy.html#torch.nn.functional.binary_cross_entropy" title="torch.nn.functional.binary_cross_entropy"><code class="xref py py-func docutils literal notranslate"><span class="pre">torch.nn.functional.binary_cross_entropy()</span></code></a> (and <a class="reference internal" href="generated/torch.nn.BCELoss.html#torch.nn.BCELoss" title="torch.nn.BCELoss"><code class="xref py py-mod docutils literal notranslate"><span class="pre">torch.nn.BCELoss</span></code></a>, which wraps it)
can produce gradients that aren’t representable in <code class="docutils literal notranslate"><span class="pre">float16</span></code>.  In autocast-enabled regions, the forward input
may be <code class="docutils literal notranslate"><span class="pre">float16</span></code>, which means the backward gradient must be representable in <code class="docutils literal notranslate"><span class="pre">float16</span></code> (autocasting <code class="docutils literal notranslate"><span class="pre">float16</span></code>
forward inputs to <code class="docutils literal notranslate"><span class="pre">float32</span></code> doesn’t help, because that cast must be reversed in backward).
Therefore, <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy</span></code> and <code class="docutils literal notranslate"><span class="pre">BCELoss</span></code> raise an error in autocast-enabled regions.</p>
<p>Many models use a sigmoid layer right before the binary cross entropy layer.
In this case, combine the two layers using <a class="reference internal" href="generated/torch.nn.functional.binary_cross_entropy_with_logits.html#torch.nn.functional.binary_cross_entropy_with_logits" title="torch.nn.functional.binary_cross_entropy_with_logits"><code class="xref py py-func docutils literal notranslate"><span class="pre">torch.nn.functional.binary_cross_entropy_with_logits()</span></code></a>
or <a class="reference internal" href="generated/torch.nn.BCEWithLogitsLoss.html#torch.nn.BCEWithLogitsLoss" title="torch.nn.BCEWithLogitsLoss"><code class="xref py py-mod docutils literal notranslate"><span class="pre">torch.nn.BCEWithLogitsLoss</span></code></a>.  <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy_with_logits</span></code> and <code class="docutils literal notranslate"><span class="pre">BCEWithLogits</span></code>
are safe to autocast.</p>
</div>
</div>
<div class="section" id="xpu-op-specific-behavior-experimental">
<span id="autocast-xpu-op-reference"></span><h3><a class="toc-backref" href="#id13">XPU Op-Specific Behavior (Experimental)</a><a class="headerlink" href="#xpu-op-specific-behavior-experimental" title="Permalink to this heading">¶</a></h3>
<p>The following lists describe the behavior of eligible ops in autocast-enabled regions.
These ops always go through autocasting whether they are invoked as part of a <a class="reference internal" href="generated/torch.nn.Module.html#torch.nn.Module" title="torch.nn.Module"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.Module</span></code></a>,
as a function, or as a <a class="reference internal" href="tensors.html#torch.Tensor" title="torch.Tensor"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.Tensor</span></code></a> method. If functions are exposed in multiple namespaces,
they go through autocasting regardless of the namespace.</p>
<p>Ops not listed below do not go through autocasting.  They run in the type
defined by their inputs.  However, autocasting may still change the type
in which unlisted ops run if they’re downstream from autocasted ops.</p>
<p>If an op is unlisted, we assume it’s numerically stable in <code class="docutils literal notranslate"><span class="pre">float16</span></code>.
If you believe an unlisted op is numerically unstable in <code class="docutils literal notranslate"><span class="pre">float16</span></code>,
please file an issue.</p>
<div class="section" id="xpu-ops-that-can-autocast-to-float16">
<h4><a class="toc-backref" href="#id14">XPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float16</span></code></a><a class="headerlink" href="#xpu-ops-that-can-autocast-to-float16" title="Permalink to this heading">¶</a></h4>
<p><code class="docutils literal notranslate"><span class="pre">addbmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">addmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">addmv</span></code>,
<code class="docutils literal notranslate"><span class="pre">addr</span></code>,
<code class="docutils literal notranslate"><span class="pre">baddbmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">bmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">chain_matmul</span></code>,
<code class="docutils literal notranslate"><span class="pre">multi_dot</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">GRUCell</span></code>,
<code class="docutils literal notranslate"><span class="pre">linear</span></code>,
<code class="docutils literal notranslate"><span class="pre">LSTMCell</span></code>,
<code class="docutils literal notranslate"><span class="pre">matmul</span></code>,
<code class="docutils literal notranslate"><span class="pre">mm</span></code>,
<code class="docutils literal notranslate"><span class="pre">mv</span></code>,
<code class="docutils literal notranslate"><span class="pre">RNNCell</span></code></p>
</div>
<div class="section" id="xpu-ops-that-can-autocast-to-float32">
<h4><a class="toc-backref" href="#id15">XPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a><a class="headerlink" href="#xpu-ops-that-can-autocast-to-float32" title="Permalink to this heading">¶</a></h4>
<p><code class="docutils literal notranslate"><span class="pre">__pow__</span></code>,
<code class="docutils literal notranslate"><span class="pre">__rdiv__</span></code>,
<code class="docutils literal notranslate"><span class="pre">__rpow__</span></code>,
<code class="docutils literal notranslate"><span class="pre">__rtruediv__</span></code>,
<code class="docutils literal notranslate"><span class="pre">binary_cross_entropy_with_logits</span></code>,
<code class="docutils literal notranslate"><span class="pre">cosine_embedding_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">cosine_similarity</span></code>,
<code class="docutils literal notranslate"><span class="pre">cumsum</span></code>,
<code class="docutils literal notranslate"><span class="pre">dist</span></code>,
<code class="docutils literal notranslate"><span class="pre">exp</span></code>,
<code class="docutils literal notranslate"><span class="pre">group_norm</span></code>,
<code class="docutils literal notranslate"><span class="pre">hinge_embedding_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">kl_div</span></code>,
<code class="docutils literal notranslate"><span class="pre">l1_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">layer_norm</span></code>,
<code class="docutils literal notranslate"><span class="pre">log</span></code>,
<code class="docutils literal notranslate"><span class="pre">log_softmax</span></code>,
<code class="docutils literal notranslate"><span class="pre">margin_ranking_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">nll_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">normalize</span></code>,
<code class="docutils literal notranslate"><span class="pre">poisson_nll_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">pow</span></code>,
<code class="docutils literal notranslate"><span class="pre">reciprocal</span></code>,
<code class="docutils literal notranslate"><span class="pre">rsqrt</span></code>,
<code class="docutils literal notranslate"><span class="pre">soft_margin_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">softmax</span></code>,
<code class="docutils literal notranslate"><span class="pre">softmin</span></code>,
<code class="docutils literal notranslate"><span class="pre">sum</span></code>,
<code class="docutils literal notranslate"><span class="pre">triplet_margin_loss</span></code></p>
</div>
<div class="section" id="xpu-ops-that-promote-to-the-widest-input-type">
<h4><a class="toc-backref" href="#id16">XPU Ops that promote to the widest input type</a><a class="headerlink" href="#xpu-ops-that-promote-to-the-widest-input-type" title="Permalink to this heading">¶</a></h4>
<p>These ops don’t require a particular dtype for stability, but take multiple inputs
and require that the inputs’ dtypes match.  If all of the inputs are
<code class="docutils literal notranslate"><span class="pre">float16</span></code>, the op runs in <code class="docutils literal notranslate"><span class="pre">float16</span></code>.  If any of the inputs is <code class="docutils literal notranslate"><span class="pre">float32</span></code>,
autocast casts all inputs to <code class="docutils literal notranslate"><span class="pre">float32</span></code> and runs the op in <code class="docutils literal notranslate"><span class="pre">float32</span></code>.</p>
<p><code class="docutils literal notranslate"><span class="pre">bilinear</span></code>,
<code class="docutils literal notranslate"><span class="pre">cross</span></code>,
<code class="docutils literal notranslate"><span class="pre">grid_sample</span></code>,
<code class="docutils literal notranslate"><span class="pre">index_put</span></code>,
<code class="docutils literal notranslate"><span class="pre">scatter_add</span></code>,
<code class="docutils literal notranslate"><span class="pre">tensordot</span></code></p>
<p>Some ops not listed here (e.g., binary ops like <code class="docutils literal notranslate"><span class="pre">add</span></code>) natively promote
inputs without autocasting’s intervention.  If inputs are a mixture of <code class="docutils literal notranslate"><span class="pre">float16</span></code>
and <code class="docutils literal notranslate"><span class="pre">float32</span></code>, these ops run in <code class="docutils literal notranslate"><span class="pre">float32</span></code> and produce <code class="docutils literal notranslate"><span class="pre">float32</span></code> output,
regardless of whether autocast is enabled.</p>
</div>
</div>
<div class="section" id="cpu-op-specific-behavior">
<span id="autocast-cpu-op-reference"></span><h3><a class="toc-backref" href="#id17">CPU Op-Specific Behavior</a><a class="headerlink" href="#cpu-op-specific-behavior" title="Permalink to this heading">¶</a></h3>
<p>The following lists describe the behavior of eligible ops in autocast-enabled regions.
These ops always go through autocasting whether they are invoked as part of a <a class="reference internal" href="generated/torch.nn.Module.html#torch.nn.Module" title="torch.nn.Module"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.Module</span></code></a>,
as a function, or as a <a class="reference internal" href="tensors.html#torch.Tensor" title="torch.Tensor"><code class="xref py py-class docutils literal notranslate"><span class="pre">torch.Tensor</span></code></a> method. If functions are exposed in multiple namespaces,
they go through autocasting regardless of the namespace.</p>
<p>Ops not listed below do not go through autocasting.  They run in the type
defined by their inputs.  However, autocasting may still change the type
in which unlisted ops run if they’re downstream from autocasted ops.</p>
<p>If an op is unlisted, we assume it’s numerically stable in <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code>.
If you believe an unlisted op is numerically unstable in <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code>,
please file an issue.</p>
<div class="section" id="cpu-ops-that-can-autocast-to-bfloat16">
<h4><a class="toc-backref" href="#id18">CPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code></a><a class="headerlink" href="#cpu-ops-that-can-autocast-to-bfloat16" title="Permalink to this heading">¶</a></h4>
<p><code class="docutils literal notranslate"><span class="pre">conv1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">bmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">mm</span></code>,
<code class="docutils literal notranslate"><span class="pre">baddbmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">addmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">addbmm</span></code>,
<code class="docutils literal notranslate"><span class="pre">linear</span></code>,
<code class="docutils literal notranslate"><span class="pre">matmul</span></code>,
<code class="docutils literal notranslate"><span class="pre">_convolution</span></code></p>
</div>
<div class="section" id="cpu-ops-that-can-autocast-to-float32">
<h4><a class="toc-backref" href="#id19">CPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a><a class="headerlink" href="#cpu-ops-that-can-autocast-to-float32" title="Permalink to this heading">¶</a></h4>
<p><code class="docutils literal notranslate"><span class="pre">conv_transpose1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">conv_transpose3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">avg_pool3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">binary_cross_entropy</span></code>,
<code class="docutils literal notranslate"><span class="pre">grid_sampler</span></code>,
<code class="docutils literal notranslate"><span class="pre">grid_sampler_2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">_grid_sampler_2d_cpu_fallback</span></code>,
<code class="docutils literal notranslate"><span class="pre">grid_sampler_3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">polar</span></code>,
<code class="docutils literal notranslate"><span class="pre">prod</span></code>,
<code class="docutils literal notranslate"><span class="pre">quantile</span></code>,
<code class="docutils literal notranslate"><span class="pre">nanquantile</span></code>,
<code class="docutils literal notranslate"><span class="pre">stft</span></code>,
<code class="docutils literal notranslate"><span class="pre">cdist</span></code>,
<code class="docutils literal notranslate"><span class="pre">trace</span></code>,
<code class="docutils literal notranslate"><span class="pre">view_as_complex</span></code>,
<code class="docutils literal notranslate"><span class="pre">cholesky</span></code>,
<code class="docutils literal notranslate"><span class="pre">cholesky_inverse</span></code>,
<code class="docutils literal notranslate"><span class="pre">cholesky_solve</span></code>,
<code class="docutils literal notranslate"><span class="pre">inverse</span></code>,
<code class="docutils literal notranslate"><span class="pre">lu_solve</span></code>,
<code class="docutils literal notranslate"><span class="pre">orgqr</span></code>,
<code class="docutils literal notranslate"><span class="pre">inverse</span></code>,
<code class="docutils literal notranslate"><span class="pre">ormqr</span></code>,
<code class="docutils literal notranslate"><span class="pre">pinverse</span></code>,
<code class="docutils literal notranslate"><span class="pre">max_pool3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">max_unpool2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">max_unpool3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">adaptive_avg_pool3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">reflection_pad1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">reflection_pad2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">replication_pad1d</span></code>,
<code class="docutils literal notranslate"><span class="pre">replication_pad2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">replication_pad3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">mse_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">ctc_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">kl_div</span></code>,
<code class="docutils literal notranslate"><span class="pre">multilabel_margin_loss</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_fft</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_ifft</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_fft2</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_ifft2</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_fftn</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_ifftn</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_rfft</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_irfft</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_rfft2</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_irfft2</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_rfftn</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_irfftn</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_hfft</span></code>,
<code class="docutils literal notranslate"><span class="pre">fft_ihfft</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_matrix_norm</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_cond</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_matrix_rank</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_solve</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_cholesky</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_svdvals</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_eigvals</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_eigvalsh</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_inv</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_householder_product</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_tensorinv</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_tensorsolve</span></code>,
<code class="docutils literal notranslate"><span class="pre">fake_quantize_per_tensor_affine</span></code>,
<code class="docutils literal notranslate"><span class="pre">eig</span></code>,
<code class="docutils literal notranslate"><span class="pre">geqrf</span></code>,
<code class="docutils literal notranslate"><span class="pre">lstsq</span></code>,
<code class="docutils literal notranslate"><span class="pre">_lu_with_info</span></code>,
<code class="docutils literal notranslate"><span class="pre">qr</span></code>,
<code class="docutils literal notranslate"><span class="pre">solve</span></code>,
<code class="docutils literal notranslate"><span class="pre">svd</span></code>,
<code class="docutils literal notranslate"><span class="pre">symeig</span></code>,
<code class="docutils literal notranslate"><span class="pre">triangular_solve</span></code>,
<code class="docutils literal notranslate"><span class="pre">fractional_max_pool2d</span></code>,
<code class="docutils literal notranslate"><span class="pre">fractional_max_pool3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">adaptive_max_pool3d</span></code>,
<code class="docutils literal notranslate"><span class="pre">multilabel_margin_loss_forward</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_qr</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_cholesky_ex</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_svd</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_eig</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_eigh</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_lstsq</span></code>,
<code class="docutils literal notranslate"><span class="pre">linalg_inv_ex</span></code></p>
</div>
<div class="section" id="cpu-ops-that-promote-to-the-widest-input-type">
<h4><a class="toc-backref" href="#id20">CPU Ops that promote to the widest input type</a><a class="headerlink" href="#cpu-ops-that-promote-to-the-widest-input-type" title="Permalink to this heading">¶</a></h4>
<p>These ops don’t require a particular dtype for stability, but take multiple inputs
and require that the inputs’ dtypes match.  If all of the inputs are
<code class="docutils literal notranslate"><span class="pre">bfloat16</span></code>, the op runs in <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code>.  If any of the inputs is <code class="docutils literal notranslate"><span class="pre">float32</span></code>,
autocast casts all inputs to <code class="docutils literal notranslate"><span class="pre">float32</span></code> and runs the op in <code class="docutils literal notranslate"><span class="pre">float32</span></code>.</p>
<p><code class="docutils literal notranslate"><span class="pre">cat</span></code>,
<code class="docutils literal notranslate"><span class="pre">stack</span></code>,
<code class="docutils literal notranslate"><span class="pre">index_copy</span></code></p>
<p>Some ops not listed here (e.g., binary ops like <code class="docutils literal notranslate"><span class="pre">add</span></code>) natively promote
inputs without autocasting’s intervention.  If inputs are a mixture of <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code>
and <code class="docutils literal notranslate"><span class="pre">float32</span></code>, these ops run in <code class="docutils literal notranslate"><span class="pre">float32</span></code> and produce <code class="docutils literal notranslate"><span class="pre">float32</span></code> output,
regardless of whether autocast is enabled.</p>
<span class="target" id="module-torch.amp.autocast_mode"></span><span class="target" id="module-torch.cpu.amp.autocast_mode"></span><span class="target" id="module-torch.cuda.amp.autocast_mode"></span><span class="target" id="module-torch.cuda.amp.common"></span><span class="target" id="module-torch.amp.grad_scaler"></span><span class="target" id="module-torch.cpu.amp.grad_scaler"></span><span class="target" id="module-torch.cuda.amp.grad_scaler"></span></div>
</div>
</div>
</div>


             </article>
             
            </div>
            <footer>
  
    <div class="rst-footer-buttons" role="navigation" aria-label="footer navigation">
      
        <a href="autograd.html" class="btn btn-neutral float-right" title="Automatic differentiation package - torch.autograd" accesskey="n" rel="next">Next <img src="_static/images/chevron-right-orange.svg" class="next-page"></a>
      
      
        <a href="tensor_view.html" class="btn btn-neutral" title="Tensor Views" accesskey="p" rel="prev"><img src="_static/images/chevron-right-orange.svg" class="previous-page"> Previous</a>
      
    </div>
  

    <hr>

  
  <div role="contentinfo">
    <p>
        &copy; Copyright 2023, PyTorch Contributors.

    </p>
  </div>
    
      <div>
        Built with <a href="http://sphinx-doc.org/">Sphinx</a> using a <a href="https://github.com/rtfd/sphinx_rtd_theme">theme</a> provided by <a href="https://readthedocs.org">Read the Docs</a>.
      </div>
     

</footer>

          </div>
<script>

var match = window.location.href.match(/\/_[a-zA-Z0-9_]*.html|_dynamo/gi);
var url = window.location.href.lastIndexOf(match[match.length-1]);

if (url)
  {
    var div = '<div class="admonition note"><p class="admonition-title">Note</p><p><i class="fa fa-exclamation-circle" aria-hidden="true">&nbsp</i> This page describes an internal API which is not intended to be used outside of the PyTorch codebase and can be modified or removed without notice.</p></div>'
    document.getElementById("pytorch-article").insertAdjacentHTML('afterBegin', div)
  }
</script>
        </div>

        <div class="pytorch-content-right" id="pytorch-content-right">
          <div class="pytorch-right-menu" id="pytorch-right-menu">
            <div class="pytorch-side-scroll" id="pytorch-side-scroll-right">
              <ul>
<li><a class="reference internal" href="#">Automatic Mixed Precision package - torch.amp</a><ul>
<li><a class="reference internal" href="#autocasting">Autocasting</a><ul>
<li><a class="reference internal" href="#torch.amp.autocast_mode.is_autocast_available"><code class="docutils literal notranslate"><span class="pre">is_autocast_available()</span></code></a></li>
<li><a class="reference internal" href="#torch.autocast"><code class="docutils literal notranslate"><span class="pre">autocast</span></code></a></li>
<li><a class="reference internal" href="#torch.amp.custom_fwd"><code class="docutils literal notranslate"><span class="pre">custom_fwd()</span></code></a></li>
<li><a class="reference internal" href="#torch.amp.custom_bwd"><code class="docutils literal notranslate"><span class="pre">custom_bwd()</span></code></a></li>
<li><a class="reference internal" href="#torch.cuda.amp.autocast"><code class="docutils literal notranslate"><span class="pre">autocast</span></code></a></li>
<li><a class="reference internal" href="#torch.cuda.amp.custom_fwd"><code class="docutils literal notranslate"><span class="pre">custom_fwd()</span></code></a></li>
<li><a class="reference internal" href="#torch.cuda.amp.custom_bwd"><code class="docutils literal notranslate"><span class="pre">custom_bwd()</span></code></a></li>
<li><a class="reference internal" href="#torch.cpu.amp.autocast"><code class="docutils literal notranslate"><span class="pre">autocast</span></code></a></li>
</ul>
</li>
<li><a class="reference internal" href="#gradient-scaling">Gradient Scaling</a><ul>
<li><a class="reference internal" href="#torch.cuda.amp.GradScaler"><code class="docutils literal notranslate"><span class="pre">GradScaler</span></code></a></li>
</ul>
</li>
<li><a class="reference internal" href="#autocast-op-reference">Autocast Op Reference</a><ul>
<li><a class="reference internal" href="#op-eligibility">Op Eligibility</a></li>
<li><a class="reference internal" href="#cuda-op-specific-behavior">CUDA Op-Specific Behavior</a><ul>
<li><a class="reference internal" href="#cuda-ops-that-can-autocast-to-float16">CUDA Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float16</span></code></a></li>
<li><a class="reference internal" href="#cuda-ops-that-can-autocast-to-float32">CUDA Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a></li>
<li><a class="reference internal" href="#cuda-ops-that-promote-to-the-widest-input-type">CUDA Ops that promote to the widest input type</a></li>
<li><a class="reference internal" href="#prefer-binary-cross-entropy-with-logits-over-binary-cross-entropy">Prefer <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy_with_logits</span></code> over <code class="docutils literal notranslate"><span class="pre">binary_cross_entropy</span></code></a></li>
</ul>
</li>
<li><a class="reference internal" href="#xpu-op-specific-behavior-experimental">XPU Op-Specific Behavior (Experimental)</a><ul>
<li><a class="reference internal" href="#xpu-ops-that-can-autocast-to-float16">XPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float16</span></code></a></li>
<li><a class="reference internal" href="#xpu-ops-that-can-autocast-to-float32">XPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a></li>
<li><a class="reference internal" href="#xpu-ops-that-promote-to-the-widest-input-type">XPU Ops that promote to the widest input type</a></li>
</ul>
</li>
<li><a class="reference internal" href="#cpu-op-specific-behavior">CPU Op-Specific Behavior</a><ul>
<li><a class="reference internal" href="#cpu-ops-that-can-autocast-to-bfloat16">CPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">bfloat16</span></code></a></li>
<li><a class="reference internal" href="#cpu-ops-that-can-autocast-to-float32">CPU Ops that can autocast to <code class="docutils literal notranslate"><span class="pre">float32</span></code></a></li>
<li><a class="reference internal" href="#cpu-ops-that-promote-to-the-widest-input-type">CPU Ops that promote to the widest input type</a></li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
</ul>

            </div>
          </div>
        </div>
      </section>
    </div>

  
       <script type="text/javascript" id="documentation_options" data-url_root="./" src="_static/documentation_options.js"></script>
         <script data-url_root="./" id="documentation_options" src="_static/documentation_options.js"></script>
         <script src="_static/jquery.js"></script>
         <script src="_static/underscore.js"></script>
         <script src="_static/_sphinx_javascript_frameworks_compat.js"></script>
         <script src="_static/doctools.js"></script>
         <script src="_static/sphinx_highlight.js"></script>
         <script src="_static/clipboard.min.js"></script>
         <script src="_static/copybutton.js"></script>
     

  <script type="text/javascript" src="_static/js/vendor/popper.min.js"></script>
  <script type="text/javascript" src="_static/js/vendor/bootstrap.min.js"></script>
  <script src="https://cdnjs.cloudflare.com/ajax/libs/list.js/1.5.0/list.min.js"></script>
  <script type="text/javascript" src="_static/js/theme.js"></script>

  <script type="text/javascript">
      jQuery(function () {
          SphinxRtdTheme.Navigation.enable(true);
      });
  </script>
 
<script script type="text/javascript">
  var collapsedSections = ['Developer Notes', 'Language Bindings', 'Libraries', 'Community'];
</script>

<img height="1" width="1" style="border-style:none;" alt="" src="https://www.googleadservices.com/pagead/conversion/795629140/?label=txkmCPmdtosBENSssfsC&amp;guid=ON&amp;script=0"/>


  <!-- Begin Footer -->

  <div class="container-fluid docs-tutorials-resources" id="docs-tutorials-resources">
    <div class="container">
      <div class="row">
        <div class="col-md-4 text-center">
          <h2>Docs</h2>
          <p>Access comprehensive developer documentation for PyTorch</p>
          <a class="with-right-arrow" href="https://pytorch.org/docs/stable/index.html">View Docs</a>
        </div>

        <div class="col-md-4 text-center">
          <h2>Tutorials</h2>
          <p>Get in-depth tutorials for beginners and advanced developers</p>
          <a class="with-right-arrow" href="https://pytorch.org/tutorials">View Tutorials</a>
        </div>

        <div class="col-md-4 text-center">
          <h2>Resources</h2>
          <p>Find development resources and get your questions answered</p>
          <a class="with-right-arrow" href="https://pytorch.org/resources">View Resources</a>
        </div>
      </div>
    </div>
  </div>

  <footer class="site-footer">
    <div class="container footer-container">
      <div class="footer-logo-wrapper">
        <a href="https://pytorch.org/" class="footer-logo"></a>
      </div>

      <div class="footer-links-wrapper">
        <div class="footer-links-col">
          <ul>
            <li class="list-title"><a href="https://pytorch.org/">PyTorch</a></li>
            <li><a href="https://pytorch.org/get-started">Get Started</a></li>
            <li><a href="https://pytorch.org/features">Features</a></li>
            <li><a href="https://pytorch.org/ecosystem">Ecosystem</a></li>
            <li><a href="https://pytorch.org/blog/">Blog</a></li>
            <li><a href="https://github.com/pytorch/pytorch/blob/master/CONTRIBUTING.md">Contributing</a></li>
          </ul>
        </div>

        <div class="footer-links-col">
          <ul>
            <li class="list-title"><a href="https://pytorch.org/resources">Resources</a></li>
            <li><a href="https://pytorch.org/tutorials">Tutorials</a></li>
            <li><a href="https://pytorch.org/docs/stable/index.html">Docs</a></li>
            <li><a href="https://discuss.pytorch.org" target="_blank">Discuss</a></li>
            <li><a href="https://github.com/pytorch/pytorch/issues" target="_blank">Github Issues</a></li>
            <li><a href="https://pytorch.org/assets/brand-guidelines/PyTorch-Brand-Guidelines.pdf" target="_blank">Brand Guidelines</a></li>
          </ul>
        </div>

        <div class="footer-links-col">
          <ul>
            <li class="list-title">Stay up to date</li>
            <li><a href="https://www.facebook.com/pytorch" target="_blank">Facebook</a></li>
            <li><a href="https://twitter.com/pytorch" target="_blank">Twitter</a></li>
            <li><a href="https://www.youtube.com/pytorch" target="_blank">YouTube</a></li>
            <li><a href="https://www.linkedin.com/company/pytorch" target="_blank">LinkedIn</a></li>
          </ul>  
          </div>

        <div class="footer-links-col">
          <ul>
            <li class="list-title">PyTorch Podcasts</li>
            <li><a href="https://open.spotify.com/show/6UzHKeiy368jKfQMKKvJY5" target="_blank">Spotify</a></li>
            <li><a href="https://podcasts.apple.com/us/podcast/pytorch-developer-podcast/id1566080008" target="_blank">Apple</a></li>
            <li><a href="https://www.google.com/podcasts?feed=aHR0cHM6Ly9mZWVkcy5zaW1wbGVjYXN0LmNvbS9PQjVGa0lsOA%3D%3D" target="_blank">Google</a></li>
            <li><a href="https://music.amazon.com/podcasts/7a4e6f0e-26c2-49e9-a478-41bd244197d0/PyTorch-Developer-Podcast?" target="_blank">Amazon</a></li>
          </ul>
         </div>
        </div>
        
        <div class="privacy-policy">
          <ul>
            <li class="privacy-policy-links"><a href="https://www.linuxfoundation.org/terms/" target="_blank">Terms</a></li>
            <li class="privacy-policy-links">|</li>
            <li class="privacy-policy-links"><a href="https://www.linuxfoundation.org/privacy-policy/" target="_blank">Privacy</a></li>
          </ul>
        </div>
        <div class="copyright">
        <p>© Copyright The Linux Foundation. The PyTorch Foundation is a project of The Linux Foundation.
          For web site terms of use, trademark policy and other policies applicable to The PyTorch Foundation please see
          <a href="https://www.linuxfoundation.org/policies/">www.linuxfoundation.org/policies/</a>. The PyTorch Foundation supports the PyTorch open source
          project, which has been established as PyTorch Project a Series of LF Projects, LLC. For policies applicable to the PyTorch Project a Series of LF Projects, LLC,
          please see <a href="https://www.lfprojects.org/policies/">www.lfprojects.org/policies/</a>.</p>
      </div>
     </div>

  </footer>

  <div class="cookie-banner-wrapper">
  <div class="container">
    <p class="gdpr-notice">To analyze traffic and optimize your experience, we serve cookies on this site. By clicking or navigating, you agree to allow our usage of cookies. As the current maintainers of this site, Facebook’s Cookies Policy applies. Learn more, including about available controls: <a href="https://www.facebook.com/policies/cookies/">Cookies Policy</a>.</p>
    <img class="close-button" src="_static/images/pytorch-x.svg">
  </div>
</div>

  <!-- End Footer -->

  <!-- Begin Mobile Menu -->

  <div class="mobile-main-menu">
    <div class="container-fluid">
      <div class="container">
        <div class="mobile-main-menu-header-container">
          <a class="header-logo" href="https://pytorch.org/" aria-label="PyTorch"></a>
          <a class="main-menu-close-button" href="#" data-behavior="close-mobile-menu"></a>
        </div>
      </div>
    </div>

    <div class="mobile-main-menu-links-container">
      <div class="main-menu">
        <ul>
           <li class="resources-mobile-menu-title">
             <a>Learn</a>
           </li>
           <ul class="resources-mobile-menu-items">
             <li>
               <a href="https://pytorch.org/get-started">Get Started</a>
             </li>
             <li>
               <a href="https://pytorch.org/tutorials">Tutorials</a>
             </li>
             <li>
               <a href="https://pytorch.org/tutorials/beginner/basics/intro.html">Learn the Basics</a>
             </li>
             <li>
               <a href="https://pytorch.org/tutorials/recipes/recipes_index.html">PyTorch Recipes</a>
             </li>
             <li>
               <a href="https://pytorch.org/tutorials/beginner/introyt.html">Introduction to PyTorch - YouTube Series</a>
             </li>
           </ul>
           <li class="resources-mobile-menu-title">
             <a>Ecosystem</a>
           </li>
           <ul class="resources-mobile-menu-items">
             <li>
               <a href="https://pytorch.org/ecosystem">Tools</a>
             </li>
             <li>
               <a href="https://pytorch.org/#community-module">Community</a>
             </li>
             <li>
               <a href="https://discuss.pytorch.org/">Forums</a>
             </li>
             <li>
               <a href="https://pytorch.org/resources">Developer Resources</a>
             </li>
             <li>
               <a href="https://pytorch.org/ecosystem/contributor-awards-2023">Contributor Awards - 2023</a>
             </li>
           </ul>

           <li class="resources-mobile-menu-title">
             <a>Edge</a>
           </li>

           <ul class="resources-mobile-menu-items">
             <li>
               <a href="https://pytorch.org/edge">About PyTorch Edge</a>
             </li>
             
             <li>
               <a href="https://pytorch.org/executorch-overview">ExecuTorch</a>
             </li>
           </ul>

           <li class="resources-mobile-menu-title">
             <a>Docs</a>
           </li>

           <ul class="resources-mobile-menu-items">
            <li>
              <a href="https://pytorch.org/docs/stable/index.html">PyTorch</a>
            </li>

            <li>
              <a href="https://pytorch.org/pytorch-domains">PyTorch Domains</a>
            </li>
          </ul>

          <li class="resources-mobile-menu-title">
            <a>Blog & News</a>
          </li>
            
           <ul class="resources-mobile-menu-items">
            <li>
              <a href="https://pytorch.org/blog/">PyTorch Blog</a>
            </li>
            <li>
              <a href="https://pytorch.org/community-blog">Community Blog</a>
            </li>

            <li>
              <a href="https://pytorch.org/videos">Videos</a>
            </li>

            <li>
              <a href="https://pytorch.org/community-stories">Community Stories</a>
            </li>
            <li>
              <a href="https://pytorch.org/events">Events</a>
            </li>
          </ul>
          
          <li class="resources-mobile-menu-title">
            <a>About</a>
          </li>

          <ul class="resources-mobile-menu-items">
            <li>
              <a href="https://pytorch.org/foundation">PyTorch Foundation</a>
            </li>
            <li>
              <a href="https://pytorch.org/governing-board">Governing Board</a>
            </li>
          </ul>
        </ul>
      </div>
    </div>
  </div>

  <!-- End Mobile Menu -->

  <script type="text/javascript" src="_static/js/vendor/anchor.min.js"></script>

  <script type="text/javascript">
    $(document).ready(function() {
      mobileMenu.bind();
      mobileTOC.bind();
      pytorchAnchors.bind();
      sideMenus.bind();
      scrollToAnchor.bind();
      highlightNavigation.bind();
      mainMenuDropdown.bind();
      filterTags.bind();

      // Add class to links that have code blocks, since we cannot create links in code blocks
      $("article.pytorch-article a span.pre").each(function(e) {
        $(this).closest("a").addClass("has-code");
      });
    })
  </script>
</body>
</html>