La derivata della funzione composta è il prodotto tra la derivata della funzione esterna, avente come argomento la funzione interna, per la derivata della funzione interna:
D
[
f
(
g
(
x
)
)
]
=
f
′
(
g
(
x
)
)
⋅
g
′
(
x
)
.
{\displaystyle \operatorname {D} [f(g(x))]=f'(g(x))\cdot g'(x).}
Le notazioni
D
[
f
(
x
)
]
{\displaystyle \operatorname {D} [f(x)]}
e
f
′
(
x
)
{\displaystyle f'(x)}
indicano il medesimo significato di derivata.
La formula è valida anche per funzioni di più variabili reali e per funzioni vettoriali . Il teorema di derivazione delle funzioni composte afferma che se:
x
(
t
)
=
(
x
1
(
t
)
,
x
2
(
t
)
,
…
,
x
n
(
t
)
)
,
t
∈
R
{\displaystyle \mathbf {x} (t)=(x_{1}(t),x_{2}(t),\dots ,x_{n}(t)),\quad t\in \mathbb {R} }
è un vettore di
R
n
{\displaystyle \mathbb {R} ^{n}}
le cui componenti sono funzioni derivabili
x
′
(
t
)
=
(
x
1
′
(
t
)
,
x
2
′
(
t
)
,
…
,
x
n
′
(
t
)
)
{\displaystyle \mathbf {x} '(t)=(x'_{1}(t),x'_{2}(t),\dots ,x'_{n}(t))}
e se
f
{\displaystyle f}
è una funzione differenziabile in
x
(
t
)
{\displaystyle \mathbf {x} (t)}
, allora la funzione composta
F
(
t
)
=
f
(
x
(
t
)
)
{\displaystyle F(t)=f(\mathbf {x} (t))}
è differenziabile nella variabile
t
{\displaystyle t}
e si ha:
F
′
(
t
)
=
∑
i
=
1
n
∂
f
(
x
(
t
)
)
∂
x
i
x
i
′
(
t
)
=
⟨
∇
F
(
t
)
,
x
′
(
t
)
⟩
=
⟨
∇
f
(
x
(
t
)
)
,
x
′
(
t
)
⟩
{\displaystyle F'(t)=\sum _{i=1}^{n}{\frac {\partial f(\mathbf {x} (t))}{\partial x_{i}}}x'_{i}(t)=\langle {\mathbf {\nabla } F(t)},{\mathbf {x} '(t)}\rangle =\langle {\mathbf {\nabla } f(\mathbf {x} (t))},{\mathbf {\mathbf {x} } '(t)}\rangle }
dove
∇
f
{\displaystyle \nabla f}
è il gradiente di
f
{\displaystyle f}
e
⟨
⋅
,
⋅
⟩
{\displaystyle \langle \cdot ,\cdot \rangle }
è il prodotto scalare euclideo .
Ad esempio, se
f
{\displaystyle f}
è una funzione di due variabili composta dopo la funzione vettoriale
(
g
,
h
)
{\displaystyle (g,h)}
, cioè
f
(
g
(
t
)
,
h
(
t
)
)
{\displaystyle f(g(t),h(t))}
, allora:
d
f
d
t
=
∂
f
∂
g
d
g
d
t
+
∂
f
∂
h
d
h
d
t
.
{\displaystyle {df \over dt}={\partial f \over \partial g}{dg \over dt}+{\partial f \over \partial h}{dh \over dt}.}
Inoltre, se
f
{\displaystyle \mathbf {f} }
e
g
{\displaystyle \mathbf {g} }
sono due funzioni vettoriali differenziabili componibili, allora:
J
[
(
f
∘
g
)
(
x
)
]
=
J
[
f
(
g
(
x
)
)
]
⋅
J
[
g
(
x
)
]
,
{\displaystyle J[(\mathbf {f} \circ \mathbf {g} )(x)]=J[\mathbf {f} (\mathbf {g} (x))]\cdot J[\mathbf {g} (x)],}
dove
⋅
{\displaystyle \cdot }
è la moltiplicazione di matrici e
J
[
f
(
x
)
]
{\displaystyle J[\mathbf {f} (x)]}
è la matrice jacobiana di
f
{\displaystyle \mathbf {f} }
.
Sia, per non appesantire la notazione,
Δ
g
:=
g
(
x
+
h
)
−
g
(
x
)
{\displaystyle \Delta g:=g(x+h)-g(x)}
, da cui
g
(
x
+
h
)
=
g
(
x
)
+
Δ
g
{\displaystyle g(x+h)=g(x)+\Delta g}
. Definiamo ora
ω
(
Δ
g
)
=
{
f
(
g
(
x
)
+
Δ
g
)
−
f
(
g
(
x
)
)
Δ
g
−
f
′
(
g
(
x
)
)
,
se
Δ
g
≠
0
,
0
,
se
Δ
g
=
0.
{\displaystyle \omega (\Delta g)={\begin{cases}{\frac {f(g(x)+\Delta g)-f(g(x))}{\Delta g}}-f'(g(x)),&{\text{se }}\Delta g\neq 0,\\0,&{\text{se }}\Delta g=0.\end{cases}}}
È dunque
f
(
g
(
x
)
+
Δ
g
)
−
f
(
g
(
x
)
)
=
f
′
(
g
(
x
)
)
⋅
Δ
g
+
ω
(
Δ
g
)
⋅
Δ
g
.
{\displaystyle f(g(x)+\Delta g)-f(g(x))=f'(g(x))\cdot \Delta g+\omega (\Delta g)\cdot \Delta g.}
Inoltre, per l'ipotesi di derivabilità di
f
{\displaystyle f}
, è
lim
Δ
g
→
0
ω
(
Δ
g
)
=
0.
{\displaystyle \lim _{\Delta g\to 0}\omega (\Delta g)=0.}
Esaminiamo ora il rapporto incrementale di
f
(
g
(
x
)
)
{\displaystyle f(g(x))}
:
D
[
f
(
g
(
x
)
)
]
=
lim
h
→
0
f
(
g
(
x
+
h
)
)
−
f
(
g
(
x
)
)
h
=
lim
h
→
0
f
(
g
(
x
)
+
Δ
g
)
−
f
(
g
(
x
)
)
h
=
lim
h
→
0
f
′
(
g
(
x
)
)
⋅
Δ
g
+
ω
(
Δ
g
)
⋅
Δ
g
h
.
{\displaystyle \operatorname {D} [f(g(x))]=\lim _{h\to 0}{\frac {f(g(x+h))-f(g(x))}{h}}=\lim _{h\to 0}{\frac {f(g(x)+\Delta g)-f(g(x))}{h}}=\lim _{h\to 0}{\frac {f'(g(x))\cdot \Delta g+\omega (\Delta g)\cdot \Delta g}{h}}.}
Spezzando la frazione, abbiamo
lim
h
→
0
f
′
(
g
(
x
)
)
⋅
g
(
x
+
h
)
−
g
(
x
)
h
+
lim
h
→
0
ω
(
Δ
g
)
⋅
g
(
x
+
h
)
−
g
(
x
)
h
.
{\displaystyle \lim _{h\to 0}f'(g(x))\cdot {\frac {g(x+h)-g(x)}{h}}+\lim _{h\to 0}\omega (\Delta g)\cdot {\frac {g(x+h)-g(x)}{h}}.}
E quindi passando al limite
D
[
f
(
g
(
x
)
)
]
=
f
′
(
g
(
x
)
)
⋅
g
′
(
x
)
+
0
⋅
g
′
(
x
)
=
f
′
(
g
(
x
)
)
⋅
g
′
(
x
)
.
{\displaystyle \operatorname {D} [f(g(x))]=f'(g(x))\cdot g'(x)+0\cdot g'(x)=f'(g(x))\cdot g'(x).}
Siano
f
:
A
→
R
{\displaystyle f\colon A\to \mathbb {R} }
e
g
:
B
→
A
{\displaystyle g\colon B\to A}
derivabili in ogni punto, dove
A
,
B
⊆
R
{\displaystyle A,B\subseteq \mathbb {R} }
.
Dalla definizione di derivata si ha
D
[
(
f
∘
g
)
(
x
)
]
=
lim
t
→
x
f
(
g
(
t
)
)
−
f
(
g
(
x
)
)
t
−
x
.
{\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{t\to x}{\frac {f(g(t))-f(g(x))}{t-x}}.}
L'idea di fondo è dividere il numeratore del rapporto incrementale per
g
(
t
)
−
g
(
x
)
{\displaystyle g(t)-g(x)}
in modo da ottenere il rapporto incrementale di
f
{\displaystyle f}
calcolato nel punto
g
(
x
)
{\displaystyle g(x)}
, e quindi poter esprimere la derivata della funzione composta in funzione della derivata di
f
{\displaystyle f}
calcolata in
g
(
x
)
{\displaystyle g(x)}
. Moltiplichiamo e dividiamo (che equivale a moltiplicare per
1
{\displaystyle 1}
, preservando l'uguaglianza), il secondo membro per
g
(
t
)
−
g
(
x
)
{\displaystyle g(t)-g(x)}
:
D
[
(
f
∘
g
)
(
x
)
]
=
lim
t
→
x
f
(
g
(
t
)
)
−
f
(
g
(
x
)
)
t
−
x
g
(
t
)
−
g
(
x
)
g
(
t
)
−
g
(
x
)
.
{\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{t\to x}{\frac {f(g(t))-f(g(x))}{t-x}}{\frac {g(t)-g(x)}{g(t)-g(x)}}.}
Per le proprietà associativa e commutativa del prodotto otteniamo:
D
[
(
f
∘
g
)
(
x
)
]
=
lim
t
→
x
f
(
g
(
t
)
)
−
f
(
g
(
x
)
)
g
(
t
)
−
g
(
x
)
g
(
t
)
−
g
(
x
)
t
−
x
.
{\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{t\to x}{\frac {f(g(t))-f(g(x))}{g(t)-g(x)}}{\frac {g(t)-g(x)}{t-x}}.}
Poiché per ipotesi
f
{\displaystyle f}
e
g
{\displaystyle g}
sono derivabili, esistono i limiti dei rapporti incrementali, rispettivamente
lim
a
→
b
f
(
a
)
−
f
(
b
)
a
−
b
=
D
[
f
(
b
)
]
{\displaystyle \lim _{a\to b}{f(a)-f(b) \over a-b}=\operatorname {D} [f(b)]}
e
lim
α
→
β
g
(
α
)
−
g
(
β
)
α
−
β
=
D
[
g
(
β
)
]
{\displaystyle \lim _{\alpha \to \beta }{g(\alpha )-g(\beta ) \over \alpha -\beta }=\operatorname {D} [g(\beta )]}
, in qualsiasi punto del dominio; ma per questo, dopo aver applicato nel primo limite del rapporto incrementale la sostituzione
g
(
t
)
:=
θ
{\displaystyle g(t):=\theta }
, il limite del prodotto di quei rapporti incrementali è uguale al prodotto dei loro limiti presi separati:
D
[
(
f
∘
g
)
(
x
)
]
=
lim
θ
→
g
(
x
)
f
(
θ
)
−
f
(
g
(
x
)
)
θ
−
g
(
x
)
lim
t
→
x
g
(
t
)
−
g
(
x
)
t
−
x
=
f
′
(
g
(
x
)
)
⋅
g
′
(
x
)
{\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{\theta \to g(x)}{\frac {f(\theta )-f(g(x))}{\theta -g(x)}}\lim _{t\to x}{\frac {g(t)-g(x)}{t-x}}=f'(g(x))\cdot g'(x)}
Si considerino due funzioni
f
,
g
:
[
a
,
b
]
→
R
{\displaystyle f,g\colon [a,b]\to \mathbb {R} }
e la funzione composta
H
(
x
)
=
g
(
f
(
x
)
)
,
{\displaystyle H(x)=g\left(f(x)\right),}
allora è possibile scrivere i rapporti incrementali delle funzioni in questo modo:
f
(
x
+
h
)
−
f
(
x
)
=
f
′
(
x
)
h
+
o
1
(
h
)
;
{\displaystyle f(x+h)-f(x)=f'(x)h+o_{1}(h);}
g
(
y
+
k
)
−
g
(
y
)
=
g
′
(
y
)
k
−
o
2
(
k
)
;
{\displaystyle g(y+k)-g(y)=g'(y)k-o_{2}(k);}
H
(
x
+
h
)
−
H
(
x
)
=
α
(
x
)
h
−
o
3
(
h
)
.
{\displaystyle H(x+h)-H(x)=\alpha (x)h-o_{3}(h).}
A questo punto si passa alla riscrittura di
H
(
x
+
h
)
−
H
(
x
)
{\displaystyle H(x+h)-H(x)}
tenendo conto che
H
(
x
)
=
g
(
f
(
x
)
)
{\displaystyle H(x)=g\left(f(x)\right)}
quindi si ha:
H
(
x
+
h
)
−
H
(
x
)
=
g
(
f
(
x
+
h
)
)
−
g
(
f
(
x
)
)
.
{\displaystyle H(x+h)-H(x)=g(f(x+h))-g(f(x)).}
Si ricordi che
f
(
x
+
h
)
=
f
(
x
)
+
f
′
(
x
)
h
+
o
1
(
h
)
,
{\displaystyle f(x+h)=f(x)+f'(x)h+o_{1}(h),}
quindi si ha:
H
(
x
+
h
)
−
H
(
x
)
=
g
(
f
(
x
)
+
f
′
(
x
)
h
+
o
1
(
h
)
)
−
g
(
f
(
x
)
)
.
{\displaystyle H(x+h)-H(x)=g(f(x)+f'(x)h+o_{1}(h))-g(f(x)).}
Si effettua la sostituzione
f
(
x
)
=
y
{\displaystyle f(x)=y}
e
k
=
f
′
(
x
)
h
+
o
1
(
h
)
{\displaystyle k=f'(x)h+o_{1}(h)}
e si scrive:
H
(
x
+
h
)
−
H
(
x
)
=
g
(
y
+
k
)
−
g
(
y
)
=
g
′
(
y
)
k
−
o
2
(
k
)
=
g
′
(
f
(
x
)
)
⋅
(
f
′
(
x
)
h
+
o
1
(
h
)
)
−
o
2
(
k
)
=
g
′
(
f
(
x
)
)
f
′
(
x
)
h
+
g
′
(
f
(
x
)
)
o
1
(
h
)
−
o
2
(
k
)
.
{\displaystyle H(x+h)-H(x)=g(y+k)-g(y)=g'(y)k-o_{2}(k)=g'(f(x))\cdot (f'(x)h+o_{1}(h))-o_{2}(k)=g'(f(x))f'(x)h+g'(f(x))o_{1}(h)-o_{2}(k).}
Si pone
α
(
x
)
=
g
′
(
f
(
x
)
)
f
′
(
x
)
{\displaystyle \alpha (x)=g'(f(x))f'(x)}
e inoltre
o
3
(
h
)
=
g
′
(
f
(
x
)
)
o
1
(
h
)
−
o
2
(
k
)
,
{\displaystyle o_{3}(h)=g'(f(x))o_{1}(h)-o_{2}(k),}
così il teorema è dimostrato.