Теорема про обернену функцію

Теорема про обернену функцію в диференціальному численні дає достатню умову для того, щоб функція була оберненою в околі точки з її області визначення: а саме, її похідна неперервна і не дорівнює нулю в точці.

Теорема також дає формулу для похідної оберненої функції. У аналізі функцій багатьох змінних цю теорему можна узагальнити для будь-якої неперервно диференційовної, векторзначної функції для якої визначник Якобі (якобіан) відмінний від нуля в точці її області визначення, що дає формулу для оберненої матриці Якобі. Також існують версії теореми про обернену функцію для комплексних голоморфних функцій, для диференційних відображень між многовидами та диференційовних функцій між банаховими просторами, тощо.

Вперше ця теорема була встановлена Пікаром і Ґурса за допомогою ітераційної схеми: основна ідея полягає в тому, щоб довести теорему про нерухому точку^[en] за допомогою теореми про стискаючі відображення.

Твердження

Для функцій однієї змінної, теорема стверджує: якщо $f$ — неперервно диференційовна функція, похідна якої не дорівнює нулю у точці $a$ , то функція $f$ ін'єктивна (або бієктивна на образі) в околі точки $a$ , обернена функція неперервно диференційовна в околі точки $b=f(a)$ , а похідна оберненої функції в точці $b$ є оберненою до похідної функції $f$ у точці $a$ :

{\bigl (}f^{-1}{\bigr )}'(b)={\frac {1}{f'(a)}}={\frac {1}{f'{\bigr (}f^{-1}(b){\bigr )}}}.

Може статися, що функція $f$ може бути ін'єктивною в околі точки $a$ , тоді як $f'(a)=0$ . Наприклад, $f'(x)=(x-a)^{3}$ . По суті, для такої функції, обернена не може бути диференційовною в точці $b=f(a)$ , так як, якщо обернена функція $f^{-1}$ була б диференційовною в точці $b$ , то тоді, за правилом диференціювання складеної функції маємо

1={\bigl (}f^{-1}\circ f{\bigr )}'(a)={\bigr (}f^{-1}{\bigr )}'(b)f'(a),

з чого випливає, що $f'(a)\neq 0$ . (Для голоморфних функцій вже інша ситуація, див. #Теорема про обернену голоморфну функцію нижче.)

Для функцій більше ніж однієї змінної теорема стверджує, що якщо $f$ — неперервно диференційовна функція з відкритої множини $U$ простору $\mathbb {R} ^{n}$ у простір $\mathbb {R} ^{m}$ , і повна похідна функції $f'(a)$ оборотна в точці $a$ (тобто визначник матриці Якобі для функції $f$ в точці $a$ відмінний від нуля), то існує окіл $U'$ точки $a$ в $U$ та окіл $V$ точки $b=f(a)$ такі, що $f(U')\subset V$ і $f\colon U'\to V$ є бієкцією.^[1] Запис $f={\bigr (}f_{1},\dots ,f_{n}{\bigr )}$ означає, що система з $m$ рівнянь $y_{i}=f_{i}(x_{1},\dots ,x_{n})$ має єдиний розв'язок для $x_{1},\dots ,x_{n}$ у термінах $y_{1},\dots ,y_{n}$ , де $x\in U'$ , $y\in V$ . Зауважимо, що теорема не стверджує, що функція $f$ є бієкцією в образ, де похідна $f'(a)$ оборотна (визначник матриці Якобі не дорівнює нулю), а що це локальна бієкція, де похідна $f'$ оборотна.

Більше того, теорема стверджує, що обернена функція $f^{-1}\colon V\to U'$ неперервно диференційовна, а її похідна в точці $b=f(a)$ є оберненим відображенням для $f'(a)$ , тобто

(f^{-1})'(b)=f'(a)^{-1}.

Інакше кажучі, якщо $Jf^{-1}(b)$ і $Jf(a)$ — матриці Якобі відповідно для ${\big (}f^{-1}{\big )}'(b)$ і $f'(a)$ , то

Jf^{-1}(b)=Jf(a)^{-1}.

Складною частиною теореми є доведення теореми про існування та диференційовність функції $f^{-1}$ . При цьому формула похідної для оберненої функції випливає з правила диференціювання складеної функції, застосованого до $f^{-1}\circ f=I$ . (І справді, $I=(f^{-1}\circ f)^{'}(a)=(f^{-1})'(b)\circ f'(a).$ ) Як наслідок отримуємо, що якщо функція $f$ є $k$ раз диференційовною із ненульовою похідною в точці $a$ , то функція $f$ є оборотною в околі точки $a$ , і обернена функція також є $k$ раз диференційовною. Тут $k$ — натуральне число або $\infty$ .

Існує два варіанта теореми про обернену функцію.^[1] Для заданої неперервно диференційовного відображення $f\colon U\to \mathbb {R} ^{m}$ перший варіант це

Похідна функції $f'(a)$ є сюр’єктивною (тобто відповідна матриця Якобі має ранг $m$ ), тоді й лише тоді, коли існує неперервно диференційовна функція $g$ в околі $V$ точки $b=f(a)$ така, що $f\circ g=I$ в околі точки $b$ .

А інший варіант це

Похідна функції $f'(a)$ ін’єктивна тоді й лише тоді, коли існує неперервно диференційовна функція $g$ в околі $V$ точки $b=f(a)$ така, що $g\circ f=I$ в околі точки $a$ .

У першому випадку (коли похідна функція $f'(a)$ є сюр’єктивною) точка $b=f(a)$ називається регулярним значенням. Оскільки, ранг $m=\dim \ker {\bigr (}f'(a){\bigr )}+\dim \operatorname {im} {\bigr (}f'(a){\bigr )}$ , то перший випадок еквівалентний тому, щоб сказати, що точка $b=f(a)$ не є образом критичних точок $a$ (критичною точкою є точка $a$ така, що ядро для $f'(a)$ є ненульовим). Твердження в першому випадку іноді також називають теоремою про субмерсію.

Ці варіанти є повторенням теореми про обернені функції. Дійсно, у першому випадку, коли $f'(a)$ є сюр’єкцією, то можна знайти (ін’єктивне) лінійне відображення $T$ таке, що $f'(a)\circ T=I$ . Визначивши $h(x)=a+Tx$ , отримуємо

{\bigr (}f\circ h{\bigr )}'(0)=f'(a)\circ T=I.

Отже, за теоремою про обернену функцію, композиція $f\circ h$ має обернену функцію в околі точки $0$ , тобто $f\circ h\circ {\bigr (}f\circ h{\bigr )}^{-1}=I$ в околі точки $b$ . Другий випадок (коли $f'(a)$ є ін'єкцією) розглядається аналогічно.

Приклад

Розглянемо векторзначну функцію $F\colon \mathbb {R} ^{2}\to \mathbb {R} ^{2}$ визначену як

\mathbf {F} (x,y)={\begin{bmatrix}{\rm {e}}^{x}\cos y\\{\rm {e}}^{x}\sin y\end{bmatrix}}.

Матриця Якобі для якої має вигляд

J_{F}(x,y)={\begin{bmatrix}{\rm {e}}^{x}\cos y&-{\rm {e}}^{x}\sin y\\{\rm {e}}^{x}\sin y&{\rm {e}}^{x}\cos y\end{bmatrix}}.

із визначником

\det J_{F}(x,y)={\rm {e}}^{2x}\cos ^{2}y+{\rm {e}}^{2x}\sin ^{2}y={\rm {e}}^{2x}.

Визначник ${\rm {e}}^{2x}$ — скрізь відмінний від нуля. Таким чином, теорема забезпечує, що для кожної точки $p$ у $\mathbb {R} ^{2}$ існує окіл точки $p$ у якому функція $F$ є оборотною. Зауважимо, що це не означає оборотності функції $F$ на всій області: у цьому випадку функція $F$ не є навіть ін'єктивною, оскільки вона є періодичною $F(x,y)=F(x,y+2\pi )$ .

Контрприклад

Функція $f(x)=x+2x^{2}\sin({\tfrac {1}{x}})$ обмежена всередині квадратичної області навколо прямої $y=x$ , тому $f'(0)=1$ . Проте, вона має точки локального максимуму або локального мінімуму, що накопичуються при наближенні до точки $x=0$ , а отже функція не є взаємно однозначною на будь-якому інтервалі, що включає точку $x=0$ .

Якщо відкинути припущення, що похідна неперервна, то функція необов'язково має бути оборотною.

Наприклад, $f(x)=x+2x^{2}\sin \left({\frac {1}{x}}\right)$ і $f(0)=0$ має розривну похідну

f'(x)=1-2\cos \left({\frac {1}{x}}\right)+4x\sin \left({\frac {1}{x}}\right)

та

f'(0)=1,

яка зануляється при наближені до точки $x=0$ .

Ці критичні точки є локальними максимумами або локальними мінімумами функції $f$ . Таким чином, функція $f$ не є взаємно однозначною (і оборотною) на будь-якому інтервалі, що включає точку $x=0$ .

Інтуїтивно зрозуміло, що кутовий коефіцієнт $f'(0)=1$ не розповсюджується на найближчі точки, де кутові коефіцієнти визначається слабкими, але швидкими коливаннями.

Методи доведення

Як важливий результат теорема про обернену функцію отримала багаточисельні доведення. Доведення, яке найчастіше зустрічається в підручниках, ґрунтується на принципі стискаючих відображень, також відоме як теорема Банаха про нерухому точку (яку також можна використовувати як ключовий крок у доведенні існування та єдиності розв’язків звичайних диференціальних рівнянь).^[2]^[3]

Оскільки теорема про нерухому точку використовується у нескінченновимірній (банахового простору) постановці, то це доведення відразу узагальнюється на нескінченновимірну версію теореми про обернену функцію^[4] (див. узагальнення нижче).

Альтернативне доведення у скінченновимірних просторах базується на теоремі про екстремальні значення (друга теорема Веєрштрасса) для функцій на компактній множині.^[5]

Ще одне доведення використовує метод Ньютона, який має ту перевагу, що надає ефективний варіант теореми: обмеження на похідну функції приводять до оцінки розміру околу на якому функція є оборотною.^[6]

Доведення з використанням методу послідовних наближень

Для доведення існування, внаслідок афінного перетворення, можна вважати, що $f(0)=0$ та $f^{\prime }(0)=I$ , а тому $a=b=0$ .

За основною теоремою математичного аналізу, якщо $u$ є неперервно диференційовною функцією, то

u(1)-u(0)=\int _{0}^{1}u^{\prime }(t)\,{\rm {d}}t,

тобто

\|u(1)-u(0)\|\leq \sup _{0\leq t\leq 1}\|u^{\prime }(t)\|.

Нехай $u(t)=f(x+t(x^{\prime }-x))-x-t(x^{\prime }-x)$ , тоді

\|f(x)-f(x^{\prime })-x+x^{\prime }\|\leq \|x-x^{\prime }\|\sup _{0\leq t\leq 1}\|f^{\prime }(x+t(x^{\prime }-x))-I\|.

Тепер візьмемо $\delta >0$ , тоді $\|f'(x)-I\|<{\frac {1}{2}}$ для $\|x\|<\delta$ . Нехай $\|y\|<{\frac {\delta }{2}}$ і $x_{n}$ визначається рекуретно за $x_{0}=0$ та $x_{n+1}=x_{n}+y-f(x_{n})$ . Припущення показують, що якщо $\|x\|,\|x^{\prime }\|<\delta$ , то

\|f(x)-f(x^{\prime })-x+x^{\prime }\|\leq {\frac {\|x-x^{\prime }\|}{2}}.

Зокрема, якщо $f(x)=f(x^{\prime })$ , то $x=x^{\prime }$ . У індуктивній схемі маємо $\|x_{n}\|<\delta$ та $\|x_{n+1}-x_{n}\|<{\frac {\delta }{2^{n}}}$ . Таким чином, $(x_{n})$ — це фундаментальна послідовність, що прямує до $x$ . За побудовою $f(x)=y$ , що і вимагалося.

Щоб перевірити, що $g=f^{-1}$ є неперервно диференцйовною, запишемо $g(y+k)=x+h$ і, отже, $f(x+h)=f(x)+k$ . За наведеними вище нерівностями, маємо

\|h-k\|<{\frac {\|h\|}{2}},

а тому

{\frac {\|h\|}{2}}<\|k\|<2\|h\|.

З іншого боку, якщо $A=f^{\prime }(x)$ , тоді $\|A-I\|<{\frac {1}{2}}$ . Використовуючи геометричний ряд для $B=I-A$ , отримуємо, що $\|A^{-1}\|<2$ . Але тоді

{\displaystyle {\|g(y+k)-g(y)-f^{\prime }(g(y))^{-1}k\| \over \|k\|}={\|h-f^{\prime }(x)^{-1}[f(x+h)-f(x)]\| \over \|k\|}\leq 4{\|f(x+h)-f(x)-f^{\prime }(x)h\| \over \|h\|}}

прямує до нуля, якщо $k$ та $h$ прямують до нуля, що доводить те, що $g$ є неперервно диференційовною, причому $g^{\prime }(y)=f^{\prime }(g(y))^{-1}$ .

Вищенаведене доведення представлено для скінченновимірного простору, але його також можна використовувати і у випадку банахових просторів. Якщо оборотна функція $f$ є $k$ раз неперервно диференційовною, де $k>1$ , то її обернена функція також є $k$ раз неперервно диференційовною. Це випливає за індукцією з використанням того факту, що відображення $F(A)=A^{-1}$ для операторів є $k$ раз неперервно диференційовним для будь-яких значень $k$ (у скінченновимірному випадку це елементарний факт, оскільки обернена матриця визначається приєднаною матрицею поділеною на її визначник).^[1]^[7] Описаний метод доведення можна знайти у книжках Анрі Картана, Жана Д'єдонне, Сержа Ленга, Роджера Годемента^[en] та Ларса Германдера.

Доведення із використанням принципу стискаючого відображення

Нижче наведено доведення, що використовує теорему про стискаюче відображення. Зокрема, слідуючи роботам Теренса Тао,^[8] воно використовує наступний наслідок з теореми про стискаюче відображення.

Лемма. Нехай $B(0,r)$ відкрита куля радіуса $r$ в $\mathbb {R} ^{n}$ з центром в точці 0. Якщо відображення $g:B(0,r)\to \mathbb {R} ^{n}$ таке, що $g(0)=0$ та існує константа $0<c<1$ така, що

|g(y)-g(x)|\leq c|y-x|

для усіх $x,y\in B(0,r)$ , тоді функціія $f=I+g$ є ін'єктивною на $B(0,r)$ та $B(0,(1-c)r)\subset f\left(B(0,r)\right)\subset B(0,(1+c)r)$ .

(У загальному випадку твердження залишається вірним, якщо простір $\mathbb {R} ^{n}$ замінити на банаховий простір.)

Доведення. По суті, лема стверджує, що невелике збурення тотожного відображення за допомогою стискаючого відображення є ін'єктивним та, в деякому сенсі, зберігає кулю. Взявши до уваги лему, спочатку доведемо теорему. Як і у попередньому доведенні, достатньо довести частинний випадок, коли $a=0$ , $b=f(a)=0$ та $f'(0)=I$ . Нехай $g=f-I$ . Застосувавши теорему про середнє значення^[en] до відображення $t\mapsto g(x+t(y-x))$ , отримуємо

|g(y)-g(x)|\leq |y-x|\sup _{0<t<1}|g'(x+t(y-x))|.

Оскільки $g'(0)=I-I=0$ і функція $g'$ є неперервною, то можна знайти $r>0$ таке, що

|g(y)-g(x)|\leq 2^{-1}|y-x|

для усіх $x,y\in B(0,r)$ . Тоді з леми випливає, що функція $f=g+I$ є ін'єктивною на $B(0,r)$ і $B\left(0,{\frac {r}{2}}\right)\subset f\left(B(0,r)\right)$ . Отже, відображення

f\colon \ U=B(0,r)\cap f^{-1}\left(B\left(0,{\frac {r}{2}}\right)\right)\to V=B\left(0,{\frac {r}{2}}\right)

є бієктивним і отже, має обернене. Далі покажемо, що обернена функція $f^{-1}$ є неперервно диференційовною (ця частина міркувань є такою ж як і в попередньому доведенні). Цього разу нехай $g=f^{-1}$ — обернена до функції $f$ та $A=f'(x)$ . Для $x=g(y)$ запишемо $g(y+k)=x+h$ або $y+k=f(x+h)$ . Тепер, згідно попередньої оцінки,

|h-k|=|f(x+h)-f(x)-h|\leq {\frac {|h|}{2}}

і тому ${\frac {|h|}{2}}\leq |k|$ . Використовуючи $\|\cdot \|$ для оператора норми, отримуємо

|g(y+k)-g(y)-A^{-1}k|=|h-A^{-1}(f(x+h)-f(x))|\leq \|A^{-1}\||Ah-f(x+h)+f(x)|.

Оскільки $k\to 0$ , то $h\to 0$ і ${\frac {|h|}{|k|}}$ є обмеженим. Отже, $g$ є диференційовною функцією за змінною $y$ , причому $g'(y)=f'(g(y))^{-1}$ . До того ж, $g'$ це теж саме, що і композиція $\iota \circ f'\circ g$ , де $\iota \colon T\mapsto T^{-1}$ . Таким чином, функція $g'$ — неперервна.

Тепер залишається довести лему. По перше, відображення $f$ є ін'єктивним на $B(0,r)$ так як, якщо функція $f(x)=f(y)$ , то тоді $g(y)-g(x)=x-y$ , і, таким чином,

|g(y)-g(x)|=|y-x|

,

що є протиріччям, за винятком, якщо $y=x$ . (Ця частина не вимагає умови $g(0)=0$ .) Далі покажемо, що

f(B(0,r))\supset B(0,(1-c)r)

.

Ідея полягає в тому, щоб помітити, що для заданої точки $y\in B(0,(1-c)r)$ , це еквівалентно знаходженню нерухомої точку відображення

F:{\overline {B}}(0,r')\to {\overline {B}}(0,r'),\,x\mapsto y-g(x),

де $0<r'<r$ таке, що $|y|\leq (1-c)r'$ , та риска означає замкнену кулю. Для знаходження нерухомої точки використаємо теорему про стискаюче відображення і прямо перевіряємо, що $F$ є добре визначеним строго-стискаючим відображення. Зрештою маємо, що $f\left(B(0,r)\right)\subset B(0,(1+c)r)$ , оскільки

|f(x)|=|x+g(x)-g(0)|\leq (1+c)|x|.

Як вже зрозуміло, дане доведення суттєво не відрізняється від попереднього, оскільки теорема про стискаюче відображення доводиться методом послідовних наближень.

Застосування

Теорема про неявну функцію

Теорему про обернену функцію можна використовувати при розв'язанні систем рівнянь

{\begin{aligned}&f_{1}(x)=y_{1},\\&\quad \vdots \\&f_{n}(x)=y_{n},\end{aligned}}

тобто, $y_{1},\dots ,y_{n}$ виражені як функцій від $x=(x_{1},\dots ,x_{n})$ , за умови, що матриця Якобі є невиродженою. Теорема про неявну функцію дає можливість розв'язати більш загальну систему рівнянь

{\begin{aligned}&f_{1}(x,y)=0,\\&\quad \vdots \\&f_{n}(x,y)=0\end{aligned}}

для $y$ у термінах змінних $x$ . Хоча ця теорема є більш загальною, але фактично є наслідком теореми про обернену функцію. Насамперед, точне твердження теореми про неявну функцію виглядає наступним чином:^[9]

Нехай задано відображення $f\colon \mathbb {R} ^{n}\times \mathbb {R} ^{m}\to \mathbb {R} ^{m}$ . Якщо $f(a,b)=0$ , то функція $f$ є неперервно диференційовною в околі точки $(a,b)$ і похідна $y\mapsto f(a,y)$ в точці $b$ є оборотною, то тоді існує диференційовне відображення $g\colon U\to V$ для деяких околів $U$ , $V$ точок $a$ , $b$ так, що $f(x,g(x))=0$ . Більш того, якщо $f(x,y)=0$ , $x\in U$ , $y\in V$ , то $y=g(x)$ ; тобто $g(x)$ є єдиним розв'язком.

Щоб це побачити, розглянемо відображення $F(x,y)=(x,f(x,y))$ . За теоремою про обернену функцію, відображення $F\colon U\times V\to W$ має обернене $G$ для деяких околів $U$ , $V$ , $W$ . Тоді отримуємо, що

(x,y)=F(G_{1}(x,y),G_{2}(x,y))=(G_{1}(x,y),f(G_{1}(x,y),G_{2}(x,y)),

і з цього випливає, що $x=G_{1}(x,y)$ і $y=f(x,G_{2}(x,y))$ . Таким чином, функція $g(x)=G_{2}(x,0)$ задовольняє необхідну властивість.

Надання структури многовиду

У диференціальній геометрії теорему про обернену функцію використовують щоб показати, що прообраз регулярного значення при гладкому відображенні є многовидом.^[10] Дійсно, нехай відображення $f\colon U\to \mathbb {R} ^{r}$ є гладким відображенням з відкритої підмножини простору $\mathbb {R} ^{r}$ (оскільки результат локальний, то не втрачається загальність при розгляді такого відображення). Зафіксуємо точку $a$ в $f^{-1}(b)$ і тоді, переставляючи координати в $\mathbb {R} ^{n}$ , можна вважати, що матриця

\left[{\dfrac {\partial f_{i}}{\partial x_{j}}}(a)\right]_{1\leq i,j\leq r}

має ранг

r

.

Тоді відображення

F\colon \ U\to \mathbb {R} ^{r}\times \mathbb {R} ^{n-r}=\mathbb {R} ^{n},\quad x\mapsto (f(x),x_{r+1},\dots ,x_{n})

таке, що $F'(a)$ має ранг $n$ . Отже, за теоремою про обернену функцію знайдемо гладку обернену функцію $G$ для відображення $F$ визначену в околі $V\times W$ точки $(b,a_{r+1},\dots ,a_{n})$ . Тоді маємо

x=(F\circ G)(x)=(f(G(x)),G_{r+1}(x),\dots ,G_{n}(x)),

і отже,

(f\circ G)(x_{1},\dots ,x_{n})=(x_{1},\dots ,x_{r}).

Тобто після зміни координат за допомогою $G$ , функція $f$ є координатною проєкцією (цей факт відомий як теорема про субмерсію). Більше того, оскільки відображення $G\colon V\times W\to U'=G(V\times W)$ є бієктивним, то відображення

g=G(b,\cdot )\colon \ W\to f^{-1}(b)\cap U',\quad (x_{r+1},\dots ,x_{n})\mapsto G(b,x_{r+1},\dots ,x_{n})

є бієктивним із гладким оберненим. Інакше кажучи, відображення $g$ дає локальну параметризацію для $f^{-1}(b)$ в околі точки $a$ . Отже, $f^{-1}(b)$ є многовидом.

(Зауважимо, що доведення дуже схоже на доведення теореми про неявну функцію, і фактично замість нього також можна використовувати теорему про неявну функцію.)

У загальному випадку теорема показує, що для заданого гладкого відображення $f\colon P\to E$ , якщо $f$ є трансверсальним до $i\colon M\hookrightarrow E$ підмноговидом, то тоді прообраз $f^{-1}(M)\hookrightarrow P$ є підмноговидом.^[11]

Глобальна версія

Теорема про обернену функцію є локальним результатом; це стосується будь-якої точки. Таким чином, теорема апріорі показує лише те, що функція $f$ є локально бієктивною (або локально дифеоморфною деякого класу). Наступну топологічну лему можна використати для розширення від локальної ін'єктивності до, в певній мірі, глобальної ін'єктивності.

Лема.^[12]^[13] Якщо $A$ є замкненою підмножиною (що задовольняє другій аксіомі зліченності) топологічного многовиду $X$ (або, більш загально, топологічний простір, що допускає вичерпування компактними підмножинами^[en]) і відображення $f\colon X\to Z$ , де $Z$ — деякий топологічний простір, є локальним гомеоморфізмом, що є ін'єктивним на $A$ , то тоді відображення $f$ є ін'єктивним в деякому околі підмножини $A$ .

Доведення.^[14] Спочатку припустимо, що многовид $X$ є компактним. Якщо висновок теореми є хибним, то можна знайти дві послідовності $x_{i}\neq y_{i}$ такі, що $f(x_{i})=f(y_{i})$ і $x_{i},y_{i}$ відповідно збігаються в до деяких точках $x,y$ у $A$ . Оскільки функція $f$ є ін'єктивною на $A$ , то $x=y$ . Тепер, якщо значення $i$ є досить великим, то $x_{i}$ , $y_{i}$ будуть знаходитись в околі точок $x=y$ , де функція $f$ є ін'єктивною. Таким чином, $x_{i}=y_{i}$ , що є протиріччям.

У загальному випадку, розглянемо множину

E={\big \{}(x,y)\in X^{2}\mid x\neq y,\,f(x)=f(y){\big \}}.

Вона не перетинається з $S\times S$ для будь-якої підмножини $S\subset X$ , де функція $f$ є ін'єктивною. Нехай, $X_{1}\subset X_{2}\subset \cdots$ буде зростаючою послідовністю компактних підмножин із об'єднанням $X$ і $X_{i}\subset X_{i+1}$ . Тоді, за першою частиною доведення, для кожного значення $i$ можна знайти окіл $U_{i}$ множини $A\cap X_{i}$ такий, що $U_{i}^{2}\subset X^{2}-E$ . Тож $U=\bigcup _{i}U_{i}$ має необхідну властивість. (Див. також^[15] щодо альтернативного підходу).

З леми випливає наступна (свого роду) глобальна версія теореми про обернену функцію:

Теорема про обернену функцію.^[16] Нехай, $f\colon U\to V$ буде відображенням між відкритими підмножинами просторів $\mathbb {R} ^{n}$ й $\mathbb {R} ^{m}$ , або у загальному випадку многовидів. Припустимо, що відображення $f$ неперервно диференційовне (або належить класу $C^{k}$ ). Якщо відображення $f$ ін'єктивне на замкненій підмножині $A\subset U$ і, якщо матриця Якобі для функції $f$ є невиродженою в будь-якій точці підмножини $A$ , то тоді відображення $f$ ін'єктивне в околі $A'$ підмножини $A$ і обернене відображення $f^{-1}\colon f(A')\to A'$ є неперервно діференційованим (або належить класу $C^{k}$ ).

Зауважимо, що якщо підмножина $A$ є точкою, то отримуємо звичайну теорему про обернену функцію.

Теорема про обернену голоморфну функцію

Нижче наведено версію теореми про обернену функцію для голоморфних відображень.

Теорема.^[17]^[18] Нехай $U,V\in \mathbb {C} ^{n}$ — відкриті підмножини такі, що $0\in U$ і $f\colon U\to V$ — голоморфне відображення, матриця Якобі якого у змінних $z_{i}$ , ${\overline {z}}_{i}$ є невиродженою (визначник не дорівнює $0$ ) в точці $0$ . Тоді відображення $f$ є ін'єктивним в околі $W$ точки $0$ і обернене відображення $f^{-1}\colon f(W)\to W$ є голоморфним.

Теорема випливає зі звичайної теореми про обернену функцію. Дійсно, нехай $J_{\mathbb {R} }(f)$ — матриця Якобі відображення $f$ у змінних $x_{i}$ , $y_{i}$ , $J(f)$ — матриця Якобі у змінних $z_{i}$ , ${\overline {z}}_{i}$ . Тоді $\det J_{\mathbb {R} }(f)=|\det J(f)|^{2}$ і за припущенням не дорівнює $0$ . Отже, за звичайною теоремою про обернену функцію, відображення $f$ є ін'єктивним в околі точки $0$ і має неперервно диференційовне обернене відображення. За правилом диференціювання складної функції (де $w=f(z)$ ) маємо

{\frac {\partial }{\partial {\overline {z}}_{j}}}{\big (}f_{j}^{-1}\circ f{\big )}(z)=\sum _{k}{\frac {\partial f_{j}^{-1}}{\partial w_{k}}}(w){\frac {\partial f_{k}}{\partial {\overline {z}}_{j}}}(z)+\sum _{k}{\frac {\partial f_{j}^{-1}}{\partial {\overline {w}}_{k}}}(w){\frac {\partial {\overline {f}}_{k}}{\partial {\overline {z}}_{j}}}(z),

де ліва частина і перший доданок праворуч зануляються, оскільки відображення $f_{j}^{-1}\circ f$ та $f_{k}$ є голоморфними.

Таким чином, ${\frac {\partial f_{j}^{-1}}{\partial {\overline {w}}_{k}}}(w)=0$ для кожного $k$ .

Аналогічно формулюється теорема про неявну функцію для голоморфних функцій.^[19]

Як зазначено раніше, може трапитися, що ін'єктивна гладка функція має обернену, яка не є гладкою (наприклад, функція $f(x)=x^{3}$ дійсної змінної $x$ ). Цього не буде у випадку голоморфних функцій, оскільки

Твердження.^[19] Якщо $f\colon U\to V$ є ін'єктивним голоморфним відображенням між відкритими множинами в $\mathbb {C} ^{n}$ , то тоді обернене відображення $f^{-1}\colon f(U)\to U$ є голоморфним.

Формулювання для многовидів

Теорему про обернену функцію можна переформулювати у термінах диференційовних відображень між диференційовними многовидами. У цьому контексті теорема стверджує, що для диференційовного відображення $F\colon M\to N$ (класу $C^{1}$ ), якщо диференціал відображення $F$ ,

{\rm {d}}F_{p}\colon \ T_{p}M\to T_{F(p)}N,

є лінійним ізоморфізмом в точці $p$ многовиду $M$ , то тоді існує відкритий окіл $U$ точки $p$ такий, що

F|_{U}\colon \ U\to F(U)

є дифеоморфізмом . Слід зауважити, що звідси випливає, що компоненти зв'язності многовидів $M$ та $N$ , які місять точки $p$ та $F(p)$ , мають однакову розмірність — це вже прямо випливає з припущення, що ${\rm {d}}F_{p}$ є ізоморфізмом. Якщо похідна відображення $F$ є ізоморфізмом в усіх точках $p$ многовиду $M$ , то відображення $F$ є локальним дифеоморфізмом^[en].

Узагальнення

Банахові простори

Теорему про обернену функцію можна узагальнити на випадок диференційовних відображень між банаховими просторами $X$ and $Y$ .^[20] Нехай $U$ — відкритий окіл початку координат в просторі $X$ , $F\colon U\to Y$ — неперервно диференційовна функція, причому похідна Фреше ${\rm {d}}F_{0}\colon X\to Y$ від функції $F$ в точці $0$ — обмежений лінійний ізоморфізм з простору $X$ у простір $Y$ . Тоді існує відкритий окіл $V$ точки $F(0)$ в просторі $Y$ і неперервно диференційовне відображення $G\colon V\to X$ таке, що $F(G(y))=y$ для всіх $y$ з околу $V$ . Більш того, $G(y)$ — єдиний достатньо малий розв'язок $x$ рівняння $F(x)=y$ .

Також існує теорема про обернену функцію для банахових многовидів.^[21]

Теорема про сталий ранг

Теорему про обернену функцію (і теорему про неявну функцію) можна розглядати як частинний випадок теореми про сталий ранг, яка стверджує, що гладке відображення зі сталим рангом^[en] в околі точки можна звести до певної нормальної форми в околі цієї точки.^[22] Зокрема, якщо відображення $F\colon M\to N$ має сталий ранг в околі точки $p\in M$ , то тоді існують відкриті околи $U$ для точки $p$ і $V$ для точки $F(p)$ , а також існують дифеоморфізми $u\colon T_{p}M\to U$ та $v\colon T_{F(p)}N\to V$ такі, що $F(U)\subseteq V$ і похідна ${\rm {d}}F_{p}\colon T_{p}M\to T_{F(p)}N$ дорівнює $v^{-1}\circ F\circ u$ . Тобто, відображення $F$ “виглядає як” його похідна в околі точки $p$ . Множина точок $p\in M$ таких, що ранг є сталим в околі точки $p$ , є відкритою щільною підмножиною простору $M$ , що є наслідком напівнеперервності функції рангу. Таким чином, теорема про сталий ранг можна використовувати для довільної точки області визначення.

Коли похідна функції $F$ є ін'єктивною (відповідно, сюр'єктивною) в точці $p$ , вона є ін'єктивною (відповідно, сюр'єктивною) в околі точки $p$ , а тому ранг відображення $F$ є сталим в цьому околі, і можна використовувати теорему про сталий ранг.

Поліномні функції

Якби це була вірно, то гіпотеза Якобі^[en] була б варіантом теореми про обернену функцію для поліномів. Відповідно до гіпотези, якщо векторнозначна поліномна функція має визначник Якобі, який є оборотним поліномом (тобто ненульовою константою), то тоді функція має обернену функцію, яка є також поліномною. Невідомо, чи це вірно, навіть у випадку двох змінних. Це є великою відкритою проблемою теорії поліномів.

Функції вибору

Якщо відображення $f\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}$ , де $m\leq n$ , є неперервно диференційовним $k$ разів і якобіан $A=\nabla f({\overline {x}})$ в точці ${\overline {x}}$ має ранг $m$ , то функції обернена до $f$ може бути не єдиною. Проте, існує локальна функція вибору $s$ така, що $f(s(y))=y$ для усіх точок $y$ в околі точки ${\overline {y}}=f({\overline {x}})$ , $s({\overline {y}})={\overline {x}}$ , то тоді функція $s$ є неперервно диференційовною $k$ разів в цьому околі, і

\nabla s({\overline {y}})=A^{\rm {T}}{\big (}AA^{\rm {T}}{\big )}^{-1}\nabla s({\overline {y}})

є псевдоінверсією Мура-Пенроуза^[en] якобіана $A$ .^[23]

Див. також

Примітки

↑ ^а ^б ^в Theorem 1.1.7. in Hörmander, Lars (2015). The Analysis of Linear Partial Differential Operators I: Distribution Theory and Fourier Analysis. Classics in Mathematics (вид. 2nd). Springer. ISBN 9783642614972.
↑ McOwen, Robert C. (1996). Calculus of Maps between Banach Spaces. Partial Differential Equations: Methods and Applications. Upper Saddle River, NJ: Prentice Hall. с. 218—224. ISBN 0-13-121880-8.
↑ Tao, Terence (12 вересня 2011). The inverse function theorem for everywhere differentiable maps. Процитовано 26 липня 2019.
↑ The inverse function theorem. Topological Geometry. Cambridge University Press. 5 лютого 1981. с. 375—398.
↑ Spivak, Gayatri (2005-01). Thinking about Edward Said: Pages from a Memoir. Critical Inquiry. Т. 31, № 2. с. 519—525. doi:10.1086/430981. ISSN 0093-1896. Процитовано 24 червня 2022.
↑ Tucker, Warwick; Hubbard, John H.; Hubbard, Barbara Burke (2003-10). Vector Calculus, Linear Algebra, and Differential Forms: A Unified Approach. The American Mathematical Monthly. Т. 110, № 8. с. 754. doi:10.2307/3647874. ISSN 0002-9890. Процитовано 24 червня 2022.
↑ Cartan, Henri (1971). Calcul Differentiel (фр.). Hermann. с. 55–61. ISBN 9780395120330.
↑ Theorem 17.7.2 in Tao, Terence (2014). Analysis. II. Texts and Readings in Mathematics. Т. 38 (вид. Third edition of 2006 original). New Delhi: Hindustan Book Agency. ISBN 978-93-80250-65-6. MR 3310023. Zbl 1300.26003.
↑ Spivak, 1965, Theorem 2-12.
↑ Spivak, 1965, Theorem 5-1. and Theorem 2-13.
↑ https://sites.math.northwestern.edu/~jnkf/classes/mflds/4transversality.pdf
↑ One of Spivak's books (Editorial note: give the exact location).
↑ Hirsch, Ch. 2, § 1., Exercise 7. NB: This one is for a $C^{1}$ -immersion.
↑ Lemma 13.3.3. of https://www.utsc.utoronto.ca/people/kupers/wp-content/uploads/sites/50/2020/12/difffop-2020.pdf
↑ Dan Ramras (https://mathoverflow.net/users/4042/dan-ramras), On a proof of the existence of tubular neighborhoods., URL (version: 2017-04-13): https://mathoverflow.net/q/58124
↑ Ch. I., § 3, Exercise 10. and § 8, Exercise 14. in V. Guillemin, A. Pollack. "Differential Topology". Prentice-Hall Inc., 1974. ISBN 0-13-212605-2.
↑ Griffiths та Harris, p. 18.
↑ Fritzsche, K.; Grauert, H. (2002). From Holomorphic Functions to Complex Manifolds. Springer. с. 33—36. ISBN 9780387953953.
↑ ^а ^б Griffiths та Harris, p. 19.
↑ Luenberger, David G. (1969). Optimization by Vector Space Methods. New York: John Wiley & Sons. с. 240—242. ISBN 0-471-55359-X.
↑ Lang, Serge (1985). Differential Manifolds. New York: Springer. с. 13–19. ISBN 0-387-96113-5.
↑ Boothby, William M. (1986). An Introduction to Differentiable Manifolds and Riemannian Geometry (вид. Second). Orlando: Academic Press. с. 46–50. ISBN 0-12-116052-1.
↑ Dontchev, Asen L.; Rockafellar, R. Tyrrell (2014). Implicit Functions and Solution Mappings: A View from Variational Analysis (вид. Second). New York: Springer-Verlag. с. 54. ISBN 978-1-4939-1036-6.

Література

Григорій Михайлович Фіхтенгольц. Курс диференціального та інтегрального числення. — 2024. — 2403 с.(укр.)
Allendoerfer, Carl B. (1974). Theorems about Differentiable Functions. Calculus of Several Variables and Differentiable Manifolds. New York: Macmillan. с. 54–88. ISBN 0-02-301840-2.
Baxandall, Peter; Liebeck, Hans (1986). The Inverse Function Theorem. Vector Calculus. New York: Oxford University Press. с. 214–225. ISBN 0-19-859652-9.
Nijenhuis, Albert (1974). Strong derivatives and inverse mappings. Amer. Math. Monthly. 81 (9): 969—980. doi:10.2307/2319298. JSTOR 2319298.
Griffiths, Phillip; Harris, Joseph (1978), Principles of Algebraic Geometry, John Wiley & Sons, ISBN 978-0-471-05059-9.
Protter, Murray H.; Morrey, Charles B., Jr. (1985). Transformations and Jacobians. Intermediate Calculus (вид. Second). New York: Springer. с. 412–420. ISBN 0-387-96058-9.
Renardy, Michael; Rogers, Robert C. (2004). An Introduction to Partial Differential Equations. Texts in Applied Mathematics 13 (вид. Second). New York: Springer-Verlag. с. 337–338. ISBN 0-387-00444-0.
Rudin, Walter (1976). Principles of mathematical analysis. International Series in Pure and Applied Mathematics (вид. Third). New York: McGraw-Hill Book. с. 221–223. ISBN 9780070856134.
Spivak, Michael (1965). Calculus on Manifolds: A Modern Approach to Classical Theorems of Advanced Calculus. San Francisco: Benjamin Cummings. ISBN 0-8053-9021-9.

[Hörmander-1] а ^б ^в Theorem 1.1.7. in Hörmander, Lars (2015). The Analysis of Linear Partial Differential Operators I: Distribution Theory and Fourier Analysis. Classics in Mathematics (вид. 2nd). Springer. ISBN 9783642614972.

[2] McOwen, Robert C. (1996). Calculus of Maps between Banach Spaces. Partial Differential Equations: Methods and Applications. Upper Saddle River, NJ: Prentice Hall. с. 218—224. ISBN 0-13-121880-8.

[3] Tao, Terence (12 вересня 2011). The inverse function theorem for everywhere differentiable maps. Процитовано 26 липня 2019.

[4] The inverse function theorem. Topological Geometry. Cambridge University Press. 5 лютого 1981. с. 375—398.

[5] Spivak, Gayatri (2005-01). Thinking about Edward Said: Pages from a Memoir. Critical Inquiry. Т. 31, № 2. с. 519—525. doi:10.1086/430981. ISSN 0093-1896. Процитовано 24 червня 2022.

[6] Tucker, Warwick; Hubbard, John H.; Hubbard, Barbara Burke (2003-10). Vector Calculus, Linear Algebra, and Differential Forms: A Unified Approach. The American Mathematical Monthly. Т. 110, № 8. с. 754. doi:10.2307/3647874. ISSN 0002-9890. Процитовано 24 червня 2022.

[7] Cartan, Henri (1971). Calcul Differentiel (фр.). Hermann. с. 55–61. ISBN 9780395120330.

[8] Theorem 17.7.2 in Tao, Terence (2014). Analysis. II. Texts and Readings in Mathematics. Т. 38 (вид. Third edition of 2006 original). New Delhi: Hindustan Book Agency. ISBN 978-93-80250-65-6. MR 3310023. Zbl 1300.26003.

[9] Spivak, 1965, Theorem 2-12.

[10] Spivak, 1965, Theorem 5-1. and Theorem 2-13.

[11] ttps://sites.math.northwestern.edu/~jnkf/classes/mflds/4transversality.pdf

[12] One of Spivak's books (Editorial note: give the exact location).

[13] Hirsch, Ch. 2, § 1., Exercise 7. NB: This one is for a $C^{1}$ -immersion.

[14] Lemma 13.3.3. of https://www.utsc.utoronto.ca/people/kupers/wp-content/uploads/sites/50/2020/12/difffop-2020.pdf

[15] Dan Ramras (https://mathoverflow.net/users/4042/dan-ramras), On a proof of the existence of tubular neighborhoods., URL (version: 2017-04-13): https://mathoverflow.net/q/58124

[16] Ch. I., § 3, Exercise 10. and § 8, Exercise 14. in V. Guillemin, A. Pollack. "Differential Topology". Prentice-Hall Inc., 1974. ISBN 0-13-212605-2.

[17] Griffiths та Harris, p. 18.

[18] Fritzsche, K.; Grauert, H. (2002). From Holomorphic Functions to Complex Manifolds. Springer. с. 33—36. ISBN 9780387953953.

[holomorphic_implicit-19] а ^б Griffiths та Harris, p. 19.

[20] Luenberger, David G. (1969). Optimization by Vector Space Methods. New York: John Wiley & Sons. с. 240—242. ISBN 0-471-55359-X.

[21] Lang, Serge (1985). Differential Manifolds. New York: Springer. с. 13–19. ISBN 0-387-96113-5.

[boothby-22] Boothby, William M. (1986). An Introduction to Differentiable Manifolds and Riemannian Geometry (вид. Second). Orlando: Academic Press. с. 46–50. ISBN 0-12-116052-1.

[23] Dontchev, Asen L.; Rockafellar, R. Tyrrell (2014). Implicit Functions and Solution Mappings: A View from Variational Analysis (вид. Second). New York: Springer-Verlag. с. 54. ISBN 978-1-4939-1036-6.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]