Cálculo
Tomemos un momento para recordar algunos de los contenidos de cálculo.
Sea $U$ un abierto de $\mathbb{R}^n$.
Esta transformación lineal provee la información de como la función transforma direcciones en el siguiente sentido:
Sea $\alpha: I \rightarrow \mathbb{R}^n$ una trayectoria diferenciable con $\alpha(0) = p$. La trayectoria tiene un dirección infinitesimal en $p$ dada por el vector $v = \alpha’(0)$. Al transformar el espacio con $f$, la trayectoria se convierte en una nueva curva $\beta = f \circ \alpha: I \rightarrow \mathbb{R}^m$. Esta nueva curva tiene una dirección infinitesimal en $f(p)$ dada por $\beta’(0)$.
De este modo es más claro el enunciado del teorema de la regla de la cadena, puesto que una curva $\alpha$ es deformada por una composición $f \circ g$ en pasos, cargando la dirección infinitesimal de $\alpha$ primero a través de la deformación de $g$ y después la de $f$.
La definición de derivada de una función multidimensional no deja en claro el método para calcularla. Sin embargo, en el caso en que la función $f$ tenga derivadas parciales y sus derivadas parciales sean continuas, es decir que la función sea tipo $C^1$, entonces es fácil calcular la diferencial de $f$ en $p$. Simplemente está dada por
La interepretación que hemos dado a la diferencial, como la representación del modo en que la función $f$ transforma las direcciones infinitesimales, ayuda a visualizar geométricamente ciertas situaciones. Por ejemplo, si $|Df_p(v)| \geq | v|$ esto indica que la función estira el espacio en la dirección de $v$, o bien que si $\alpha$ es una curva con dirección infinitesimal $v$ en $p$, entonces $f$ estira a $\alpha$ al menos cerca de $p$. También parece sugerir que si $ Df_p(v) = 0$, entonces $f$ colapsa a un solo punto curvas que tienen a $v$ como dirección infinitesimal en $p$. Aunque en cierto modo el enunciado anterior es correcto a escalas infinitesimales, no resulta cierto como lo demuestra cualquier curva no constante con tangente cero en algún punto.
Sin embargo, ofrece un poco de justificación e intuición para el siguiente importante teorema
La demostración se puede ver en \cite{spivak_calculus, rudin}.
Otra manera de enunciar el teorema de la función inversa es que si la diferencial es invertible en $p$ entonces $f$ es invertible cerca a $p$. Esto es, la diferencial, como aproximación lineal, es tan buena cerca a $p$ que le ``hereda’’ la propiedad de ser invertible.
En términos prácticos, la condición de ser un isomorfismo se puede traducir en cualquiera de las siguientes condiciones:
- $Df_p$ es inyectiva.
- El núcleo de $Df_p$ es trivial.
- $Det(Df_p) \neq 0$.
- Los gradientes $\nabla f_1(p), \cdots, \nabla f_n(p)$ son linealmente independientes.
Coordenadas locales y representaciones locales de funciones
Desde el punto de vista de la topología diferencial, cualesquiera dos sistemas coordenados son equivalentes, y para analizar el comportamiento de una función se permite elegir arbitrariamente un sistema coordenado.
Esta idea la podemos aplicar a las funciones $f: \mathbb{R}^n \rightarrow \mathbb{R}^m$, puesto que $\mathbb{R}^n$ y $\mathbb{R}^m$ son variedades. Y dado que toda variedad es localmente equivalente a $\mathbb{R}^n$ basta con estudiar este caso. Así la pregunta se convierte en la siguiente: ¿Qué coordenadas son útiles para analizar una función diferenciable? ¿Cuantos comportamientos distintos puede tener una función diferenciable si se permiten cambios de coordenadas?
El teorema de la función inversa ofrece la respuesta en el caso en el cual la diferencial es invertible.
El teorema anterior nos dice que todo par de funciones con diferenciales invertibles son localmente equivalente (al menos bajo cambio de coordenadas). La situación cuando la diferencial no es invertible es mucho más interesante y complicada. Los puntos donde la función tiene diferencial no invertible, y de modo más general no tiene rango máximo, son llamados singularidades o puntos singulares. El estudio y la clasificación de dichas singularidades forman una rama amplia y fértil a la cual no entraremos en detalle. Para el interesado le sugerimos el libro \cite{stable_mappings}.
Lo que hemos probado hasta ahora es que si $p$ es un punto regular de una función $f: \mathbb{R}^n \rightarrow \mathbb{R}^m$ con $n = m$ entonces tiene una representación sencilla. Pero ¿qué ocurre en los otros casos, cuando las dimensiones son distintas?
Podemos inspirarnos un poco en el teorema de la función inversa y suponer que la diferencial $Df_p$ es un buen sustituto de la función $f$ cerca a $p$. Dado que $Df_p: \mathbb{R}^n \rightarrow \mathbb{R}^m$ es una transformación lineal de rango máximo esto quiere decir que
-
Si $n > m$ entonces $Df_p$ es suprayectiva y existen bases $\left\lbrace e_1,\cdots, e_n \right\rbrace$ y $\left\lbrace l_1, \cdots, l_m \right\rbrace$ de $\mathbb{R}^n$ y $\mathbb{R}^m$, respectivamente, tales que
-
Si $n < m$ entonces $Df_p$ es inyectiva y existen bases $\left\lbrace e_1, \cdots, e_n \right\rbrace$ y $\left\lbrace l_1, \cdots, l_m \right\rbrace$ de $\mathbb{R}^n$ y $\mathbb{R}^m$, tales que
Un cambio de bases es también un cambio de coordenadas de tipo lineal.
Y para el caso de $n > m$: