Estas notas se basan en las transparencias de A. M. Robles Pérez.
Consideremos el sistema de ecuaciones $Ax=b$ sobre un cuerpo $K.$ Si $x$ e $y$ son soluciones, entonces $Ax=Ay=b,$ y por tanto $A(x-y)=0,$ esto es, $x-y$ está en el núcleo de la aplicación lineal asociada a la matriz $A,$ que es un espacio vectorial. De hecho, si $x_0$ es una solución del sistema ($Ax_0=b$) y $x$ es cualquier otra solución, entonces $x=x_0+(x-x_0).$ Esto es, $x$ es el trasladado de $x_0$ mediante un vector del (sub)espacio vectorial con ecuaciones $Ax=0.$ Así, el conjunto de soluciones $S$ de $Ax=b$ es de la forma
\[S=x_0+W,\]con $W$ el conjunto de soluciones de $Ax=0,$ y para cualesquiera dos soluciones $x,y\in S,$ tenemos que $y-x\in W.$
Sea $V$ un espacio vectorial real (cuyos elementos llamaremos vectores o direcciones).
Sea $\mathfrak{A}$ un conjunto no vacío cuyos elementos denominaremos puntos.
Decimos que $\mathfrak{A}$ es un espacio afín sobre $V$ si existe una aplicación
\[\phi: \mathfrak{A}\times\mathfrak{A} \to V\]tal que a cada par ordenado de puntos $(P,Q) \in \mathfrak{A}\times\mathfrak{A}$ le hace corresponder un vector $\phi(P,Q) \in V$ (denotado por $\overrightarrow{PQ}$) de forma que se satisfacen las siguientes propiedades.
El espacio afín se denotará por $(\mathfrak{A},V,\phi),$ aunque habitualmente se omitirá la referencia a la aplicación $\phi$ e, incluso, a $V.$
Sea $(\mathfrak{A},V,\phi)$ un espacio afín.
Supongamos que $\mathfrak{A}=\mathbb{R}^{n}$ y que $V=\mathbb{R}^{n}.$ Si $P,Q\in\mathfrak{A}$ están dados por $P=(p_{1},\ldots,p_{n})$ y $Q=(q_{1},\ldots,q_{n}),$ definimos la aplicación $\phi$ por
\[\phi(P,Q)= (q_{1}-p_{1},\ldots,q_{n}-p_{n}).\]Es fácil comprobar que $(\mathfrak{A},V,\phi)$ es un espacio afín (el llamado espacio afín usual) y que se cumplen las propiedades de la transparencia anterior.
Se define la dimensión del espacio afín $\mathfrak{A}$ como la dimensión del espacio vectorial $V.$
La dimensión del espacio afín del ejemplo anterior es $n,$ ya que su espacio vectorial subyacente, $\mathbb{R}^{n},$ es $n$ dimensional.
Sea $\mathfrak{A}$ un espacio afín sobre $V$ de dimensión $n.$ Un sistema de referencia afín en $\mathfrak{A}$ es un conjunto de la forma $\mathfrak{R}=\lbrace O;B\rbrace,$ donde $O\in\mathfrak{A}$ (denominado origen del sistema de referencia) y $B=\lbrace \mathbf{e} _{1},\mathbf{e} _{2},\ldots,\mathbf{e} _{n}\rbrace$ es una base de $V.$
Sea $P\in\mathfrak{A}.$ Como $\overrightarrow{OP}\in V,$ entonces existen escalares $x_{1},x_{2},\ldots,x_{n}\in\mathbb{R}$ tales que
\[\overrightarrow{OP}=x_{1}\mathbf{e}_{1}+x_{2}\mathbf{e}_{2}+\cdots+x_{n}\mathbf{e}_{n}.\]Diremos que $(x_{1},x_{2},\ldots,x_{n})$ son las coordenadas de $P$ respecto de $\mathfrak{R}$ y las denotaremos por $P=(x_{1},x_{2},\ldots,x_{n}) _{\mathfrak{R}}.$
En el espacio afín usual tridimensional, consideramos el sistema de referencia determinado por
el origen $O=(1,1,-1),$
la base $B=\lbrace(1,1,1),(1,1,0),(1,0,0)\rbrace.$
Calculemos las coordenadas del punto $P=(5,4,3).$
Como $\overrightarrow{OP}=\phi(O,P) = (5,4,3) - (1,1,-1) = (4,3,4),$ tenemos que hallar las coordenadas de este vector respecto de $B,$ es decir, los valores $x _{1}, x _{2}, x _{3}$ tales que
\[(4,3,4) = x _{1}(1,1,1) + x _{2}(1,1,0) + x _{3}(1,0,0).\]Resolviendo el sistema, obtenemos que $P=(4,-1,1) _\mathfrak{R}$
Sean $\mathfrak{A}$ un espacio afín sobre el espacio vectorial $V,$ $P\in\mathfrak{A}$ y $W$ un subespacio vectorial de $V.$
Se denomina variedad afín de $\mathfrak{A}$ asociada a $W$ con base en el punto $P$ al conjunto
\[\mathfrak{L}=\left\lbrace X\in\mathfrak{A} : \overrightarrow{PX}\in W\right\rbrace,\]que se denota por $\mathfrak{L}=P+W.$
En el espacio afín tridimensional usual, calculemos la variedad afín $\mathfrak{L}$ que pasa por el punto $P=(1,-1,1)$ con subespacio asociado
\[W=\left\lbrace (w_{1},w_{2},w_{3})\in\mathbb{R}^{3}\mid w_{3}=w_{1}+w_{2} \right\rbrace.\]Recordemos que la aplicación $\phi$ asociada al espacio afín tridimensional usual está dada por
\[\phi((p_1,p_2,p_3),(q_1,q_2,q_3))=(q_{1}-p_{1},q_{2}-p_{2},q_{3}-p_{3}).\]Entonces tenemos que
\[\begin{aligned} \mathfrak{L} & = \left\lbrace X\in\mathfrak{A} \mid \overrightarrow{PX}\in W \right\rbrace \\ & = \left\lbrace(x_{1},x_{2},x_{3}) \in\mathbb{R}^{3} \mid (x_{1},x_{2},x_{3})-(1,-1,1) \in W \right\rbrace \\ & = \left\lbrace(x_{1},x_{2},x_{3}) \in\mathbb{R}^{3} \mid (x_{1}-1,x_{2}+1,x_{3}-1) \in W \right\rbrace \\ & = \left\lbrace(x_{1},x_{2},x_{3}) \in\mathbb{R}^{3} \mid x_{3}-1=(x_{1}-1)+(x_{2}+1) \right\rbrace \\ & = \left\lbrace(x_{1},x_{2},x_{3}) \in\mathbb{R}^{3} \mid x_{3}-1=x_{1}+x_{2} \right\rbrace\\ & = \left\lbrace(x_{1},x_{2},x_{3}) \in\mathbb{R}^{3} \mid x_{1}+x_{2}-x_{3}=-1 \right\rbrace. \end{aligned}\]Sea la variedad afín $\mathfrak{L}=\left\lbrace X\in\mathfrak{A} : \overrightarrow{PX}\in W \right\rbrace.$ Si $Q\in\mathfrak{L},$ entonces se verifica que $\mathfrak{L}=\left\lbrace X\in\mathfrak{A} \mid \overrightarrow{QX}\in W\right\rbrace.$
En otras palabras, si $\mathfrak{L}=P+W$ y $Q\in\mathfrak{L},$ entonces $\mathfrak{L}=Q+W.$
Deducimos que la definición de variedad afín es independiente del punto base.
Se define la dimensión de la variedad afín $\mathfrak{L}=P+W$ como la dimensión de $W.$
En el ejemplo anterior, $\dim W=2,$ por lo que $\dim\mathfrak{L}=2.$ Por tanto, la variedad afín $\mathfrak{L}$ es un plano.
Si $\mathfrak{L}=P+W$ con $W=\lbrace\mathbf{0}\rbrace,$ entonces $\mathfrak{L}$ se reduce a un punto y $\dim\mathfrak{L}=0.$ Las variedades afines de dimensión $0$ son los puntos.
Si $\mathfrak{L}=P+W$ con $W=\mathcal{L}(\lbrace\mathbf{u}\rbrace),$ $\mathbf{u}\neq\mathbf{0},$ entonces $\dim\mathfrak{L}=1.$ Se trata de la recta que “pasa” por el punto $P$ con dirección $\mathbf{u}.$
Si $\mathfrak{L}=P+W,$ donde una base de $W$ es $B_{W}=\lbrace\mathbf{u},\mathbf{v}\rbrace,$ entonces $\dim\mathfrak{L}=2.$ Se trata de un plano que “pasa” por el punto $P$ con vectores directores $\mathbf{u}$ y $\mathbf{v}.$
Si $\mathfrak{L}=P+W$ con $\dim W=n-1$ y $\dim V=n,$ entonces $\dim\mathfrak{L}=n-1.$ Se trata de un hiperplano que “pasa” por el punto $P$ con dirección dada por el subespacio vectorial definido por la base de $W$ considerada.
Dado un espacio afín $\mathfrak{A}$ y $P_0,\dots,P_n$ puntos de $\mathfrak{A},$ la variedad generada por $P_0,\dots,P_n$ es la menor variedad afín que contiene a estos puntos, que es $P_0+W,$ donde $W$ es el espacio vectorial generado por $\overrightarrow {P_0P_1},\dots,\overrightarrow {P_0P_n}.$ Diremos que $P_0,\dots, P_n$ son afinmente independientes si los vectores $\overrightarrow {P_0P_1},\dots,\overrightarrow {P_0P_n}$ son linealmente independientes (esta definición no depende de la elección de $P_0$).
Si $\mathfrak{L}_1=P_1+W_1$ y $\mathfrak{L}_2=P_2+W_2$ son dos variedades afines tales que existe $P\in\mathfrak{L}_1\cap \mathfrak{L}_2,$ entonces
\[\mathfrak{L}_1\cap \mathfrak{L}_2= P+(W_1\cap W_2).\]Si $\mathfrak{L}_1$ y $\mathfrak{L}_2$ no se cortan, entonces su intersección es vacía.
La variedad suma de $\mathfrak{L}_1$ y $\mathfrak{L}_2$ se define como la menor variedad que contiene a ambas (o como la variedad que genera la unión de ambas). En este caso,
\[\mathfrak{L}_1+\mathfrak{L}_2=P_1+(\mathcal{L}(\overrightarrow {P_1P_2})+W_1+W_2).\]Es posible asociar ecuaciones paramétricas e implícitas a las variedades afines.
Sea $(\mathfrak{A},V,\phi )$ un espacio afín de dimensión $n.$
Sea $\mathfrak{L}=P+W$ la variedad afín que “pasa” por el punto $P\in\mathfrak{A}$ con subespacio director $W.$
Sea $\mathfrak{R}=\lbrace O;B\rbrace$ un sistema de referencia para $\mathfrak{A}$ con $B=\lbrace\mathbf{e} _{1},\dots,\mathbf{e} _{n}\rbrace.$
Supongamos que $\dim W=r,$ con $1\leq r < n,$ y que $\lbrace \mathbf{u} _{1},\dots,\mathbf{u} _{r} \rbrace$ es una base de $W.$
Si $X\in\mathfrak{L},$ entonces $\mathbf{w}=\overrightarrow{PX}\in W.$ Para dicho vector, existirán escalares $\lambda_{1},\lambda_{2},\dots,\lambda_{r}$ tales que
\[\mathbf{w}=\lambda_{1}\mathbf{u} _{1}+\lambda _{2}\mathbf{u} _{2}+\cdots+\lambda _{r}\mathbf{u} _{r}.\]Como $B$ es base de $V$ y $W$ es un subespacio de $V,$ cada vector $\mathbf{u} _{i}$ se puede expresar en la base $B,$ por lo que existen escalares $\omega _{ij}$ tales que
\[\begin{aligned} \mathbf{u}_{1} & = \omega_{11}\mathbf{e}_{1}+\cdots+\omega_{n1}\mathbf{e}_{n}, \\ & \vdots \\ \mathbf{u}_{r} & = \omega_{1r}\mathbf{e}_{1}+\cdots+\omega_{nr}\mathbf{e}_{n}. \end{aligned}\] \[\begin{aligned} \mathbf{w} & = \lambda_{1}(\omega_{11}\mathbf{e}_{1}+\cdots+\omega_{n1}\mathbf{e}_{n}) + \dots+ \lambda_{r}(\omega_{1r}\mathbf{e}_{1}+\cdots+\omega_{nr}\mathbf{e}_{n}) \\ & = (\omega_{11}\lambda_{1}+\cdots+\omega_{1r}\lambda_{r})\mathbf{e}_{1} + \dots+ (\omega_{n1}\lambda_{1}+\cdots+\omega_{nr}\lambda_{r})\mathbf{e}_{n}. \end{aligned}\]Por otra parte, $\overrightarrow{PX}=\overrightarrow{PO}+\overrightarrow{OX},$ por lo que $\overrightarrow{OX}=\overrightarrow{OP}+\mathbf{w}.$ Supongamos que las coordenadas de $\overrightarrow{OX}$ y $\overrightarrow{OP},$ en la base $B,$ son $(x_{1},x_{2},\ldots,x_{n})$ y $(p_{1},p_{2},\ldots,p_{n}),$ respectivamente.
Entonces,
\[\left\lbrace \begin{aligned} x_{1} & = p_{1}+\omega_{11}\lambda_{1}+\omega_{12}\lambda_{2}+\cdots+\omega_{1r}\lambda_{r}, \\ x_{2} & = p_{2}+\omega_{21}\lambda_{1}+\omega_{22}\lambda_{2}+\cdots+\omega_{2r}\lambda_{r}, \\ & \vdots \\ x_{n} & = p_{n}+\omega_{n1}\lambda_{1}+\omega_{n2}\lambda_{2}+\cdots+\omega_{nr}\lambda_{r}. \end{aligned} \right.\]Estas son las ecuaciones paramétricas de la variedad afín $\mathfrak{L}.$ Concretamente, son las relaciones que existen entre las coordenadas de $X$ y $P$ en el sistema de referencia $\mathfrak{R}$ y las coordenadas de $w$ en la base $B.$
En forma matricial, viene dada por
\[\begin{pmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{pmatrix} = \begin{pmatrix} p_{1} \\ p_{2} \\ \vdots \\ p_{n} \end{pmatrix} + \lambda_{1} \begin{pmatrix} \omega_{11} \\ \omega_{21} \\ \vdots \\ \omega_{n1} \end{pmatrix} + \lambda_{2} \begin{pmatrix} \omega_{12} \\ \omega_{22} \\ \vdots \\ \omega_{n2} \end{pmatrix} + \cdots + \lambda_{r} \begin{pmatrix} \omega_{1r} \\ \omega_{2r} \\ \vdots \\ \omega_{nr} \end{pmatrix}.\]Cuando $X$ “recorre” la variedad $\mathfrak{L},$ los coeficientes $\lambda_{i}$ “recorren” el subespacio vectorial $W,$ por lo que las ecuaciones anteriores pueden verse como un sistema compatible (determinado) en las incógnitas $\lambda_{i}.$
Para obtener las ecuaciones implícitas o cartesianas de $\mathfrak{L}$ basta con imponer que, en el sistema compatible (determinado) en las incógnitas $\lambda_{i},$ el rango de la matriz de coeficientes coincida con el rango de la matriz ampliada y con el número de incógnitas $\lambda_{i}.$ Es decir, que
\[\operatorname{rg}\begin{pmatrix} x_{1}-p_{1} & \omega_{11} & \omega_{12} & \cdots & \omega_{1r} \\ x_{2}-p_{2} & \omega_{21} & \omega_{22} & \cdots & \omega_{2r} \\ \vdots & \vdots & \vdots & & \vdots \\ x_{r}-p_{r} & \omega_{r1} & \omega_{r2} & \cdots & \omega_{rr} \\ x_{r+1}-p_{r+1} & \omega_{r+1,1} & \omega_{r+1,2} & \cdots & \omega_{r+1,r} \\ \vdots & \vdots & \vdots & & \vdots \\ x_{n}-p_{n} & \omega_{n1} & \omega_{n2} & \cdots & \omega_{nr} \end{pmatrix} =r,\]lo que es equivalente a imponer que los menores de orden $r+1$ sean cero. El resultado final es un sistema de $n-r$ ecuaciones.
También podemos considerar el sistema anterior considerando $\lambda_1,\dots,\lambda_r$ como incógnitas
\[\left\lbrace \begin{aligned} \omega_{11}\lambda_{1}+\omega_{12}\lambda_{2}+\cdots+\omega_{1r}\lambda_{r} & = x_{1} - p_{1},\\ \omega_{21}\lambda_{1}+\omega_{22}\lambda_{2}+\cdots+\omega_{2r}\lambda_{r} & = x_{2} - p_{2}, \\ & \vdots \\ \omega_{n1}\lambda_{1}+\omega_{n2}\lambda_{2}+\cdots+\omega_{nr}\lambda_{r} & = x_{n} -p_{n}. \end{aligned} \right.\]Si aplicamos eliminación por filas, obtendremos $n-r$ ecuaciones (no homogéneas en general) en $x_1,\dots,x_n$ que son las ecuaciones implícitas de la variedad, y que surgen de imponer que el sistema original es compatible.
En el espacio afín usual tridimensional se considera un sistema de referencia $\mathfrak{R}=\lbrace O;B=\lbrace \mathbf{e} _{1},\mathbf{e} _{2},\mathbf{e} _{3} \rbrace \rbrace,$ el punto $P$ con coordenadas en $(1,-2,1) _\mathfrak{R}$ y el susbepacio vectorial $W$ generado por los vectores $\mathbf{u} _{1}$ y $\mathbf{u} _{2},$ siendo $(1,2,-1)$ y $(2,1,1)$ las coordenadas de $\mathbf{u} _{1}$ y $\mathbf{u} _{2}$ en la base $B,$ respectivamente.
Las ecuaciones paramétricas de la variedad afín que pasa por $P$ con dirección $W$ son
\[\begin{pmatrix} x_{1} \\ x_{2} \\ x_{3} \end{pmatrix} = \begin{pmatrix} 1 \\ -2 \\ 1 \end{pmatrix} + \lambda_{1} \begin{pmatrix} 1 \\ 2 \\ -1 \end{pmatrix} + \lambda_{2} \begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix}, \quad\lambda_{1},\lambda_{2}\in\mathbb{R}.\]Es decir,
\[\left\lbrace \begin{aligned} x_{1} & = 1+\lambda_{1}+2\lambda_{2}, \\ x_{2} & = -2+2\lambda_{1}+\lambda_{2}, \\ x_{3} & = 1-\lambda_{1}+\lambda_{2}. \end{aligned} \right.\]Tomando $\lambda_1$ y $\lambda_2$ como incógnitas, el sistema se transforma en el sistema
\[\left\lbrace \begin{array}{rcl} \lambda_{1}+2\lambda_{2} &= & x_1-1, \\ 2\lambda_{1}+\lambda_{2} &= & x_{2}+2, \\ -\lambda_{1}+\lambda_{2} &= & x_{3}-1. \end{array} \right.\]Aplicando eliminación gaussiana vemos que el sistema es compatible (determinado) si, y solo si,
\[-x_1+x_2+x_{3}+2 = 0.\]Por tanto, la ecuación implícita de la variedad afín que pasa por $P$ con dirección $W$ es
\[x_{1}-x_{2}-x_{3}=2.\]Sea $\mathfrak{A}$ un espacio afín con espacio vectorial asociado $V,$ y sea $\mathcal{R}={O;B}$ un sistema de referencia de $\mathfrak{A}.$ Dada una variedad afín $\mathfrak{L}=P+W$ con $P\in\mathfrak{A}$ y $W$ un subespacio vectorial de $V,$ por definición $X\in \mathfrak{L}$ si y sólo si $\overrightarrow{PX}\in W.$
Las coordenadas de $\overrightarrow{PX}$ respecto de $B$ las podemos obtener de la siguiente forma:
\[\overrightarrow{PX}=\overrightarrow{PO}+\overrightarrow{OX}=\overrightarrow{OX}-\overrightarrow{OP}.\]Así, las coordenadas de $\overrightarrow{PX}$ son las coordenadas de $X$ menos las coordenadas de $P$ (en el sistema de referencia $\mathcal{R}$). Supongamos que $P=(p _1,\dots,p _n) _{\mathcal{R}}$ y que $X=(x _1,\dots,x _n) _{\mathcal{R}}.$ Las coordenadas de $\overrightarrow{PX}$ respecto de $B$ son $(x _1-p _1,\dots,x _n-p _n).$
Supongamos que $Ax=0$ son las ecuaciones implícitas de $W$ respecto de la base $B.$ Entonces $X\in \mathfrak{L}=P+W$ si y sólo si $\overrightarrow{PX}\in W,$ lo que equivale a que
\[A \begin{pmatrix} x_1-p_1\\ \vdots\\ x_n-p_n \end{pmatrix}=0,\]que a su vez equivale a
\[A \begin{pmatrix} x_1\\ \vdots\\ x_n \end{pmatrix}= A \begin{pmatrix} p_1\\ \vdots\\ p_n \end{pmatrix}.\]De esta forma, las ecuaciones implícitas o cartesianas de $\mathfrak{L}$ son las mismas que las de $W$ pero ajustando el término independiente para que “pase” por $P.$
En nuestro ejemplo anterior $P=(1,-2,1)$ y $W$ tiene como generadores a $(1,2,-1)$ y $(2,1,1).$ Las ecuaciones cartesianas de $W$ son $W\equiv x_1-x_2-x_3=0.$ Si evaluamos esas ecuaciones en $P,$ obtenemos el término independiente de las ecuaciones cartesianas de $\mathfrak{L}.$ Como $1-(-2)-1=2.$ Así $\mathfrak{L}\equiv x_1-x_2-x_2=2.$
Sea $\mathfrak{A}$ un espacio afín con espacio vectorial asociado $V.$ Si $V$ es un espacio vectorial euclídeo, es decir, si está dotado de un producto escalar $\langle\cdot,\cdot\rangle,$ entonces decimos que $\mathfrak{A}$ es un espacio afín euclídeo.
Sea $\mathfrak{A}$ un espacio afín euclídeo asociado al espacio vectorial $V.$ Se define la función distancia en $\mathfrak{A}$ como la aplicación
\[\operatorname{d}:\mathfrak{A}\times\mathfrak{A} \to \mathbb{R}_{0}^{+},\quad \operatorname{d}(P,Q)= \Vert \overrightarrow {PQ}\Vert ,\]donde $\Vert \cdot \Vert$ es la norma asociada al producto escalar de $V.$
Recordemos que la norma de un vector $\mathbf{v}\in V,$ asociada al producto escalar $\langle\cdot,\cdot\rangle$ en $V,$ está definida por $\Vert \mathbf{v}\Vert =\sqrt{\langle \mathbf{v},\mathbf{v} \rangle}.$
Consideremos el producto escalar usual en $\mathbb{R}^{n}.$ Además, sea el espacio afín $\mathbb{R}^{n},$ sobre el espacio vectorial $\mathbb{R}^{n},$ con la aplicación $\phi$ definida por
\[\phi((x_{1},\ldots,x_{n}),(y_{1},\ldots,y_{n})) = (y_{1}-x_{1},\ldots,y_{n}-x_{n}).\]Entonces $\mathbb{R}^{n}$ es un espacio euclídeo con distancia dada por
\[\operatorname{d}((x_{1},\ldots,x_{n}),(y_{1},\ldots,y_{n})) = \sqrt{(y_{1}-x_{1})^{2}+\cdots+(y_{n}-x_{n})^{2}}.\]En particular, si en el espacio afín euclídeo tridimensional usual $\mathbb{R}^{3}$ consideramos los puntos $P=(2,3,1)$ y $Q=(0,-1,5),$ entonces la distancia entre ellos es igual a
\[\operatorname{d}(P,Q)=\sqrt{(0-2)^{2}+(-1-3)^{2}+(5-1)^{2}}=\sqrt{4+16+16}=6.\]Si $P,$ $Q$ y $R$ son tres puntos de un espacio afín euclídeo con distancia $\operatorname{d},$ entonces se cumplen las siguientes propiedades.
$\operatorname{d}(P,Q)=0$ si, y solo si, $P=Q.$
$\operatorname{d}(P,Q)=\operatorname{d}(Q,P).$
$\operatorname{d}(P,R) \leq \operatorname{d}(P,Q)+\operatorname{d}(Q,R).$
Sea $\mathfrak{A}$ un espacio afín euclídeo asociado al espacio vectorial $V.$ Sea $\mathfrak{L}$ una variedad afín con subespacio director $W$ y sea un punto $P\in\mathfrak{A}.$
Llamamos complemento ortogonal a $\mathfrak{L}$ por el punto $P$ a la variedad afín $\mathfrak{L} _{P}^{\perp}=P+W^{\perp}.$
Llamamos referencia rectangular en un espacio euclídeo $\mathfrak{A},$ con espacio vectorial subyacente $V$ de dimensión $n,$ a todo sistema de referencia $R=\lbrace O;B\rbrace$ tal que $B$ es una base ortonormal de $V.$
Un vector $\mathbf{v}$ se dice ortogonal a una variedad afín $\mathfrak{L},$ del espacio afín euclídeo $\mathfrak{A},$ si $\mathbf{v}$ es ortogonal al subespacio director de $\mathfrak{L}.$ Denotaremos este hecho por $\mathbf{v}\perp\mathfrak{L}.$
Consideremos la variedad afín $\mathfrak{L}=P+W$ que pasa por $P$ con dirección $W.$ Sea un punto $Q\notin\mathfrak{L}.$ Sea $p_{W}(\overrightarrow{PQ})$ la proyección ortogonal de $\overrightarrow{PQ}$ sobre $W.$ El único punto $Q’\in \mathfrak{L}$ tal que $\overrightarrow{PQ’}=p_{W}(\overrightarrow{PQ})$ se llama proyección ortogonal del punto $Q$ sobre la variedad afín $\mathfrak{L}$ y se denota por $p_{\mathfrak{L}}(Q).$
Se verifica que $\lbrace p_{\mathfrak{L}}(Q)\rbrace=\mathfrak{L}\cap \mathfrak{L}_{Q}^{\perp}.$
Hallemos la proyección ortogonal del punto $Q=(1,3,-1),$ del espacio euclídeo tridimensional usual, sobre la recta $r$ de ecuaciones paramétricas
\[\left\lbrace \begin{array}{l} x=2\lambda, \\ y=2-\lambda, \\ z=1+2\lambda. \end{array} \right.\]Comenzamos tomando la variedad afín $\mathfrak{L}$ correspondiente a la recta $r,$ esto es, la variedad que pasa por el punto $(0,2,1)$ y tiene como subespacio vectorial asociado el generado por el vector $(2,-1,2),$ es decir, $W=\mathcal{L}(\lbrace(2,-1,2)\rbrace).$
El complemento ortogonal $W^{\perp}$ de $W$ está engendrado por dos vectores linealmente independientes ortogonales a $W.$ Podemos tomar, por ejemplo, $(1,2,0)$ y $(1,0,-1).$ Por tanto,
\[W^{\perp}=\mathcal{L}\left( \lbrace(1,2,0),(1,0,-1) \rbrace\right).\]Así, $W^{\perp}$ es un subespacio vectorial de dimensión $2$ que admite como ecuaciones paramétricas
\[\left\lbrace \begin{array}{l} x=\alpha+\beta, \\ y=2\alpha, \\ z=-\beta. \end{array} \right.\]Para hallar una ecuación implícita de $W^{\perp},$ discutimos tomando $\alpha,\beta$ como incógnitas y $x,y,z$ como parámetros.
Por tanto, el sistema será compatible (determinado) si, y solo si,
\[z-\frac{1}{2}y+x = 0.\]En consecuencia, una ecuación implícita de $W^{\perp}$ es
\[2x-y+2z=0.\]La variedad $\mathfrak{L}_{Q}^{\perp},$ que pasa por $Q=(1,3,-1)$ y con subespacio director $W^{\perp},$ está formada por los puntos $X=(x,y,z)$ tales que el vector $ \overrightarrow{QX}=(x-1,y-3,z+1) $ pertenece a $W^{\perp},$ es decir, los puntos $X$ tales que $\overrightarrow{QX}$ satisface $2x-y+2z=0.$
Por tanto, $\mathfrak{L}_{Q}^{\perp}$ está formada por los puntos $X=(x,y,z)$ tales que
\[2(x-1)-(y-3)+2(z+1)=0.\]Como $\mathfrak{L}_{Q}^{\perp}$ es ortogonal a $r,$ entonces su intersección con $r$ proporciona la proyección ortogonal de $Q=(1,3,-1)$ sobre $r.$
Ahora bien, si un punto de $r$ está en $\mathfrak{L}_{Q}^{\perp},$ entonces
\[2(2\lambda-1) - (2-\lambda-3) + 2(1+2\lambda+1) = 0 \Rightarrow 9\lambda+3=0 \Rightarrow \lambda=-\frac{1}{3}.\]Concluimos que la proyección ortogonal de $Q$ sobre $r$ es el punto
\[Q'=(2\lambda, 2-\lambda, 1+2\lambda) = \left( -\frac{2}{3}, \frac{7}{3}, \frac{1}{3} \right).\]Definimos la distancia de un punto $Q$ a una variedad afín $\mathfrak{L}=P+W$ como
\[\operatorname{d}(Q,\mathfrak{L}) = \inf\lbrace \operatorname{d}(Q,X) \mid X\in\mathfrak{L}\rbrace.\]En realidad, ese ínfimo es un mínimo como vamos a ver a continuación. Para todo $X\in\mathfrak{L},$ si llamamos $Q’=p_{\mathfrak{L}}(Q),$ tenemos que $\overrightarrow{QQ’}\in W^\perp$ y $\overrightarrow{Q’X}\in W.$ Así, por el Teorema de Pitágoras
\[\begin{aligned} \operatorname{d}(Q,X)^2& =\Vert \overrightarrow{QX}\Vert^2= \Vert \overrightarrow{QQ'} + \overrightarrow{Q'X}\Vert^2 \\ & = \Vert \overrightarrow{QQ'}\Vert^2+ \Vert \overrightarrow{Q'X}\Vert^2 \ge \Vert \overrightarrow{QQ'} \Vert^2 = \operatorname{d}(Q,Q')^2, \end{aligned}\]por lo que
\[\operatorname{d}(Q,\mathfrak{L}) = \operatorname{d}\left(Q,p_{\mathfrak{L}}(Q)\right).\]Continuando con el ejemplo anterior, la distancia de $Q=(1,3,-1)$ a la recta $r$ de ecuaciones paramétricas
\[\left\lbrace \begin{array}{l} x=2\lambda, \\ y=2-\lambda, \\ z=1+2\lambda. \end{array} \right.\]es
\[\begin{aligned} \operatorname{d}(Q,r) & = \operatorname{d}\left(Q,p_{r}(Q)\right) \\ & = \operatorname{d}\left((1,3,-1),\left(-\frac{2}{3},\frac{7}{3},\frac{1}{3}\right)\right) \\ & = \sqrt{\left(-\frac{2}{3}-1\right)^{2}+\left(\frac{7}{3}-3\right)^{2}+\left(\frac{1}{3}+1\right)^{2}} \\ & = \sqrt{5}. \end{aligned}\]Dadas dos variedades afines $\mathfrak{L} _{1}=P _{1}+W _{1}$ y $\mathfrak{L} _{2}=P _{2}+W _{2},$ se define la distancia entre ambas como
\[\operatorname{d}(\mathfrak{L}_{1},\mathfrak{L}_{2}) = \inf\lbrace\operatorname{d}(Q_{1},Q_{2}) : Q_{1}\in\mathfrak{L}_{1} \text{ y } Q_{2}\in\mathfrak{L}_{2}\rbrace.\]Si dos variedades se cortan entonces la distancia entre ellas es cero.
Si las dos variedades no se cortan, diremos que $\mathfrak{L}_1$ y $\mathfrak{L}_2$ son paralelas si $W_1\subseteq W_2$ o $W_2\subseteq W_1,$ y diremos que se cruzan en caso contrario.
El siguiente resultado proporciona un procedimiento para calcular la distancia entre dos variedades que no se cortan (esto es, entre dos variedades que o bien se cruzan o bien son paralelas).
Sean $\mathfrak{L}_{1}=P _{1}+W _{1}$ y $\mathfrak{L} _{2}=P _{2}+W _{2}$ dos variedades afines que no se cortan. Entonces se verifica que
\[\operatorname{d}(\mathfrak{L} _{1},\mathfrak{L} _{2}) = \operatorname{d}(P _{1},\mathfrak{L}),\]donde $\mathfrak{L}=P_{2}+(W_{1}+W_{2})$ es la variedad que contiene a $\mathfrak{L} _{2}$ y es paralela a $\mathfrak{L} _{1}.$
Para probar este hecho, vamos a demostrar primero que $\operatorname{d}(P_1,\mathfrak{L})\le \operatorname{d}(\mathfrak{L}_1,\mathfrak{L}_2).$ Sean $Q_1\in \mathfrak{L}_1$ y $Q_2\in \mathfrak{L}_2.$ Vamos a buscar $C\in \mathfrak{L}=P_2+W_1+W_2$ de forma que $\overrightarrow{Q_1 Q_2}=\overrightarrow{P_1C}.$ Tenemos que
\[\overrightarrow{Q_1 Q_2}=\overrightarrow{Q_1P_1}+\overrightarrow{P_1P_2}+\overrightarrow{P_2Q_2}.\]Sea $C$ el único punto del espacio afín de forma que $\overrightarrow{P_2C}=\overrightarrow{Q_1P_1}+\overrightarrow{P_2Q_2}.$ Como $\overrightarrow{Q_1P_1}+\overrightarrow{P_2Q_2}\in W_1+W_2,$ deducimos que $C\in \mathfrak{L}.$ De esta forma
\[\overrightarrow{Q_1 Q_2}=\overrightarrow{P_1P_2}+\overrightarrow{P_2C}=\overrightarrow{P_1C},\]y por tanto $\operatorname{d}(Q_1,Q_2)=\operatorname{d}(P_1,C)\ge \operatorname{d}(P_1,\mathfrak{L}).$ Por tanto, $\operatorname{d}(P_1,\mathfrak{L})\le \operatorname{d}(Q_1,Q_2)$ para todo $Q_1\in \mathfrak{L}_1$ y $Q_2\in \mathfrak{L}_2,$ por lo que $\operatorname{d}(P_1,\mathfrak{L})\le \operatorname{d}(\mathfrak{L}_1,\mathfrak{L}_2).$
Veamos ahora que $\operatorname{d}(\mathfrak{L} _1,\mathfrak{L} _2)\le \operatorname{d}(P _1,\mathfrak{L}).$ Sabemos que $\operatorname{d}(P _1,\mathfrak{L})=\operatorname{d}(P _1,p _{\mathfrak{L}}(P _1)).$
Sea $C=p_{\mathfrak{L}}(P _1).$ Si probamos que existen $Q _1\in \mathfrak{L} _1$ y $Q _2\in \mathfrak{L} _2$ de forma que $\overrightarrow{Q _1 Q _2}=\overrightarrow{P _1C},$ entones habremos terminado, pues
\[\operatorname{d}(\mathfrak{L}_1,\mathfrak{L}_2)\le \operatorname{d}(Q_1,Q_2)=\operatorname{d}(P_1,C)=\operatorname{d}(P_1,\mathfrak{L}).\]Ahora bien, al estar $C\in \mathfrak{L}=P_2+W_1+W_2,$ sabemos que $\overrightarrow{P_2C}\in W_1+W_2.$ Sean $w_1\in W_1$ y $w_2\in W_2$ tales que $\overrightarrow{P_2C}=w_1+w_2.$ Por ser $-w_1\in W_1,$ existe $Q_1\in \mathfrak{L}_1$ tal que $-w_1=\overrightarrow{P_1Q_1},$ y en consecuencia $w_1=\overrightarrow{Q_1P_1}.$ Además, existe $Q_2\in \mathfrak{L}_2$ tal que $w_2=\overrightarrow{P_2Q_2}.$ Tenemos así que
\[\begin{aligned} \overrightarrow{P_1C} & =\overrightarrow{P_1P_2}+\overrightarrow{P_2C}=\overrightarrow{P_1P_2}+w_1+w_2\\ & =\overrightarrow{P_1P_2}+\overrightarrow{Q_1P_1}+\overrightarrow{P_2Q_2}= \overrightarrow{Q_1Q_2}. \end{aligned}\]Sea $P=(p_1,\dots,p_n)$ un punto y $\mathfrak{H}\equiv a_1x_1+\dots+a_nx_n+b=0$ un hiperplano. Llamemos a $Q=(q_1,\dots,q_n)$ a la proyección ortogonal de $P$ en $\mathfrak{H},$ y $\mathbf{v}=(a_1,\dots,a_n).$ Entonces $\mathbf{v}$ y $\overrightarrow{PQ}$ son ambos perpendiculares a $\mathfrak{H},$ por lo que el ángulo que forman es $0$ o $\pi.$ Por tanto, $\vert\langle \overrightarrow{PQ},\mathbf{v}\rangle\vert = \Vert \overrightarrow{PQ}\Vert \Vert \mathbf{v}\Vert,$ y
\[\begin{aligned} \operatorname{d}(P,\mathfrak{H}) & =\Vert \overrightarrow{PQ}\Vert = \frac{|a_1(q_1-p_1)+\dots+a_n(q_n-p_n) |}{\Vert (a_1,\dots,a_n)\Vert } \\ & = \frac{|a_1p_1+\dots+a_np_n+b|}{\sqrt{a_1^2+\dots+a_n^2}}. \end{aligned}\]La distancia del punto $P=(2,3)$ a la recta $r\equiv x+y-1=0$ es
\[\operatorname{d}(P,r)=\frac{4}{\sqrt{2}}=2\sqrt{2}.\]Sean $\mathbf{u},\mathbf{v}\in K^3,$ con $K$ un cuerpo, y sean $(u_1,u_2,u_3)$ y $(v_1,v_2,v_3)$ sus coordenadas respecto a una base $B=\lbrace\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_e\rbrace$ de $K^3.$ El producto vectorial de $\mathbf{u}$ y $\mathbf{v}$ se define mediante el siguiente determinante formal
\[\mathbf{u}\wedge \mathbf{v} = \begin{vmatrix} \mathbf{e}_1 & \mathbf{e}_2 & \mathbf{e}_3\\ u_1 & u_2 & u_3 \\ v_1 & v_2 & v_ 3 \end{vmatrix}= \begin{vmatrix} u_2 & u_3 \\ v_2 & v_3 \end{vmatrix} \mathbf{e}_1 + \begin{vmatrix} u_3 & u_1 \\ v_3 & v_1 \end{vmatrix} \mathbf{e}_2 + \begin{vmatrix} u_1 & u_2 \\ v_1 & v_2 \end{vmatrix} \mathbf{e}_3.\]$(\mathbf{u} \wedge \mathbf{v})\in\mathfrak{L}(\lbrace\mathbf{u},\mathbf{v}\rbrace)^\perp.$
$\mathbf{u} \wedge \mathbf{v}=-(\mathbf{v} \wedge \mathbf{u}).$
$\lambda(\mathbf{u}\wedge \mathbf{v})=(\lambda\mathbf{u}\wedge \mathbf{v})=(\mathbf{u}\wedge \lambda\mathbf{v})$ para todo $\lambda$ en el cuerpo base.
$(\mathbf{u}+\mathbf{v})\wedge \mathbf{w}=(\mathbf{u}\wedge \mathbf{w})+(\mathbf{v}\wedge \mathbf{w})$; $\mathbf{u}\wedge (\mathbf{v}+ \mathbf{w})=(\mathbf{u}\wedge \mathbf{v})+(\mathbf{u}\wedge \mathbf{w}).$
$\mathbf{u} \wedge \mathbf{v}=0$ si y sólo si $\dim(\mathfrak{L}(\lbrace\mathbf{u},\mathbf{v}\rbrace))\le 1.$
$\Vert \mathbf{u} \wedge \mathbf{v}\Vert = \Vert \mathbf{u}\Vert \Vert\mathbf{v}\Vert \sin(\measuredangle(\mathbf{u},\mathbf{v})).$
Para ver que $(\mathbf{u}\wedge \mathbf{v})\perp \mathbf{u},$ basta observar que
\[\begin{aligned} \langle \mathbf{u}\wedge \mathbf{v},\mathbf{u}\rangle & = \begin{vmatrix} u_2 & u_3 \\ v_2 & v_3 \end{vmatrix} u_1 + \begin{vmatrix} u_3 & u_1 \\ v_3 & v_1 \end{vmatrix} u_1 + \begin{vmatrix} u_1 & u_2 \\ v_1 & v_2 \end{vmatrix} u_3\\ & = \begin{vmatrix} u_1 & u_2 & u_3\\ u_1 & u_2 & u_3 \\ v_1 & v_2 & v_ 3 \end{vmatrix}=0. \end{aligned}\]De forma análoga se prueba que $(\mathbf{u}\wedge \mathbf{v})\perp \mathbf{v}.$
El cálculo de $\mathbf{u} \wedge \mathbf{v}$ se obtiene del de $\mathbf{v} \wedge \mathbf{u}$ cambiando dos filas en un determinante formal, por lo que el signo cambia.
Usando las propiedades de los determinantes se prueban las dos propiedades de linealidad.
Nótese que $\mathbf{u}\wedge \mathbf{v}$ es cero si y sólo si
\[\begin{vmatrix} u_2 & u_3 \\ v_2 & v_3 \end{vmatrix}= \begin{vmatrix} u_3 & u_1 \\ v_3 & v_1 \end{vmatrix}= \begin{vmatrix} u_1 & u_2 \\ v_1 & v_2 \end{vmatrix} =0,\]y esto equivale a decir que el rango de la matriz
\[\begin{vmatrix} u_1 & u_2 & u_3 \\ v_1 & v_2 & v_ 3 \end{vmatrix}\]no es dos, que es lo mismo que decir que $\dim(\mathfrak{L}(\lbrace\mathbf{u},\mathbf{v}\rbrace)\le 1.$
La última igualdad se comprueba tomando cuadrados y usando que $ \sin(\measuredangle(\mathbf{u},\mathbf{v}))^2=1- \cos(\measuredangle(\mathbf{u},\mathbf{v}))^2$ y que $\langle \mathbf{u},\mathbf{v}\rangle^2= \Vert\mathbf{u}\Vert^2 \Vert\mathbf{v}\Vert^2 \cos(\measuredangle(\mathbf{u},\mathbf{v}))^2.$