See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Mínimos cuadrados - Wikipedia, la enciclopedia libre

Mínimos cuadrados

De Wikipedia, la enciclopedia libre

Mínimos cuadrados es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos (un "mejor ajuste"). Intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración). Pero requiere un gran número de iteraciones para converger.

Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados).

La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas. Muchos otros problemas de optimización pueden expresarse también en forma de mínimos cuadrados, minimizando la energía o maximizando la entropía

Tabla de contenidos

[editar] Historia

El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el asteroide Ceres. Fue capaz de seguir su órbita durante 40 días. Durante el curso de ese año, muchos científicos intentaron estimar su trayectoria con base en las observaciones de Piazzi (resolver las ecuaciones no lineales de Kepler de movimiento es muy difícil). La mayoría de evaluaciones fueron inútiles; el único cálculo suficientemente preciso para permitir a Zach, astrónomo alemán, reencontrar a Ceres al final del año fue el de un Carl Friedrich Gauss de 24 años (los fundamentos de su enfoque ya los había plantado en 1795, cuando aún tenía 18 años). Pero su método de mínimos cuadrados no se publicó hasta 1809, apareciendo en el segundo volumen de su trabajo sobre mecánica celeste, Theoria Motus Corporum Coelestium in sctionibus conicis solem ambientium. El francés Adrien-Marie Legendre desarrolló el mismo método de forma independiente en 1805.

En 1829 Gauss fue capaz de establecer la razón del éxito maravilloso de este procedimiento: simplemente, el método de mínimos cuadrados es óptimo en muchos aspectos. El argumento concreto se conoce como teorema de Gauss-Markov.

[editar] Formulación del problema

Supóngase el conjunto de puntos (xk,yk), siendo k = 1, 2,\dots, n, sea una base de m funciones linealmente independientes fj(x), con j = 1, 2,\dots, m. Queremos encontrar una función f\,\! combinación lineal de las funciones base tal que f(x_k)\approx y_k, esto es:

f(x)=\sum_{j=1}^m c_j f_j (x)

Se trata de hallar los m coeficientes cj que hagan que la función aproximante f(x) sea la mejor aproximación a los puntos (xk,yk). El criterio de mejor aproximación puede variar, pero en general se basa en aquél que dé un menor error en la aproximación. El error en un punto (xk,yk) se podría definir como:

ek = ykf(xk)

En este caso se trata de medir y minimizar el error en el conjunto de la aproximación. Dicho error podrá ser

Error Máximo: E_\infty (f) = max(|e_k|)
Error Medio: E_m (f) = \frac{\sum_{k = 1}^n |e_k|}{n}
Error Cuadrático Medio: E_{cm} (f) = \sqrt{\frac{\sum_{k = 1}^n (e_k)^2}{n}}

La aproximación mínimo cuadrada se basa en la minimización del error cuadrático medio o equivalentemente del radicando del error, el llamado error cuadrático, definido como:

E_{c}(f) = \frac{\sum_{k = 1}^n (e_k)^2}{n}


Para llegar a este objetivo, suponemos que la función f es de una forma particular que contenga algunos parámetros que necesitamos determinar. Por ejemplo, supongamos que es cuadrática, lo que quiere decir que f(x) = ax^2+bx+c\,\!, donde no conocemos aún a\,\!, b\,\! y c\,\!. Ahora buscamos los valores de a\,\!, b\,\! y c\,\! que minimicen la suma de los cuadrados de los residuos (S):

 S = \sum_{i=1}^n (y_i - f(x_i))^2.

Esto explica el nombre de mínimos cuadrados. A las funciones que multiplican a los coeficientes buscados, esto es, a x2, x y 1, se les conoce con el nombre de funciones base de la aproximación. Dichas funciones base pueden ser cualesquiera funciones, y para ese caso se deduce a continuación la fórmula general en el caso de que la aproximación sea discreta y lineal.

La aproximación de mínimos cuadrados es la mejor aproximación al conjunto de puntos (xk,yk), según el criterio del error mínimo cuadrático. Es posible generar otro tipo de aproximaciones si se toman los errores máximo o medio, pero la dificultad que entraña operar con ellos debido al valor absoluto de su expresión hace que apenas se usen.

[editar] Solución del problema de los mínimos cuadrados

La aproximación mínimo cuadrada tiene solución general para el caso de un problema de aproximación lineal en sus coeficientes cj cualesquiera sean las funciones base fj(x) antes expuestas. Por lineal se entiende f(x) es una combinación lineal de dichas funciones base. Para hallar la expresión de la fórmula general, es posible o bien minimizar el error cuadrático arriba expuesto, para lo cual se haría uso del cálculo multivariable (se trataría de un problema de optimización en cj), o alternativamente hacer uso del álgebra lineal en la llamada deducción geométrica. Para los Modelos estáticos uniecuacionales, el método de mínimos cuadrados no ha sido superado, a pesar de diversos intentos para ello, desde principios del Siglo XIX.

[editar] Deducción geométrica del problema discreto

La mejor aproximación deberá tender a interpolar la función de la que proviene el conjunto de pares (xk,yk), esto es, deberá tender a pasar exactamente por todos los puntos. Eso supone que se debería cumplir que:

f(xk) = yk,k = 1,2,...,n

Sustituyendo f(x) por su expresión:

 \sum_{j=1}^m c_j f_j(x_k)=y_k , k=1,...,n

Esto es, se habría de cumplir exactamente un sistema de n ecuaciones y m incógnitas, y como en general n>m, dicho sistema estaría sobredeterminado, y no tendría solución general. De ahí surge la necesidad de aproximar. Dicho sistema podría expresarse en forma matricial como:


  \begin{bmatrix}
    f_1(x_1) & f_2(x_1) & ... & f_m(x_1) \\
    f_1(x_2) & f_2(x_2) & ... & f_m(x_2) \\
    ... & ... & ... & ... \\
    f_1(x_n) & f_2(x_n) & ... & f_m(x_n)
  \end{bmatrix}
\times
    \begin{bmatrix}
    c_1 \\
    c_2 \\
    ... \\
    c_m
  \end{bmatrix}
=
  \begin{bmatrix}
    y_1 \\
    y_2 \\
    ... \\
    y_n
  \end{bmatrix}

Esto es: Ac = b

La aproximación trata de hallar el vector c que mejor aproxime el sistema Ac = b.

Con dicho vector c aproximante, es posible definir el vector residuo como:

r = bAc

De manera que el mínimo error cuadrático supone minimizar el residuo, definiendo su tamaño en base a la norma euclídea o usual del residuo:

 ||r||_2= \sqrt{(r,r)_2} =\sqrt{r^t r}= \sqrt{\sum_{k=1}^n (r_k)^2}

siendo (r,r)2 el producto interior o escalar del vector residuo sobre sí mismo.

Si etendemos al sistema Ac = b, entonces se ve claramente que al multiplicar A y c, lo que se realiza es una combinación lineal de las columnas de A:


 A c=
  \begin{bmatrix}
    A_1 & A_2 & ... & A_m 
  
  \end{bmatrix}
\times
\begin{bmatrix}
    c_1 \\
    c_2 \\
    ... \\
    c_m
  \end{bmatrix}
= c_1 A_1 + c_2 A_2 +...+ c_m A_m

El problema de aproximación será hallar aquella combinación lineal lo más cercana posible al vector b. Se comprueba que el conjunto de las columnas de A engendran un espacio vectorial del que son base, esto es, que forman un Span lineal: span(A1,A2,...,Am), pero al que el vector b no tiene porqué pertenecer.

Entonces, de los infinitos vectores del span(A1,A2,...,Am) que son combinación lineal de los vectores de la base, se tratará de hallar el más cercano al vector b.

De entre todos ellos, el que cumple esto es la proyección ortogonal del b sobre span(A1,A2,...,Am), y que por tanto hace que el tamaño del vector r, que será el vector que una los extremos de los vectores b y proyección ortogonal de b sobre el span, sea mínimo, esto es, que minimiza su norma euclídea.

Es inmediato ver que si el residuo une b con su proyección ortogonal, entonces es a su vez ortogonal al span(A1,A2,...,Am), y a cada uno de los vectores de la base, esto es, ortogonal a cada columna de A.

La condición de minimización del residuo será:

  r \perp span(A_1, A_2...,A_m)

Esto solo es cierto si:

 r \perp A_j \iff A_j \perp r \iff (A_j,r)_2=0=A_j^t r ,   j=1,2,...,m

A su vez, cada una de las m condiciones de perpendicularidad se puede agrupar en una sola:

Atr = 0

Sustituyendo el residuo por su expresión:

 A^t (b - A c)= 0 \iff A^t A c= A^t b

Por tanto, la mejor aproximación mínimo cuadrada lineal para un conjunto de puntos discretos, sean cuales sean las funciones base, se obtiene al resolver el sistema cuadrado:

AtAc = Atb.

A esta ecuación se le llama ecuación normal de Gauss, y es válida para cualquier conjunto de funciones base. Si estas son la unidad y la función x, entonces la aproximación se llama regresión lineal.

En el ejemplo anterior, f es lineal para los parámetros a, b y c. El problema se simplifica considerablemente en este caso y esencialmente se reduce a un sistema lineal de ecuaciones. Esto se explica en el artículo de los mínimos cuadrados lineales.

El problema es más complejo si f no es lineal para los parámetros a ser determinados. Entonces necesitamos resolver un problema de optimización general (sin restricciones). Se puede usar cualquier algoritmo para tal problema, como el método de Newton y el descenso por gradiente. Otra posibilidad es aplicar un algoritmo desarrollado especialmente para tratar con los problemas de mínimos cuadrados, como por ejemplo el algoritmo de Gauss-Newton o el algoritmo de Levenberg-Marquardt.

[editar] Mínimos cuadrados y análisis de regresión

En el análisis de regresión, se sustituye la relación

f(x_i)\approx y_i

por

f(x_i) = y_i + \varepsilon_i,

siendo el término de perturbación ε una variable aleatoria con media cero. Obśervese que estamos asumiendo que los valores x son exactos, y que todos los errores están en los valores y. De nuevo, distinguimos entre regresión lineal, en cuyo caso la función f es lineal para los parámetros a ser determinados (ej., f(x) = ax2 + bx + c), y regresión no lineal. Como antes, la regresión lineal es mucho más sencilla que la no lineal. (Es tentador pensar que la razón del nombre regresión lineal es que la gráfica de la función f(x) = ax + b es una línea. Ajustar una curva f(x) = ax2 + bx + c, estimando a, b y c por mínimos cuadrados es un ejemplo de regresión lineal porque el vector de estimadores mínimos cuadráticos de a, b y c es una transformación lineal del vector cuyos componentes son f(xi) + εi).

Los parámetros (a, b y c en el ejemplo anterior) se estiman con frecuencia mediante mínimos cuadrados: se toman aquellos valores que minimicen la suma S. El teorema de Gauss-Markov establece que los estimadores mínimos cuadráticos son óptimos en el sentido de que son los estimadores lineales insesgados de menor varianza, y por tanto de menor error cuadrático medio, si tomamos f(x) = ax + b estando a y b por determinar y con los términos de perturbación ε independientes y distribuidos idénticamente (véase el artículo si desea una explicación más detallada y con condiciones menos restrictivas sobre los términos de perturbación).

La estimación de mínimos cuadrados para modelos lineales es notoria por su falta de robustez frente a valores atípicos (outliers). Si la distribución de los atípicos es asimétrica, los estimadores pueden estar sesgados. En presencia de cualquier valor atípico, los estimadores mínimos cuadráticos son ineficientes y pueden serlo en extremo. Si aparecen valores atípicos en los datos, son más apropiados los métodos de regresión robusta.

[editar] Referencias

  • Abdi, H (2003): «[1] (2003). Least-squares.», en M. Lewis-Beck, A. Bryman, T. Futing (Eds): Encyclopedia for research methods for the social sciences. Thousand Oaks (CA): Sage. pp. 792-795..

[editar] Véase también

  • Regresión isotónica
  • Filtro de mínimos cuadrados promedio
  • Estimación de mínimos cuadrados de coeficientes para regresión lineal
  • Regresión lineal
  • Mínimos cuadrados móviles
  • Análisis de regresión
  • Regresión robusta
  • Valor eficaz
  • Mínimos cuadrados totales
  • Mínimos cuadrados ponderados
  • ANOVA

[editar] Enlaces externos

En inglés

En español



aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -