minimos cuadrados

22
Laboratorio de física 1 Introducción al método de mínimos cuadrados Interpolación y ajuste de curvas En ocasiones se tienen una serie de datos y se desconoce la función que los ha generado y se desea saber cuál es ésta. Lo primero que se debe hacer es graficar los puntos según sea el caso, para conocer su comportamiento y de esta forma decidir cuál método es más apropiado utilizar con fines predictivos. Existen varios métodos aquí nos dedicaremos únicamente a mínimos cuadrados. Ajuste para una recta La nube de puntos de una representación de datos en papel milimetrado nos permitía visualizar la relación entre dos variables x e y. Al representar el diagrama de dispersión de los datos podemos encontrar las siguientes situaciones: Distribuciones estadísticas para las que la nube de puntos se dispone de tal forma que existe una función matemática cuyos puntos son una parte de su representación gráfica. Sin coincidir exactamente sus puntos con las de una gráfica de una función matemática, se aproximan a ella con mayor o menor intensidad. La nube de puntos presenta un aspecto tal que no existe concentración de puntos hacia ninguna gráfica matemática, distribuyéndose de una forma uniforme en una región del plano. En el primer caso se dice que existe una dependencia funcional o exacta entre las variables x e y, es decir existe una función matemática tal que y = f(x). En el segundo caso se dice que existe una dependencia estadística o aproximadamente entre las dos variables, y2245f(x). Y en el último caso diríamos que las variables son independientes. Es el segundo caso del que se ocupa la teoría de la regresión. 1 L.R.H

Transcript of minimos cuadrados

Laboratorio de física 1

Introducción al método de mínimos cuadrados

Interpolación y ajuste de curvasEn ocasiones se tienen una serie de datos y se desconoce la función que los ha generado y se desea saber cuál es ésta. Lo primero que se debe hacer es graficar los puntos según sea el caso, para conocer su comportamiento y de esta forma decidir cuál método es más apropiado utilizar con fines predictivos. Existen varios métodos aquí nos dedicaremos únicamente a mínimos cuadrados.

Ajuste para una recta

La nube de puntos de una representación de datos en papel milimetrado nos permitía visualizar la relación entre dos variables x e y.

Al representar el diagrama de dispersión de los datos podemos encontrar las siguientes situaciones:

• Distribuciones estadísticas para las que la nube de puntos se dispone de tal forma que existe una función matemática cuyos puntos son una parte de su representación gráfica.

• Sin coincidir exactamente sus puntos con las de una gráfica de una función matemática, se aproximan a ella con mayor o menor intensidad.

• La nube de puntos presenta un aspecto tal que no existe concentración de puntos hacia ninguna gráfica matemática, distribuyéndose de una forma uniforme en una región del plano.

En el primer caso se dice que existe una dependencia funcional o exacta entre las variables x e y, es decir existe una función matemática tal que y = f(x). En el segundo caso se dice que existe una dependencia estadística o aproximadamente entre las dos variables, y≅f(x). Y en el último caso diríamos que las variables son independientes.

Es el segundo caso del que se ocupa la teoría de la regresión.

1 L.R.H

Laboratorio de física 1

Las técnicas de regresión tienen por objeto modelizar, es decir, encontrar una función que aproxime lo máximo posible la relación de dependencia estadística entre variables y predecir los valores de una de ellas: y (variable dependiente) a partir de los de la otra (o las otras): x(variables(s) independiente(s)). La regresión es lineal cuando el modelo función de regresión seleccionado es una recta. En cualquier otro caso se dice regresión no lineal.

El procedimiento será:

1. Elegir un tipo de función o curva que creamos que mejor relaciona las dos variables; esto lo podemos hacer observando la nube de puntos.

2. Obtener la ecuación de la curva, de entre las infinitas de dicho tipo que hay en el plano, que mejor se adapte al conjunto de puntos. El objetivo de obtener esa ecuación será predecir el valor de la variable y dado un valor x0

de la variable x.3. Obtener una medida del grado de esta asociación o correlación. Esto me

dará la fiabilidad de las predicciones que haga con esta ecuación.

El segundo punto del procedimiento se conoce como el problema del ajuste y se pueden emplear diferente métodos matemáticos para ello, tenemos:

• Método de los mínimos cuadrados.• Método de los polinomios ortogonales.• Método de los momentos.• Método de la curva logística.

Ajuste de curvas por mínimos cuadradosLa regresión por mínimos cuadrados, es una técnica cuyo objetivo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Algunas suposiciones estadísticas inherentes en los procedimientos por mínimos cuadrados lineales son:

1. Cada x tiene un valor fijo, no es aleatorio y es conocido sin error.2. Los valores y son valores aleatorios independientes y todos tienen la

misma varianza.3. Los valores de y para una x dada deben ser normalmente distribuidos.4. La regresión de y contra x no es la misma que la de x contra y.

Método de los mínimos cuadrados.

Dados los puntos (x1,y1), (x2,y2),...,(xn,yn), supongamos que hemos elegido una función y=f(x|a1,...,ar) que queremos ajustar a ese conjunto de puntos y en la que intervienen r parámetros (a1,...,ar). Consideramos la nube de puntos correspondiente:

2 L.R.H

Laboratorio de física 1

Para cada valor de x, (xi ) tenemos dos valores de y:

• El valor observado en la muestra (o en la nube de puntos ) yi.• Otro que denominamos teórico, yi

*, que se obtendría al sustituir x=xi en la función.

Como se puede observar, para cada xi tenemos una diferencia entre los dos valores de Y, que llamaremos residuo: εi = yi - yi

*.

El método de los mínimos cuadrados consiste en determinar los parámetros (a1,...,ar) de tal forma que los residuos sean mínimos. Es decir, buscaremos minimizar la expresión:

( ) ( )( )2

1 11

2*

1

2 ,...,∑ ∑∑= ==

−=−==Ψn

i

n

iriiii

n

ii aaxfyyyε

es decir, minimizamos la suma de las distancias verticales de los puntos a la curva.

La condición necesaria para obtener el mínimo es que las primeras derivadas parciales respecto a cada uno de los parámetros se anulen, es decir,

0.,.........0,021

=Ψ=Ψ=Ψ

raaa ∂∂

∂∂

∂∂

resolviendo este sistema, denominado sistema de ecuaciones normales, quedan determinados (a1,...,ar), así como la correspondiente función.

Modelo de regresión lineal simple

En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las variables es una recta, es decir y=b+mx, donde b,m son los parámetros. A esta recta la llamaremos recta de regresión de y sobre x.

3 L.R.H

Laboratorio de física 1

Vamos a deducir su ecuación usando el método de los mínimos cuadrados. Dado un valor de X, xi, tenemos los dos valores de Y, el observado, yi , y el teórico, yi

* = b + mxi. Así pues, hemos de minimizar:

( )( ) ( )∑∑==

−−=+−=Ψn

iii

n

iii mxbymxby

1

22

1

que derivando respecto a a y a m e igualando a cero:

( )

( )

=−−−=Ψ

=−−−=Ψ

02

02

ii

ii

iii

xmxbym

mxbyb

∂∂∂

que nos dará un sistema de dos ecuaciones normales y dos incógnitas (b,m). Resolviendo el sistema:

+=

+=

∑ ∑∑∑ ∑ ∑

i iii

iii

i i iii

xmxbyx

xmby

2)2(

)1(

Se obtiene así, un sistema de dos ecuaciones con dos incógnitas b y m cuya solución es

22

2

)2(

)1(

−=⇒

−=⇒

−= →+−=−⇒

∑∑

∑∑∑∑

∑∑

∑∑∑∑

ii

ii

ii

ii

iii

ii

ii

iii

ii

ii

ii

ii

xxN

xyyxNm

x

xmyxbde

N

xmybxmyNbde

de (1) tenemos el intercepto b:

( ) ∑∑∑ ∑∑∑

−=

22

2

xNx

xyxyxb

Expresiones más elaboradas nos permiten determinar el error de b, ∆b y el error de m, ∆m

4 L.R.H

Laboratorio de física 1

N

xmb

N

bmxy

xxN

Nm ii

iii

ii

ii

∑∑

∑∑∆=∆

−−=

=∆

22

22

2

)(σσ

La pendiente de la recta se escribirá b±∆b, y la ordenada en el origen m±∆m. Véase las reglas para expresar una medida y su error de una magnitud.

El coeficiente de correlación es otro parámetro para el estudio de una distribución bidimensional, que nos indica el grado de dependencia entre las variables X e Y. El coeficiente de correlación r es un número que se obtiene mediante la fórmula.

establece una medida del grado de asociación lineal entre la variable respuesta y la recta de regresión estimada.

El coeficiente de correlación puede valer cualquier número comprendido entre -1 y +1.

• Cuando r=1, la correlación lineal es perfecta, directa.• Cuando r=-1, la correlación lineal es perfecta, inversa• Cuando r=0, no existe correlación alguna, independencia total de los

valores X e Y

Como hacer el ajuste de mínimos cuadrados en Excel.

Lo primero es tener presente cuales son las ecuaciones para el ajuste, para esto las escribimos en nuestra hoja de cálculo.

5 L.R.H

( ) ( )

−=

∑ ∑∑ ∑

∑ ∑∑2222 11

iiii

iiii

yN

yxN

x

Nyx

yxr

Laboratorio de física 1

Ajuste lineal Pendiente Ordenada en origen

Parámetros de error en ajuste lineal

Error ordenada en origenError pendiente

Coeficiente de correlación

bmxy +=

( ) ∑−∑∑ ∑−∑= 22 xNx

xyNyxm( ) ∑−∑

∑ ∑∑−∑= 22

2

xNxxyxyxb

( ) 22

2

∑−∑=∆

xxNNm σ

( ) 22

22

∑−∑∑=∆

xxNxb σ

Nx

x∑ ∆=σ

Ny

y∑ ∆=σ 222

xy m σσσ +=

( ) ( )

∑ ∑−

∑ ∑−

∑ ∑∑ −=

2222 11 yN

yxN

x

Nyxxy

r

Ejemplo

Para visualizar este método tomaremos la simulación del movimiento de un proyectil el cual es lanzado con cierta inclinación respecto a la horizontal y bajo la acción solamente de la fuerza gravitatoria su trayectoria se mantiene en el plano vertical y es parabólica. Con el fin de mejorar la simulación se ha introducido un pequeño ruido para generar una nube de puntos con una cierta tendencia que nos permita hacer el ajuste correspondiente.

La interfaz devuelve los datos en un archivo que puede ser leído por cualquier paquete estadístico, para nuestro caso vamos a elegir la extensión del archivo como “*.xls” para ser leído en Excel.

Ahora podemos abrir el archivo generado con el programa Excel

6 L.R.H

Laboratorio de física 1

Hay algunas cosas que usted puede hacer a su hoja de cálculo para hacerla más fácil de leer. Esto ayudará considerablemente a su profesor en la evaluación de su informe de laboratorio y ayudará a encontrar posibles errores. Aquí discutimos algunos de los detalles que usted puede incluir para mejorar la apariencia de su hoja de cálculo.

Crear Títulos y Encabezados de Columna

Usted puede mover los contenidos de las celdas resaltando (seleccionando) las celdas deseadas. Luego con el ratón, haga clic en el borde de las celdas resaltadas y use el ratón para moverlas a un espacio no ocupado. Por ejemplo, aquí movimos los datos desde las celdas A1:C15 hacia A4:C18 como se muestra a la derecha.

Ahora tenemos espacio para agregar un título a nuestra tabla de datos. Debido a que estamos observando el movimiento de una esfera cuando es lanzada en el plano (x,y) con una velocidad inicial, simple titulamos la tabla de datos como "Movimiento en el plano x,y". Ponga este título en la celda B1. Necesitamos

7 L.R.H

Laboratorio de física 1

también encabezados de columna. En la celda B2 escriba "ti", en C2 “xi” y en D2 “yi”.

Agregar unidades a los encabezados

Los encabezados no contienen las unidades para los datos de las columnas. ¿la longitud significa 1 cm, 1m o 1pulgadas? Obviamente se necesitan las unidades. La mejor manera de hacer esto es poner las unidades entre paréntesis bajo el encabezado. Para mantener el encabezado y las unidades en la misma celda, primero escriba el encabezado y luego presione simultáneamente las teclas <ALT>+<ENTER>. Esto agregará una línea nueva dentro de la celda, permitiendo escribir las unidades debajo del encabezado.

8 L.R.H

Laboratorio de física 1

Creando un gráfico

Crear un gráfico en Microsoft Office Excel es rápido y sencillo. Excel proporciona una variedad de tipos de gráficos entre los que puede elegir. Para obtener más información acerca de los tipos de gráficos que puede utilizar, vea Tipos de gráficos disponibles.

1. Seleccione los datos que desea graficar en nuestro caso primero haremos la pareja de datos (x,t) y luego (y,t).

2. En la barra del menú, haga clic en el asistente para gráficos.

3. Una ventana Tipo de Gráfico (paso 1 de 4) se abrirá. Escoja la opción XY (Scatter),. No seleccione un subtipo que conecta los puntos con líneas o curvas suaves. Presione el botón.

4. Una ventana Datos Fuente para el Gráfico (paso 2 de 4) se abrirá. Haga clic en la pestaña Series ubicada cerca del tope de la ventana.

5. Luego haga clic en el botón Agregar, . Esto causará que cuadros de datos, como los mostrados aquí, aparezcan. Luego haga clic en el botón Cerrar Diálogo, , en el lado derecho del cuadro Valores X. Esto minimizará temporalmente la ventana de diálogo de manera que usted pueda seleccionar los valores-x que desea graficar en el eje horizontal.

6. Cuando la ventana de dialogo se achica, usted puede usar el ratón para seleccionar los valores de x que se incluirán en el eje horizontal. Note que cuando las celdas han sido seleccionadas, sus referencias aparecen en el cuadro de Valores-X. Cuando haya terminado haga clic en el botón Expandir Diálogo que devolverá la ventana de diálogo a su tamaño máximo.

9 L.R.H

Laboratorio de física 1

7. Haga clic en el botón Terminar Diálogo, , en el final derecho del cuadro de Valores Y y repita el procedimiento del Paso 7 para los valores y que se incluirán en el eje vertical

8. Una vista preliminar del gráfico debería aparecer en la ventana. Haga clic en el botón > Siguiente.

9. Una nueva ventana de para Opciones de Gráfico (paso 3 de 4) se abrirá. Aquí usted puede agregar un título y encabezados para los ejes del gráfico. Es importante que usted no se salte este paso, así que tómese un par de segundos para rellenar estos cuadros de texto con títulos descriptivos.

Cuando usted haya terminado, haga clic en el botón > Siguiente.

10 L.R.H

Laboratorio de física 1

10. Una nueva ventana de Ubicación del Gráfico (Paso 4 de 4) se abrirá. Aquí usted puede decidir donde ubicar su gráfico. Si usted quiere que el gráfico aparezca en su propia página, seleccione la opción: "Como una hoja nueva"

Si usted quiere que el gráfico aparezca en la misma página que sus datos, seleccione la opción: "Como un objeto en hoja 1"

11. Luego de hacer clic en el botón Finalizar, el gráfico en la misma página

que los datos (como se muestra abajo), o como una hoja nueva. 12.Una vista preliminar del gráfico debería aparecer en la ventana.

Como hacer el ajuste de mínimos cuadrados?

Debemos tener presente las formulas que nos permiten hacer el ajuste de la curva, por ejemplo para el calculo de la correlación.

Es necesario ir ordenando nuestros cálculos lo mas adecuado es trabajar en una hoja de calculo como Excel. En la siguiente tabla se muestra por ejemplo xi

2, para esto es necesario introducir una formula observe que se inicia con el signo igual en seguida se hace clic sobre las celdas que van a operar

11 L.R.H

( ) ( )

−=

∑ ∑∑ ∑

∑ ∑∑2222 11 x

Nxt

Nt

Ntx

txr

Laboratorio de física 1

C4*(multiplicada) C4. Las operaciones básicas se hacer con los siguientes operadores (+ suma,- resta,* multiplicación y,/ división).

Note que el resultado (0 cm2) se muestra en la celda F4. Podríamos repetir este proceso para cada valor de xi en la tabla e ingresar una nueva fórmula para cada uno. Sin embargo la mejor (y mas rápida) manera es primero activar la celda que se desea copiar y colocar el cursor en la esquina derecha de la celda hasta que salga una cruz, en este momento se tira la celda para abajo hasta la ultima celda en donde queremos copiar la formula.

Mostrar Fórmulas de Ejemplo

La hoja de cálculo está ahora en una forma que es fácil de leer, pero todavía podemos hacerla más fácil de ser evaluada por su profesor. Por ejemplo, podemos mostrar una ecuación de ejemplo para cada tipo de fórmula usada en la hoja de cálculo. Para hacer esto, desde la barra de fórmulas seleccione la ecuación que usted desea mostrar como texto, como se muestra a la derecha. Con la fórmula resaltada, haga clic en el Botón Copiar, , y luego presione la tecla <ENTER>. No se salte el último paso, usted debe presionar la tecla <ENTER>.

12 L.R.H

Laboratorio de física 1

Cuando se ha copiado la fórmula, haga clic en una celda vacía en donde usted desea que aparezca la ecuación. En dicha celda, escriba un apóstrofe ( ' ) el cual forzará que los contenidos de la celda aparezcan como texto. Luego pegue la fórmula haciendo clic en el Botón Pegar, .

Uso de Cifras Significativas Correctas

Por defecto la planilla muestra el número máximo de cifras decimales. Sin embargo, el número de decimales mostrados puede ser forzado en forma manual usando el Botón Incrementar Decimales, y el Botón Disminuir Decimales, , dependiendo de cada situación. Por ejemplo, la imagen a la derecha muestra como usar el Botón Disminuir Decimales para reducir el número de decimales en la respuesta.

En esta simulación tomaremos la incertidumbre en el tiempo como ±0,001s y para las medidas de distancia ±0,01cm entonces nuestra tabla de datos quedara de la siguiente forma:

Para facilitar el estudio del movimiento de un proyectil, este se descompone en movimiento horizontal y vertical.

Como se puede observar en las formulas en casi todas hay que calcular sumatorias. En el menú podemos ver el signo de sumatoria “∑” haciendo clic, automáticamente el programa indica en el cuadro las posibles celdas que intervienen en la sumatoria, permitiendo al usuario rectificar su escogencia.

13 L.R.H

Laboratorio de física 1

Movimiento horizontal del proyectil

Vamos a trabajar por el momento con el movimiento a lo largo del eje x. Para mejor claridad podemos colocar el símbolo ∑ en la celda derecha de donde se hace la operación para un mejor entendimiento de la tabla.

El paso a seguir es ahora hacer los cálculos con las formulas de ajuste lineal de mínimos cuadrados ya que nuestro grafico nos permite intuir que esa es la tendencia de la nube de puntos.

14 L.R.H

Laboratorio de física 1

Haciendo el calculo σ que hay que hacer una raíz cuadrada, veamos la formula.:

Terminando todos los cálculos tenemos:

15 L.R.H

Laboratorio de física 1

De manera que la recta buscada es

A continuación se presentan los valores de la yi medida, de la yi del modelo y del error en la aproximación:

Lo cual puede apreciarse gráficamente:

16 L.R.H

38,16324,85 −= tx

Laboratorio de física 1

Aproximación por polinomios de grado m

Calculemos ahora la mejor aproximación de un conjunto de valores experimentales ( ) ( ) ( )NN yxyxyx ,,...,,,, 2211 por un polinomio de grado m. Podemos expresar la relación entre ambas magnitudes de la siguiente forma:

011

1 ... axaxaxay mm

mm ++++= −

en donde los mja j ,...,1,0 = son los coeficientes del polinomio, o sea, los valores que deseamos hallar.

Procedamos de la misma manera que en el caso anterior.

17 L.R.H

Laboratorio de física 1

Ahora, la distancia de cada punto del gráfico al polinomio tendrá la expresión ii

mim

mimi yaxaxaxa −++++= −

− 011

1 ...ε . Nuevamente calculemos la suma de las distancias de cada punto del gráfico al polinomio elevada al cuadrado, que nos da una idea de cuan cerca esta el polinomio de los datos experimentales. La misma estará dada por la siguiente expresión:

( )∑∑=

−−

=−++++==

N

iii

mim

mim

N

ii yaxaxaxaE

1

2

011

11

2 ...ε

Observemos que la desviación cuadrática de los puntos respecto al polinomio es una función del polinomio, cada polinomio (o sea cada conjunto de coeficientes mja j ,...,1,0 = ) genera distancias de cada punto a dicho polinomio y por ende un valor de su suma al cuadrado. Lo que deseamos obtener es del polinomio (o sea el conjunto de coeficientes mja j ,...,1,0 = ) que minimice dicha función, o sea, obtener el polinomio de grado m que, en cierto sentido, esté más cerca de los puntos experimentales.

En los casos anteriores, cuando teníamos rectas pasan por el origen, la función E dependía de una sola variable, a, y encontrar el valor que la minimizaba fue una tarea sencilla; luego, para rectas generales la función E dependía de dos variables, a y b, y encontrar los valores que la minimizaba fue un poco más complicado. En este caso general, la función E depende de m+1 variables mja j ,...,1,0 = y debemos encontrar el conjunto de valores que la minimizan. El trabajo actual es un poco más complicado, aunque es una simple generalización del procedimiento anterior al caso de m+1 variables. Para lograr dicho objetivo, debemos imponer la siguiente condición de extremo:

( )

( )

( )

=∂

=∂

=∂

0,,...,,

:

0,,...,,

0,,...,,

011

1

011

0

011

m

mm

mm

mm

aaaaa E

aaaaa E

aaaaa E

Calculando dichas derivadas parciales de la expresión de E como función las m+1 variables mja j ,...,1,0 = , obtenemos:

18 L.R.H

Laboratorio de física 1

( )

( )

( )

( )∑

=

−−

=

−−

=

−−

=

−−

−++++=∂∂=

−++++=∂∂=

−++++=∂∂=

−++++=∂∂=

n

i

miii

mim

mim

m

n

i

jiii

mim

mim

j

N

iiii

mim

mim

N

iii

mim

mim

xyaxaxaxaaE

xyaxaxaxaaE

xyaxaxaxaaE

yaxaxaxaaE

101

11

101

11

101

11

1

101

11

0

)(...20

:

)(...20

:

)(...20

...20

Dichas ecuaciones pueden ser rescritas de la siguiente manera:

∑∑∑∑∑

∑∑∑∑∑

∑∑∑∑∑

∑∑∑∑∑

==

+

=

+−−

=

+

=

==

+

=

+−−

=

+

=

===−

=

+

=

===

−−

==

++++=

++++=

++++=

+⋅++⋅+=

N

i

mi

N

i

mi

N

i

mmim

N

i

jmim

N

i

mii

N

i

ji

N

i

ji

N

i

jmim

N

i

jmim

N

i

jii

N

ii

N

ii

N

i

mim

N

i

mim

N

iii

N

i

N

ii

N

i

min

N

i

min

N

ii

xaxaxaxaxy

xaxaxaxaxy

xaxaxaxaxy

axaxaxay

10

1

11

1

11

11

10

1

11

1

11

11

10

1

21

11

1

1

1

10

11

1

11

11

...

:

...

:

...

1...

O, para ganar claridad pueden ser escritas en forma matricial de la siguiente manera.

=

∑∑∑∑

∑∑∑∑

∑∑∑∑

∑∑∑∑

=

=

=

=

==

+

=

+

=

=

+

===

=

+

===

====

N

i

mii

N

iii

N

iii

N

iii

mN

i

mi

N

i

mi

N

i

mi

N

i

mi

N

i

mi

N

ii

N

ii

N

ii

N

i

mi

n

ii

N

ii

N

ii

N

i

mi

N

ii

N

ii

N

ii

xy

xy

xy

xy

a

aaa

xxxx

xxxx

xxxx

xxxx

1

1

2

1

1

1

0

2

1

0

1

2

1

2

1

1

1

1

2

1

4

1

3

1

2

1

1

1

3

1

2

1

1

11

2

1

1

1

0

Por lo tanto, la solución del sistema es

19 L.R.H

Laboratorio de física 1

=

∑∑∑∑

∑∑∑∑

∑∑∑∑

∑∑∑∑

=

=

=

=

==

+

=

+

=

=

+

===

=

+

===

====

N

i

mii

N

iii

N

iii

N

iii

N

i

mi

N

i

mi

N

i

mi

N

i

mi

N

i

mi

N

ii

N

ii

N

ii

N

i

mi

n

ii

N

ii

N

ii

N

i

mi

N

ii

N

ii

N

ii

m

xy

xy

xy

xy

xxxx

xxxx

xxxx

xxxx

Inv

a

aaa

1

1

2

1

1

1

0

1

2

1

2

1

1

1

1

2

1

4

1

3

1

2

1

1

1

3

1

2

1

1

11

2

1

1

1

0

2

1

0

En donde Inv [A] significa la matriz inversa de A. En conclusión hemos encontrado el conjunto de coeficientes mja j ,...,1,0 = del polinomio de grado m de la forma 01

11 ... axaxaxay m

mm

m ++++= −− que mejor aproxima los datos

experimentales. Llegamos a la conclusión los coeficientes del polinomio de que minimiza la suma de las distancias al cuadrado de los valores experimentales al polinomio (el polinomio que en cierto modo más se aproxima a los valores experimentales) tienen las expresiones anteriormente calculadas.

Aproximación por familias arbitrarias de funciones

En todos los ejemplos anteriores procuramos aproximar un conjunto de datos experimentales ( ) ( ) ( )NN yxyxyx ,,...,,,, 2211 por una recta o polinomio. En definitiva, teníamos un conjunto de posibles rectas o polinomios parametrizados por un conjunto de parámetros. Por ejemplo a es el parámetro que describe las rectas que pasan por el origen; a y b es el conjunto de parámetros que describen las rectas generales, y los coeficientes de los polinomios son los parámetros que describen a los polinomios.

En caso general, uno puede tener una familia de funciones f que dependen de varios parámetros mααα ,...,, 21 reales:

( )xfmααα ,...,2,1

y desea encontrar entre dicha familia de funciones la que mejor aproxima los datos experimentales.

El método de mínimos cuadrados es aplicable en dicha situación. Para ello uno debe considerar las distancias ( ) iii yxf −= ε de los puntos experimentales a la curva de ajuste. Nuevamente consideramos la suma de todas las distancias elevadas al cuadrado:

( )( )∑∑==

−==N

iii

N

ii yxfE

1

2

1

20 L.R.H

Laboratorio de física 1

La que resulta una función de los parámetros mααα ,...,, 21 , ya que para cada conjunto de parámetros obtenemos una función f y por ende un conjunto de distancias iε . Entonces E resulta ser una función de los parámetros

mααα ,...,, 21 o sea ( )mE ααα ,...,, 21 .

El método de mínimos cuadrados consiste en minimizar E, por lo que se debe hacer es imponer la siguiente condición de extremo:

( )

( )

=∂

=∂

0,...,,

:

0,...,,

21

1

21

m

m

m

E

E

αααα

αααα

Obtenemos la solución del problema (los parámetros mααα ,...,, 21 ) al resolver dicho sistema. Además hay que asegurarse de obtener una solución que corresponda efectivamente a un mínimo de E.

La dificultad radica en que generalmente el sistema anterior es un sistema muy complicado de resolver, por lo general no lineal. Afortunadamente disponemos de muchos métodos numéricos para obtener una solución aproximada del mismo.

Mínimos cuadrados ponderados

En todos los ejemplos anteriores calculamos las distancias de los datos experimentales iε a una familia de rectas, polinomios o curvas que dependían de ciertos parámetros. Seguidamente sumamos todas las distancias elevadas al cuadrados, y al resultado lo llamamos E. Luego encontramos los parámetros de las rectas o curvas que minimizaban dicha expresión.

Hay situaciones en las que no todos los datos tienen la misma importancia en el cálculo de E. Un ejemplo es cuando hay más incertidumbre asociada a una medición que a las demás. En ese caso uno puede desear que dicha medición tenga menos importancia en el momento de aproximar los datos por rectas o curvas que las restantes. Un posible procedimiento a seguir es el siguiente.

A cada medición se le asocia un peso iw . Típicamente, se le suele asociar a cada medición un peso que sea inversamente proporcional a la incertidumbre

asociada a dicha medida elevada al cuadrado ( ) 21

ii y

w∆

= , aunque otras

elecciones son posibles.

En la definición de E, tenemos en cuenta dicho peso:

∑=

=N

iii wE

1

21 L.R.H

Laboratorio de física 1

El resto del procedimiento es exactamente igual al de los casos anteriores, o sea minimizamos la expresión obtenida para E, teniendo en cuenta los factores

iw . Observemos que el desarrollo de E es análogo al caso anterior con la diferencia que cada sumando queda multiplicado por el factor de peso iw . O

sea, cada vez que tenemos una sumatoria del tipo ∑=

N

ii

1

.... la misma se

transformará a una suma del tipo i

N

ii w∑

= 1

.... .

Como ejemplo, para el caso de las rectas del tipo forma axy = obtenemos

=

== N

iii

N

iiii

xw

yxwa

1

2

1

Para el caso de las rectas del tipo forma baxy += obtenemos:(cabe observar que el factor N en las fórmulas anteriores provenía de hacer

∑=

=N

iN

11 y en los nuevos cálculos se transforma en ∑

=

N

iiw

1)

2

11

2

1

1111

=

∑∑∑

∑∑∑∑

===

====

N

iii

N

iii

N

ii

N

iii

N

iii

N

iiii

N

ii

xwxww

xwywyxwwa

2

11

2

1

111

2

1

=

∑∑∑

∑∑∑∑

===

====

N

iii

N

iii

N

ii

N

iii

N

iiii

N

iii

N

iii

xwxww

xwyxwxwywb

Los métodos y resultados en los demás casos son análogos.

22 L.R.H