Estimación de la rentabilidad del salario de acuerdo a su nivel de educación: pregrado vs...

20
ECONOMETRÍA 1, UNIVERSIDAD EAFIT Estimación de la rentabilidad del salario de acuerdo a su nivel de educación: pregrado vs maestría Tomas Escorcia Vásquez, Eduardo Latorre Uribe, Alejandro Hernández Rengifo. Noviembre, 2014. Resumen En el presente trabajo se tiene como objetivo analizar los rendimientos que obtienen los estudiantes de pregrado frente a los profesionales que realizan una maestría, tomando como referencia las ecuaciones de ingresos de Mincer. El estudio se lleva a cabo con microdatos obtenidos del Observatorio Laboral del Ministerio de Educación Nacional, filtrando nuestras principales variables de estudio, luego estimamos nuestro modelo con el software econométrico STATA y analizamos los resultados. En el análisis se profundiza una serie de rasgos básicos de los individuos de la muestra, los más significativos son: el sexo, el nivel de estudios, la edad, la experiencia, origen de la Institución de Educación (carácter de la universidad). Palabras clave: MCO, salarios, educación, ecuación de mincer, rentabilidad, retornos, STATA.

Transcript of Estimación de la rentabilidad del salario de acuerdo a su nivel de educación: pregrado vs...

ECONOMETRÍA 1, UNIVERSIDAD EAFIT

Estimación de la rentabilidad del salario de acuerdo a su nivel de

educación: pregrado vs maestría

Tomas Escorcia Vásquez, Eduardo Latorre Uribe, Alejandro Hernández Rengifo.

Noviembre, 2014.

Resumen

En el presente trabajo se tiene como objetivo analizar los rendimientos que obtienen los

estudiantes de pregrado frente a los profesionales que realizan una maestría, tomando

como referencia las ecuaciones de ingresos de Mincer. El estudio se lleva a cabo con

microdatos obtenidos del Observatorio Laboral del Ministerio de Educación Nacional,

filtrando nuestras principales variables de estudio, luego estimamos nuestro modelo con

el software econométrico STATA y analizamos los resultados. En el análisis se profundiza

una serie de rasgos básicos de los individuos de la muestra, los más significativos son: el

sexo, el nivel de estudios, la edad, la experiencia, origen de la Institución de Educación

(carácter de la universidad).

Palabras clave: MCO, salarios, educación, ecuación de mincer, rentabilidad, retornos,

STATA.

2

1. Introducción

La rentabilidad o beneficios proporcionados por la educación es un tema de especial

atención en las decisiones de las personas quienes enfrentan una gran disyuntiva, entre

si realizar una inversión de seguir estudiando o no realizar gastos en educación por su

falta de rentabilidad, como ven esta decisión a la vez implica una situación de costo de

oportunidad debatido en la economía. La parte teoría existente en su mayor parte

consideran que la educación es vista como una de inversión que aumenta la

probabilidad de que una persona devengue salarios mucho mayores.

En la revisión de la literatura, se ha encontrado que aparte del nivel de educación, existen

ciertas características como el sexo, la edad, la experiencia y hasta el carácter u origen

de la educación influye y puede ser trascendental para que una persona obtenga un

trabajo que sea estable y bien remunerado.

Este trabajo detalla y aplica la metodología utilizada en la literatura sobre rendimientos y

rentabilidad de la educación de acuerdo a su nivel de educación completado; teniendo en

cuenta la “ecuación de ingresos de Mincer”, poniendo especial interés en las diferencias

de las tasas de retorno según el nivel de educación (técnica, tecnológica, universidad,

maestría y doctorado) y experiencia.

Nuestra principal razón radica en la necesidad de comprobar si el modelo es un reflejo de

la realidad, en que muchas empresas toman como aumento del capital humano mayores

salarios para quienes tienen mayor nivel de educación, además como una guía para

nuestras vidas en el proceder a obtener una maestría o no, de acuerdo a su rentabilidad.

El trabajo se estructura en 7 apartados, incluyendo la introducción como primer punto. En

el segundo punto, se realiza una revisión del marco teórico y metodológico de las

ecuaciones de ingresos de Mincer y Mínimo Cuadrado Ordinarios. En el tercero se

describen las especificaciones del modelo, la procedencia de los datos, la explicación de

sus principales variables y las principales características de la base de datos a utilizar. En

el cuarto se exponen los resultados de la estimación de los efectos de la educación y la

experiencia laboral en las rentas y salarios de los jóvenes. Antes de dar por terminado el

trabajo, se exponen las conclusiones. Para finalmente dar como terminado el trabajo con

bibliografía y anexos.

2. Metodología

En el siguiente apartado se indican los métodos aplicados en la literatura para la

estimación del salario y su rentabilidad dada su experiencia, nivel de educación. Este

modelo lo trabajamos con el tema de mínimos cuadrados ordinarios y la Ecuación de

Mincer. Aquí una breve explicación de la literatura:

2.1 La Ecuación de Mincer:

3

El instrumento práctico mas utilizada y conocida para tratar y analizar estos datos ha sido

la ecuación minceriana de ingresos (Mincer, 1974), a través de la cual se estiman el

efecto de un nivel adicional de estudios en las rentas laborales de las personas. La

ecuación tradicional de Mincer, se estima por mínimos cuadrados ordinarios (MCO) un

modelo semilogarítmico, usando como variable dependiente el logaritmo del salario y

como variables independientes los años o nivel de educación, la experiencia laboral y el

cuadrado de ésta. Se utiliza un modelo semilogarítmico a fin de tener los cambios

porcentuales sobre el ingreso debido a cambios de nivel en las variables explicativas.

Asimismo, la transformación logarítmica es útil para reducir los efectos de las

observaciones atípicas. Los datos utilizados para su estimación provienen

tradicionalmente de datos transversales. (ecuación 1).

Donde:

Y = son los ingresos del individuo.

S = es el número de años de educación formal completada

Exp = son los años de experiencia laboral

Exp2 = son los años de experiencia laboral al cuadrado

ε= término de perturbación aleatoria que se distribuye según una Normal (0,𝜎ℇ2)

Conforme al modelo de ecuación de Mincer, Álvarez, & Seoane (2010), opinan que el

valor del coeficiente de los años de educación formal se explican como la tasa de

rendimiento media de un año adicional de estudio poseído por los trabajadores. Por otro

lado, y teniendo en cuenta la teoría de los perfiles de edad-ingresos (conforme aumenta

la experiencia, los ingresos individuales aumentan, pero cada año de experiencia tiene

un efecto sobre los ingresos menor que el anterior), se espera que al ser la función

cóncava con relación a la experiencia, la estimación de β2 sea positiva y la de β3 sea

negativa.

Esta ecuación ha sido utilizada en muchas aplicaciones y estudios debido a su disposición

de aplicación para proporcionar resultados acertados.

De acuerdo con Griliches (1977), los rendimiento de la educación estimado por MCO

(ecuación minceriana de ingresos) existían varios sesgos, identificando lo siguiente:

a) Existencia de determinadas variables omitidas en la ecuación de Mincer como la

habilidad del individuo. Si el término de perturbación incluye entre otros elementos la

habilidad del individuo, y se cumple que las personas con mayor habilidad son las que

deciden elegir el mayor nivel educativo, esto provocaría estimaciones inconsistentes.

b) Medición incorrecta de la cantidad de educación. La ecuación de Mincer implica que

existe una única tasa de rendimiento de la educación, sin embargo, tanto la teoría como

la evidencia empírica lo contradicen, sugiriendo representar la escolaridad en forma más

4

desagregada y flexible, con el objetivo de recoger de una forma más adecuada los

retornos al proceso de inversión en educación.

c) Tratamiento de la educación como una variable exógena. Diversos estudios han

demostrado que la variable educación puede no ser exógena estando afectada por

diferentes variables como puede ser los costes directos de la educación, los costes de

oportunidad, los ingresos futuros, las imperfecciones del mercado de capitales o incluso

la importancia del motivo consumo. El no considerar la endogeneidad de la educación

producirá que las estimaciones realizadas por la técnica de MCO proporcione

estimadores sesgados e inconsistentes del rendimiento de la educación.

Sapelli (2003), para la formulación del modelo nos explica lo siguiente “En la formulación

de 1958 del propio Mincer, implica que la escolaridad puede ser bien capturada con una

única variable en la ecuación del ingreso, y el coeficiente asociado representar una única

tasa de retorno a la educación. Sin embargo, tanto la teoría como la evidencia empírica

parecen contradecir esta propuesta y sugieren representar la escolaridad en forma más

desagregada y flexible, de manera de capturar en forma más adecuada el proceso de

inversión en educación. se abocará a avanzar todo lo posible hacia una mejor

caracterización de la escolaridad con sucesivas desagregaciones. Esto nos permitirá

contrastar los distintos resultados obtenidos e identificar, bajo nuestro análisis, los costos

de imponer a la fuerza la estructura de Mincer”.

2.2 Mínimos Cuadrados ordinarios

Según Greenberg, el método de mínimos cuadrados ordinarios consiste en que dado n

observaciones (o casos), (x1i, x2i,…, xpi, yi) con i = 1,…, n. decimos que el i-ésimo residual

sería:

El método de mínimos cuadrados ordinarios determina valores, bj, como estimador de βj

para poder minimizar la suma delos residuales al cuadrado. La función de regresión

estimada (el valor esperado) para el yi estimado y el residual estimado es:

Existen dos ventajas esenciales en este modelo. El primero es computacional, ya que el

método sólo requiere la solución de un sistema de ecuaciones lineales. El segundo es

estadístico, aquí los estimados poseen un grupo de propiedades. En particular los bj son

estimaciones insesgadas de βj los cuales tienen una varianza muy mínima entre los

5

estimadores insesgados. Ahora si asumimos normalidad, nos permite hacer inferencias

simples en el βj. El valor estimado de σ2 también es insesgado y tiene varianza mínima.

2.3 Modelo

En nuestro modelo además de logaritmo natural del salario, número de años de

educación formal completada, experiencia y experiencia cuadrado de la ecuación de

Mincer; se utiliza otras variables adicionales para mejorar nuestra estimación como: la

variable dummy mujer, la variable dummy Origen de la institución de educación(oficial o

privada) y una desagregación del nivel de formación (maestría, doctorado, formación

técnica profesional, tecnológica Universitaria). Cuando se usan estas categorías

educativas, el modelo queda especificado como sigue:

𝐿𝑛(𝑠𝑎𝑙𝑎𝑟𝑖𝑜) = 𝛽𝑜 + 𝛽1(𝑒𝑥𝑝𝑒𝑟) + 𝛽2(𝑒𝑥𝑝𝑒𝑟2) + 𝛽3(𝑖𝑛𝑠𝑡. 𝑝𝑟𝑖𝑣𝑎𝑑𝑎) + 𝛽4(𝑒𝑑𝑢. 𝑡𝑒𝑐𝑛𝑖)

+ 𝛽4(𝑡𝑒𝑐𝑛𝑜𝑙) + 𝛽5(𝑚𝑎𝑒𝑠𝑡𝑟) + 𝛽6(𝑑𝑜𝑐𝑡𝑜) + 𝛽7(𝑚𝑢𝑗𝑒𝑟)

2.4 Procesamiento del modelo

Se va a trabajar primero verificando si el modelo tiene multicolinealidad por medio del

comando “collin” en STATA. Luego se va a verificar heterocedasticidad del modelo por

medio de heterocedasticidad multiplicativa y si no se puede solucionar se procederá a

trabajar con la prueba de White robusta. Por último se procederá a verificar la normalidad

de los residuales y se demostrará a través de los graficos de kernel y de histograma de

frecuencia.

3. Datos

Los datos fueron obtenidos del Observatorio Laboral para la Educación del Ministerio de

Educación Nacional.

El Observatorio Laboral es un sistema de información especializado para el análisis de la

pertinencia en la educación superior a partir del seguimiento a los graduados del país y

su empleabilidad en el mercado laboral colombiano.

Este sistema de información hace parte del portafolio de productos del Ministerio de

Educación Nacional al servicio de la comunidad. Al interior del módulo de consulta del

Observatorio Laboral encontrará información acerca de:

o Oferta de graduados

o Perfil de los graduados

o Ingreso mensual promedio

o Vinculación al sector formal de la economía

El Observatorio Laboral para la Educación pone a su disposición un sistema de

información que le permite obtener la caracterización académica (Perfil Graduados) y de

mercado laboral (Situación Laboral) de 2.261.294 titulados del país en el periodo 2001-

2012. Se puede construir estos perfiles a través de características como: nivel de

6

formación del graduado, ubicación geográfica, origen de la institución en la que estudió,

su ingreso base de cotización al sistema de seguridad social, tasa de cotización, entre

otras.

3.1 Diseño de la muestra

En este trabajo nos centramos en el estudio de las características básicas de las

personas con niveles de educación de superior. Presentando especial interés en la

relación existente entre la educación y los salarios, con el fin de obtener y analizar los

resultados que nos ayuden a entender mejor cuál es el verdadero valor agregado de la

educación.

Genero: M Hombre, F Mujer

Experiencia: Año de graduación de pregrado-Año en que fue tomada la muestra

Universo: Población con estudios de educación de nivel superior.

Población asalariada; niveles de educación: técnicas, tecnológicos, pregrado, maestría y

doctorados.

Tamaño muestral: 219.937 personas.

Origen de la Institución de Educación: 1 Oficial, 2 Privada

Nivel de Formación

1 Especialización

2 Maestría

3 Doctorado

4 Formación técnica profesional

5 Tecnológica

6 Universitaria

Ingreso : Ingreso Base de Cotización.

Fuente: Base laboral del 2001 al 2011, Observatorio Laboral del Ministerio de Educación

Nacional.

Ecuación de salario

Variable dependiente:

Logaritmo natural del salario, Ln

(salario)

Logaritmo natural del salario mensual para cada

individuo.

Variables independientes:

Experiencia Años de experiencia: Año de graduación de

pregrado-Año en que fue tomada la muestra

Experiencia cuadrado Años de experiencia al cuadrado

Institución privada Variable dummy institución

7

Educación técnica Variable dummy técnica

Tecnológico Variable dummy tecnológico

Maestría Variable dummy maestría

Doctorado Variable dummy doctorado

Mujer Variable dummy mujer

4. Resultados

Al cargar nuestros datos al software STATA, lo primero que quisimos estudiar fue la

estadística descriptiva básica de los datos y analizar que había en cada uno de los datos

para las variables caso de estudio.

lnsalario float %9.0g LN SALARIO

ingresobc long %12.0g INGRESOBC

doctorado byte %8.0g DOCTORADO

maestria byte %8.0g MAESTRIA

pregrado byte %8.0g PREGRADO

tecnologico byte %8.0g TECNOLOGICO

educaciontecn~a byte %8.0g EDUCACION TECNICA

institucionpr~a byte %8.0g INSTITUCION PRIVADA

experiencia2 int %8.0g EXPERIENCIA^2

experiencia byte %8.0g EXPERIENCIA

aniogrado int %8.0g ANIO GRADO

mujer byte %8.0g MUJER

fechanacimiento str10 %10s FECHANACIMIENTO

individuo long %12.0g Individuo

variable name type format label variable label

storage display value

size: 7,477,858

vars: 14

obs: 219,937

Contains data

. describe

8

Figura 1: Estadística descriptiva de los datos.

En la Figura 1 se puede observar una muestra lo bastante grande para realizar nuestro

estudio, ya que contamos con 219.937 individuos los cuales son personas con

experiencia entre 3 y 13 años. En la muestra encontramos personas con salarios entre

$535.600 pesos y $13.400.000 pesos con una media de $1.608.742. Nuestro logaritmo

natural del salario por hora sería lo que una persona se estaría ganando por hora y

encontramos una media de $14.087 con un intervalo entre $13.191 y $16.410. Las otras

variables son tomadas como variables dummy.

Con estas observaciones básicas, nos podemos hacer una idea de los datos con los que

se va a trabajar, es decir, se conocen los datos y se empiezan a tomar hipótesis y

conjeturas sobre ellos.

A continuación, se realizó la regresión en STATA y se obtuvo los resultados determinados

en la Figura 2.

mujer 219937 .5448287 .4979875 0 1

doctorado 219937 .001114 .0333575 0 1

maestria 219937 .0349918 .1837595 0 1

tecnologico 219937 .146451 .3535586 0 1

educaciont~a 219937 .0603718 .238175 0 1

institucio~a 219937 .5811028 .4933796 0 1

experiencia2 219937 27.50735 17.5949 9 169

experiencia 219937 5.044613 1.435007 3 13

Variable Obs Mean Std. Dev. Min Max

. summarize experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer

Total 83851.2988219936 .381253177 Root MSE = .56992

Adj R-squared = 0.1481

Residual 71434.4984219928 .324808566 R-squared = 0.1481

Model 12416.8004 8 1552.10004 Prob > F = 0.0000

F( 8,219928) = 4778.51

Source SS df MS Number of obs = 219937

9

Figura 2. Regresión

Todas las variables son individualmente significativas, ya que presentan un p-valor muy

cercano a 0 y menor a 0.05.

El coeficiente de determinación es 0,1481, una cifra bastante satisfactoria para una

ecuación de mincer. Como explica Wooldridge (2006), “Que una R-cuadrada sea

pequeña, implica que la varianza del error es relativamente grande en relación con la

varianza de y, lo cual significa que es posible que sea difícil estimar con precisión las 𝛽𝑗.

Pero recuerde que una varianza grande del error puede ser contrarrestada con un tamaño

de muestra grande: si se tienen suficientes datos, es posible que se puedan estimar con

precisión los efectos parciales, aun cuando no se hayan controlado muchos de los

factores no observados. El que se puedan o no obtener estimaciones suficientemente

precisas depende de la aplicación (pag.199)”.

Como se puede observar en nuestra regresión lineal la experiencia aumenta en un once

por ciento el aumento de nuestro salario, al igual lo hace si la persona estudia o termino

sus estudios en una universidad de carácter privado, en la cual se da un aumento

significativo del diez por ciento en el que se aumenta su salario. Posteriormente la

maestría y el doctorado aumentan respectivamente en un 65% y un 115% lo cual es muy

relevante el hacer estudios posteriores al pregrado.

Es de especial atención que las mujeres ganan un 14% menos que los hombres, lo cual

deja ver una clara discriminación salarial acorde al género.

4.1. Multicolinealidad

Es de precisar que hay que tener presente que se requiere no tener una linealidad

perfecta entre los regresores o predictores o , para de esa manera , no encontrarnos con

problemas de multicolinealidad entre los regresores y no estén tan estrechamente

relacionados los unos con los otros que no den lugar a estimaciones imprecisas e

inestables, por lo que se utiliza el test de de VIF (Variance Inflation Factor) el cual mide

la inflación del error en la varianza para detectar multicolinealidad, a un valor mayor a 10

podrá presentarse indicios de colinealidad y con un número de condición mayor a 30. En

la Figura 3 se puede ver el VIF y el número de condición para este ejercicio:

_cons 13.67278 .0103502 1321.02 0.000 13.6525 13.69307

mujer -.1402015 .0024451 -57.34 0.000 -.1449939 -.1354092

doctorado 1.156384 .0364566 31.72 0.000 1.08493 1.227838

maestria .6492735 .0066567 97.54 0.000 .6362265 .6623204

tecnologico -.3054449 .0034797 -87.78 0.000 -.3122651 -.2986248

educaciontecnica -.4620026 .0051755 -89.27 0.000 -.4721465 -.4518587

institucionprivada .1021126 .0024901 41.01 0.000 .0972321 .1069931

experiencia2 -.0034115 .0002802 -12.18 0.000 -.0039606 -.0028623

experiencia .1137287 .0034357 33.10 0.000 .1069948 .1204627

lnsalario Coef. Std. Err. t P>|t| [95% Conf. Interval]

10

Figura 3. Test para multicolinealidad, VIF

En este caso el VIF global o la media de este es de 4.88, por lo que no se encuentran

problemas de multicolinealidad, dado no que supera un valor mayor a 10.

Pero el número de condición nos da 38.2634, que es mayor a 30, lo cual nos indica

problemas de multicolinealidad. Esto se debe a la relación existente entre experiencia y

experiencia2. Aunque estas variables muestran multicolinealidad, ambas son relevantes

para el modelo y por ende no se debe omitir ninguna de ellas. Esto se debe a que causaría

un error de especificación.

(obs=219937)

. collin experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer

. *VERIFICAMOS EXISTENCIA DE MULTICOLINEALIDAD

Mean VIF 4.88

----------------------------------------------------

mujer 1.00 1.00 0.9961 0.0039

doctorado 1.00 1.00 0.9986 0.0014

maestria 1.01 1.01 0.9870 0.0130

tecnologico 1.02 1.01 0.9757 0.0243

educaciontecnica 1.03 1.01 0.9719 0.0281

institucionprivada 1.02 1.01 0.9785 0.0215

experiencia2 16.45 4.06 0.0608 0.9392

experiencia 16.46 4.06 0.0608 0.9392

----------------------------------------------------

Variable VIF VIF Tolerance Squared

SQRT R-

Collinearity Diagnostics

Det(correlation matrix) 0.0580

Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept)

Condition Number 38.2634

---------------------------------

9 0.0029 38.2634

8 0.1155 6.1052

7 0.3956 3.2995

6 0.4299 3.1651

5 0.7368 2.4177

4 1.0000 2.0752

3 1.0004 2.0748

2 1.0126 2.0623

1 4.3064 1.0000

---------------------------------

Eigenval Index

Cond

11

4.2. Homocedasticidad - Heterocedasticidad

Lo que buscamos es verificar que la varianza de los residuales es homogénea, es decir,

que existe homocedasticidad. Una forma de revisar este supuesto puede ser Utilizando

el test de Breusch-Pagan:

Figura 4. Test de Breush- Pagan

Dado que tenemos problemas de heterocedasticidad hacemos heterocedasticidad

multiplicativa y obtenemos:

# unadjusted p-values

simultaneous 4214.94 8 0.0000

mujer 789.03 1 0.0000 #

doctorado 19.88 1 0.0000 #

maestria 467.34 1 0.0000 #

tecnologico 905.63 1 0.0000 #

educaciont~a 743.42 1 0.0000 #

institucio~a 83.43 1 0.0000 #

experiencia2 833.65 1 0.0000 #

experiencia 964.23 1 0.0000 #

Variable chi2 df p

Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

. generate double luhatsq = log(uhatsq)

. generate double uhatsq = uhat^2

. predict double uhat, resid

. quietly regress lnsalario experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer

. *HETEROCEDASTICIDAD MULTIPLICATIVA

. *MINIMOS CUADRADOS GENERALIZADOS FACTIBLES

12

Vela F. (2010), nos explica que con bastante regularidad los datos no se ajustan a las

condiciones idealizadas del modelo de regresión lineal clasico. Asi, por ejemplo, es

frecuente encontrar errores heterocedasticos, particularmente en datos de conrte

transversal. Una razon de ello radica en que la varianza de la variable dependiente

raramente se mantiene constante cuando el nivel de una o mas variables explicativas

aumenta o disminuye.

Luego, procedemos a tirar la regresión con heterocedasticidad por medio de

heterocedasticidad multiplicativa:

reg lnsalario1 experiencia1 experiencia21 institucionprivada1 educaciontecnica1

tecnologico1 maestria1 doctorado1 mujer1 cte1

_cons -2.788272 .0397477 -70.15 0.000 -2.866177 -2.710368

mujer -.1397595 .0093899 -14.88 0.000 -.1581634 -.1213555

doctorado -1.207006 .1400044 -8.62 0.000 -1.481411 -.9326011

maestria .0037073 .0255637 0.15 0.885 -.0463969 .0538114

tecnologico -.3185087 .0133631 -23.83 0.000 -.3447 -.2923173

educaciontecnica -.4507881 .0198756 -22.68 0.000 -.4897438 -.4118324

institucionprivada .0694479 .0095627 7.26 0.000 .0507053 .0881905

experiencia2 -.0061582 .0010759 -5.72 0.000 -.008267 -.0040494

experiencia .137467 .0131942 10.42 0.000 .1116066 .1633274

luhatsq Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 1061606.93219936 4.82689023 Root MSE = 2.1887

Adj R-squared = 0.0076

Residual 1053509.21219928 4.79024595 R-squared = 0.0076

Model 8097.71779 8 1012.21472 Prob > F = 0.0000

F( 8,219928) = 211.31

Source SS df MS Number of obs = 219937

. reg luhatsq experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer

13

Luego, se vuelve a hacer la prueba de Breuch-Pagan y pasa lo siguiente:

Lo cual todavía no nos corrige del todo el problema de heterocedasticidad, entonces

procedemos a solucionarlo por medio de la prueba de White:

_cons 9.594187 .7393577 12.98 0.000 8.145065 11.04331

cte1 11.33261 .1820229 62.26 0.000 10.97585 11.68937

mujer1 .0630387 .0157821 3.99 0.000 .0321062 .0939712

doctorado1 2.498515 .1054632 23.69 0.000 2.29181 2.70522

maestria1 .644523 .0068157 94.56 0.000 .6311643 .6578816

tecnologico1 .1441595 .0343743 4.19 0.000 .0767867 .2115323

educaciontecnica1 .1590594 .0476916 3.34 0.001 .065585 .2525337

institucionprivada1 .0013619 .0081282 0.17 0.867 -.0145693 .017293

experiencia21 .0050798 .000694 7.32 0.000 .0037195 .0064401

experiencia1 -.0823928 .0150804 -5.46 0.000 -.11195 -.0528356

lnsalario1 Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 4421772.29219936 20.1048136 Root MSE = 1.8508

Adj R-squared = 0.8296

Residual 753319.265219927 3.42531506 R-squared = 0.8296

Model 3668453.02 9 407605.891 Prob > F = 0.0000

F( 9,219927) = .

Source SS df MS Number of obs = 219937

# unadjusted p-values

simultaneous 530.55 8 0.0000

mujer1 56.25 1 0.0000 #

doctorado1 157.05 1 0.0000 #

maestria1 298.74 1 0.0000 #

tecnologico1 0.19 1 0.6592 #

educaciont~1 12.67 1 0.0004 #

institucio~1 0.74 1 0.3889 #

experienc~21 0.01 1 0.9052 #

experiencia1 0.88 1 0.3474 #

Variable chi2 df p

Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

14

Se estimó por el método de heterocedastiidad robusta porque por el método de

heterocedasticidad multiplicativa porque asumimos que no se cumple el supuesto de:

Se estimó por el método de heterocedastiidad robusta porque por el método de

heterocedasticidad multiplicativa porque asumimos que no se cumple el supuesto de:

4.2. Normalidad en residuales

Uno de lo principales supuestos que tenemos que tener en cuenta en nuestro trabajo es

verificar que nuestros residuales se distribuyan de forma normal con media cero y

varianza constante, por lo que se realiza el histograma y el kdensity de Kernel con un

ajuste de una normal para evidenciar este supuesto. En la que claramente podemos

observar en el histograma de residuales y el histograma de kdensity de las figuras 5 y 6

respectivamente, una distribución claramente que los residuales llevan una distribución

normal lo cual cumple el supuesto de normalidad en los residuales. Esto se hace con la

función hist residuales, frequency normal (teniendo en cuenta que se predijeron los

residuales y se les llamo ”residuales”.

Total 5283.77 50 0.0000

Kurtosis 23.11 1 0.0000

Skewness 4391.39 9 0.0000

Heteroskedasticity 869.26 40 0.0000

Source chi2 df p

Cameron & Trivedi's decomposition of IM-test

Prob > chi2 = 0.0000

chi2(40) = 869.26

against Ha: unrestricted heteroskedasticity

White's test for Ho: homoskedasticity

15

Figura 5. Histograma de normalidad en los residuos

A continuación se utiliza el comando kdensity para producir un diagrama de densidad de

kernel con la opción normal de solicitar que una densidad normal se superponga a la

grafica o plano. El kdensity representa la estimación de densidad de kernel. Se puede

considerar como un histograma con los compartimientos estrechos y media móvil.

Figura 6. Estimación de densidad de Kernel

Para analizar problemas de eficiencia y sesgo en los estimadores se estudió si la

regresión presentaba problemas de multicolinealidad y/o heterocedasticidad.

0

.05

.1.1

5.2

De

nsity

-15 -10 -5 0 5 10Residuals

Kernel density estimate

Normal density

kernel = epanechnikov, bandwidth = 0.1423

Kernel density estimate

16

4.3 Regresion Lineal Robusta.

La regresión robusta, lo que hace es pesar las variables en función de su varianza, de

forma que desestima automáticamente o minimiza el efecto de aquellas que están más

alejadas de la media Comparacion de ingresos para encontrar diferencia en rentabilidad.

reg lnsalario experiencia experiencia2 institucionprivada educaciontecnica tecnologico

maestria doctorado mujer, vce(robust)

Figura 7. Regresion lineal robusta

Heriberto l, Urbisaia y juana z. Brufman, mencionan que “la robustez de un método de

estimación se refiere a su condición para obtener estimaciones insensibles ante posibles

violaciones de alguno de los supuestos fijados al especificar un modelo, en particular, el

relativo a la distribución admitida para la perturbación aleatoria. Un estimador robusto

produce “buenas” estimaciones” (en algún sentido), ante una amplia variedad de posibles

procesos generadores de datos”.

Como podemos observar nuestros coeficientes siguen iguales lo que cambian son

nuestros errores estandar o desviaciones que quedan como desviaciones robustas en

nuestra figura.

Calculos en excel:

Se procede con los calculos respectivos para realizar la comparacion de ingresos entre

un individuo que no continua sus estudios hasta completar su maestria y uno que si.

Usando los coeficientes que corresponden a la ultima regresion procedemos en una

rchivo de excel en el cual encontramos el salario va incrementando deacuerdo a la

_cons 13.67278 .010529 1298.59 0.000 13.65215 13.69342

mujer -.1402015 .0024626 -56.93 0.000 -.1450282 -.1353749

doctorado 1.156384 .0281974 41.01 0.000 1.101118 1.211651

maestria .6492735 .0076687 84.67 0.000 .6342431 .6643039

tecnologico -.3054449 .0031662 -96.47 0.000 -.3116505 -.2992393

educaciontecnica -.4620026 .0043605 -105.95 0.000 -.470549 -.4534562

institucionprivada .1021126 .0024911 40.99 0.000 .09723 .1069952

experiencia2 -.0034115 .0003028 -11.26 0.000 -.004005 -.0028179

experiencia .1137287 .0036005 31.59 0.000 .1066718 .1207857

lnsalario Coef. Std. Err. t P>|t| [95% Conf. Interval]

Robust

Root MSE = .56992

R-squared = 0.1481

Prob > F = 0.0000

F( 8,219928) = 4908.54

Linear regression Number of obs = 219937

17

experiencia que va adquiriendo el individuo. Luego hacemos la comparacion respectiva

entre este salario y el salario que podria obtener en caso de completar una maestria la

cual realizaria mientras que esta trabajando y pagaria en un periodo de seis años. Este

estudio se pagaria por medio de un prestamo del ICETEX que se diferiria en cuotas a 6

años dos correspondientes a los cuales esta persona se encuentra realizando sus

estudios. Se continua luego analizando si la maestria si seria rentable o no y cual seria la

diferencia entre su ingreso total en un periodo de trabajo de 35 años con y el estudio de

maestria y sin maestria.

Maestría en Gerencia de Proyectos

#semestre Valor UME UME por semestre Valor Semestre

semestre 1 710,987 10 7.109,870

semestre 2 740,987 10 7.409,870

semestre 3 770,987 9 6.938,883

semestre 4 800,987 12 9.611,844

Valor Maestria 31.070,467

Promedio valor

semestral 7.767,616

Regresión Relevancia en el modelo

lnsalario Pregrado Maestría

institucion privada 0.1021126 0 0

educacion tecnica -.4620026 0 0

tecnologico -.3054449 0 0

maestría 0.6492735 0 1

doctorado 1.15638 0 0

experiencia 0.1137287

experiencia2 -0.0034115

mujer -0.1402015 1 1

constante 13.67278 0 0

18

5. Conclusiones

Las principales conclusiones que podemos extraer del trabajo es que dada la ecuación

estimada y los tratamientos que se derivan de la ecuación de mincer, teniendo los datos

del observatorio laboral, se podrá dar un estimado del salario generado para personas

con y sin maestría. El modelo resulta ser bastante explicativo y razonable en cuanto a los

valores de los coeficientes y su significancia económica, aun entendiendo que existen

mas variables que pueden ser significativas a la hora de definir el modelo como por

ejemplo raza o etnia del trabajador o también habilidades del individuo, pero es un

Años Trabajados Cuotas Salario Neto Maestria

0 12.319.079,67$

1 13.254.481,92$

2 14.260.910,37$

3 15.343.758,11$

4 6.706.740,00$ 9.802.087,76$

5 6.836.860,00$ 10.925.502,52$

6 6.436.392,00$ 30.074.318,41$

7 6.436.392,00$ 32.846.619,71$

8 6.436.392,00$ 35.829.425,12$

9 6.436.392,00$ 39.038.718,46$

10 48.928.089,23$

11 52.643.256,75$

12 56.640.521,32$

13 60.941.302,90$

14 65.568.647,91$

15 70.547.352,67$

16 75.904.096,36$

17 81.667.583,92$

18 87.868.699,88$

19 94.540.673,89$

20 101.719.258,76$

21 109.442.922,04$

22 117.753.052,19$

23 126.694.180,31$

24 136.314.218,84$

25 146.664.718,24$

26 157.801.143,27$

27 169.783.170,19$

28 182.675.006,54$

29 196.545.735,22$

30 211.469.684,70$

31 227.526.827,26$

32 244.803.207,59$

33 263.391.403,86$

34 283.391.023,79$

35 304.909.238,44$

Sin Maestria Con Maestria Cuotas Maestria

$ 12.319.079,67 12.319.079,67$

$ 12.671.588,83 12.671.588,83$

$ 13.034.185,01 13.034.185,01$

$ 13.407.156,83 13.407.156,83$

$ 13.790.801,21 8.188.264,22$ 5.602.536,99$

$ 14.185.423,53 8.725.352,85$ 5.460.070,67$

$ 14.591.337,92 22.961.787,12$ 4.914.194,93$

$ 15.008.867,51 23.975.567,22$ 4.698.083,10$

$ 15.438.344,67 25.002.668,56$ 4.491.475,24$

$ 15.880.111,27 26.044.162,22$ 4.293.953,39$

$ 16.334.518,97 31.206.237,57$

$ 16.801.929,51 32.099.200,76$

$ 17.282.714,94 33.017.715,99$

$ 17.777.258,00 33.962.514,45$

$ 18.285.952,36 34.934.348,20$

$ 18.809.202,95 35.933.990,88$

$ 19.347.426,31 36.962.238,23$

$ 19.901.050,86 38.019.908,77$

$ 20.470.517,33 39.107.844,44$

$ 21.056.279,02 40.226.911,27$

$ 21.658.802,21 41.378.000,08$

$ 22.278.566,55 42.562.027,18$

$ 22.916.065,37 43.779.935,08$

$ 23.571.806,16 45.032.693,30$

$ 24.246.310,90 46.321.299,05$

$ 24.940.116,52 47.646.778,12$

$ 25.653.775,32 49.010.185,64$

$ 26.387.855,39 50.412.606,92$

$ 27.142.941,08 51.855.158,34$

$ 27.919.633,47 53.338.988,21$

$ 28.718.550,83 54.865.277,71$

$ 29.540.329,12 56.435.241,83$

$ 30.385.622,51 58.050.130,31$

$ 31.255.103,89 59.711.228,65$

$ 32.149.465,38 61.419.859,14$

$ 33.069.418,93 63.177.381,91$

VP

Costo Total Maestria

29460314,32

$ 156.399.939,83

$ 317.162.812,43 788521455,9

Beneficios Totales Sin Maestria

758228110,3

1346797515

Beneficios Totales Con Maestria

Diferencia Entre Mujer Con Maestria y Sin Maestria

588569404,2

Faltando 10 años para la jubilacion

724.655.083,31$

906.121.226,26$

Incremento salarial por maestria (%)

0,07$

844.970.069,52$

Diferencia Con y Sin Maestria ($)

61.151.156,74$

Faltando 10 años para la jubilacion

Beneficios Totales Con MaestriaBeneficios Totales Sin Maestria

19

problema de información que no se obtuvo dentro de la muestra del observatorio laboral.

Las conclusiones más interesantes e importantes es que se cumple la teoría general del

capital humano descrita en mucha literatura del contexto social y económico, es que a

mayor nivel de formación se ve reflejado en un aumento de su salario, lo cual es

consistente con los coeficientes de la regresión lineal del modelo. Otro punto es que las

mujeres reciben un menor salario aun estando en las mismas condiciones de trabajo,

referido esto como en los mismos niveles de formación, una observación adicional es que

al agregarle la variable dummy instituciones privadas nos reflejo que estos ganan mas

que personas egresadas de universidades e instituciones oficiales.

Como trabajo a futuro se espera plantear una investigación mas detallada y cuidadosa

ya que se presentaron problemas de heterocedasticidad, dado el tamaño y la repetición

de algunas muestras tomadas, en este caso muchas personas con bajos salarios que nos

desajustaban el modelo hacia una cola. De esta manera a través de nuevos y mas

justificados estudios econométricos, realizar en el ámbito de nivel de formación versus

salarios, obtener y presentar aplicaciones de carácter general en los datos ya obtenidos

aquí para crear mas estudios de interés general para la esfera académica y empresarial.

6. Bibliografía

Álvarez, M. T., & Seoane, M. J. F. (2010). Las ecuaciones de Mincer y las tasas de

rendimiento de la educación en Galicia. Investigaciones de Economía de la Educación

volumen 5, 5, 285-304.

Greenberg, I. (2001). REGRESSION ANALYSIS. Encyclopedia Of Operations Research

& Management Science, 704-706.

Griliches, Z. (1996). Education, human capital, and growth: a personal perspective (No.

w5426). National Bureau of Economic Research.

Hansen, P., Pereyra, V., & Scherer, G. (2013). Least Squares Data Fitting with

Applications. Baltimore.

Heriberto l, Urbisaia y juana z. Brufman. Estimación robusta. Notas de clase, Universidad

de Buenos Aires-Facultad de Ciencias Económicas. Extraído de:

<http://www.econ.uba.ar/www/institutos/epistemologia/marco_archivos/XVI%20Jornadas

%20de%20Epistemologia/L%F3gica%20Aplicada/URBISAIA%20y%20BRUFMAN-

%20Estimacion%20robusta.pdf>

Mincer, J. (1974). Schooling, Experience and Earnings, National Bureau of Economic

Research, New York.

20

Psacharopoulos, G., & Patrinos*, H. A. (2004). Returns to investment in education: a

further update. Education economics, World Bank Working Paper 2881. Washington D.C.

United States.12 (2), 111-134.

Sapelli, C. (2003). Ecuaciones de Mincer y las tasas de retorno a la educación en Chile:

1990-1998. Pontificia Universidad Católica de Chile, Instituto de Economía.

Stata web book:

http://www.ats.ucla.edu/stat/stata/webbooks/reg/chapter2/statareg2.htm. (s.f.).

Vela, F. (2010). Varianza del error no constante: heterocedasticidad. Notas de clase,

Universidad Autónoma Metropolitana. Extraído de:

<http://fvela.files.wordpress.com/2010/10/heterocedasticidad_notas.pdf>

Wooldridge, J. M. (2006). Introducción a la econometría: un enfoque moderno. Editorial

Paraninfo