ECONOMETRÍA 1, UNIVERSIDAD EAFIT
Estimación de la rentabilidad del salario de acuerdo a su nivel de
educación: pregrado vs maestría
Tomas Escorcia Vásquez, Eduardo Latorre Uribe, Alejandro Hernández Rengifo.
Noviembre, 2014.
Resumen
En el presente trabajo se tiene como objetivo analizar los rendimientos que obtienen los
estudiantes de pregrado frente a los profesionales que realizan una maestría, tomando
como referencia las ecuaciones de ingresos de Mincer. El estudio se lleva a cabo con
microdatos obtenidos del Observatorio Laboral del Ministerio de Educación Nacional,
filtrando nuestras principales variables de estudio, luego estimamos nuestro modelo con
el software econométrico STATA y analizamos los resultados. En el análisis se profundiza
una serie de rasgos básicos de los individuos de la muestra, los más significativos son: el
sexo, el nivel de estudios, la edad, la experiencia, origen de la Institución de Educación
(carácter de la universidad).
Palabras clave: MCO, salarios, educación, ecuación de mincer, rentabilidad, retornos,
STATA.
2
1. Introducción
La rentabilidad o beneficios proporcionados por la educación es un tema de especial
atención en las decisiones de las personas quienes enfrentan una gran disyuntiva, entre
si realizar una inversión de seguir estudiando o no realizar gastos en educación por su
falta de rentabilidad, como ven esta decisión a la vez implica una situación de costo de
oportunidad debatido en la economía. La parte teoría existente en su mayor parte
consideran que la educación es vista como una de inversión que aumenta la
probabilidad de que una persona devengue salarios mucho mayores.
En la revisión de la literatura, se ha encontrado que aparte del nivel de educación, existen
ciertas características como el sexo, la edad, la experiencia y hasta el carácter u origen
de la educación influye y puede ser trascendental para que una persona obtenga un
trabajo que sea estable y bien remunerado.
Este trabajo detalla y aplica la metodología utilizada en la literatura sobre rendimientos y
rentabilidad de la educación de acuerdo a su nivel de educación completado; teniendo en
cuenta la “ecuación de ingresos de Mincer”, poniendo especial interés en las diferencias
de las tasas de retorno según el nivel de educación (técnica, tecnológica, universidad,
maestría y doctorado) y experiencia.
Nuestra principal razón radica en la necesidad de comprobar si el modelo es un reflejo de
la realidad, en que muchas empresas toman como aumento del capital humano mayores
salarios para quienes tienen mayor nivel de educación, además como una guía para
nuestras vidas en el proceder a obtener una maestría o no, de acuerdo a su rentabilidad.
El trabajo se estructura en 7 apartados, incluyendo la introducción como primer punto. En
el segundo punto, se realiza una revisión del marco teórico y metodológico de las
ecuaciones de ingresos de Mincer y Mínimo Cuadrado Ordinarios. En el tercero se
describen las especificaciones del modelo, la procedencia de los datos, la explicación de
sus principales variables y las principales características de la base de datos a utilizar. En
el cuarto se exponen los resultados de la estimación de los efectos de la educación y la
experiencia laboral en las rentas y salarios de los jóvenes. Antes de dar por terminado el
trabajo, se exponen las conclusiones. Para finalmente dar como terminado el trabajo con
bibliografía y anexos.
2. Metodología
En el siguiente apartado se indican los métodos aplicados en la literatura para la
estimación del salario y su rentabilidad dada su experiencia, nivel de educación. Este
modelo lo trabajamos con el tema de mínimos cuadrados ordinarios y la Ecuación de
Mincer. Aquí una breve explicación de la literatura:
2.1 La Ecuación de Mincer:
3
El instrumento práctico mas utilizada y conocida para tratar y analizar estos datos ha sido
la ecuación minceriana de ingresos (Mincer, 1974), a través de la cual se estiman el
efecto de un nivel adicional de estudios en las rentas laborales de las personas. La
ecuación tradicional de Mincer, se estima por mínimos cuadrados ordinarios (MCO) un
modelo semilogarítmico, usando como variable dependiente el logaritmo del salario y
como variables independientes los años o nivel de educación, la experiencia laboral y el
cuadrado de ésta. Se utiliza un modelo semilogarítmico a fin de tener los cambios
porcentuales sobre el ingreso debido a cambios de nivel en las variables explicativas.
Asimismo, la transformación logarítmica es útil para reducir los efectos de las
observaciones atípicas. Los datos utilizados para su estimación provienen
tradicionalmente de datos transversales. (ecuación 1).
Donde:
Y = son los ingresos del individuo.
S = es el número de años de educación formal completada
Exp = son los años de experiencia laboral
Exp2 = son los años de experiencia laboral al cuadrado
ε= término de perturbación aleatoria que se distribuye según una Normal (0,𝜎ℇ2)
Conforme al modelo de ecuación de Mincer, Álvarez, & Seoane (2010), opinan que el
valor del coeficiente de los años de educación formal se explican como la tasa de
rendimiento media de un año adicional de estudio poseído por los trabajadores. Por otro
lado, y teniendo en cuenta la teoría de los perfiles de edad-ingresos (conforme aumenta
la experiencia, los ingresos individuales aumentan, pero cada año de experiencia tiene
un efecto sobre los ingresos menor que el anterior), se espera que al ser la función
cóncava con relación a la experiencia, la estimación de β2 sea positiva y la de β3 sea
negativa.
Esta ecuación ha sido utilizada en muchas aplicaciones y estudios debido a su disposición
de aplicación para proporcionar resultados acertados.
De acuerdo con Griliches (1977), los rendimiento de la educación estimado por MCO
(ecuación minceriana de ingresos) existían varios sesgos, identificando lo siguiente:
a) Existencia de determinadas variables omitidas en la ecuación de Mincer como la
habilidad del individuo. Si el término de perturbación incluye entre otros elementos la
habilidad del individuo, y se cumple que las personas con mayor habilidad son las que
deciden elegir el mayor nivel educativo, esto provocaría estimaciones inconsistentes.
b) Medición incorrecta de la cantidad de educación. La ecuación de Mincer implica que
existe una única tasa de rendimiento de la educación, sin embargo, tanto la teoría como
la evidencia empírica lo contradicen, sugiriendo representar la escolaridad en forma más
4
desagregada y flexible, con el objetivo de recoger de una forma más adecuada los
retornos al proceso de inversión en educación.
c) Tratamiento de la educación como una variable exógena. Diversos estudios han
demostrado que la variable educación puede no ser exógena estando afectada por
diferentes variables como puede ser los costes directos de la educación, los costes de
oportunidad, los ingresos futuros, las imperfecciones del mercado de capitales o incluso
la importancia del motivo consumo. El no considerar la endogeneidad de la educación
producirá que las estimaciones realizadas por la técnica de MCO proporcione
estimadores sesgados e inconsistentes del rendimiento de la educación.
Sapelli (2003), para la formulación del modelo nos explica lo siguiente “En la formulación
de 1958 del propio Mincer, implica que la escolaridad puede ser bien capturada con una
única variable en la ecuación del ingreso, y el coeficiente asociado representar una única
tasa de retorno a la educación. Sin embargo, tanto la teoría como la evidencia empírica
parecen contradecir esta propuesta y sugieren representar la escolaridad en forma más
desagregada y flexible, de manera de capturar en forma más adecuada el proceso de
inversión en educación. se abocará a avanzar todo lo posible hacia una mejor
caracterización de la escolaridad con sucesivas desagregaciones. Esto nos permitirá
contrastar los distintos resultados obtenidos e identificar, bajo nuestro análisis, los costos
de imponer a la fuerza la estructura de Mincer”.
2.2 Mínimos Cuadrados ordinarios
Según Greenberg, el método de mínimos cuadrados ordinarios consiste en que dado n
observaciones (o casos), (x1i, x2i,…, xpi, yi) con i = 1,…, n. decimos que el i-ésimo residual
sería:
El método de mínimos cuadrados ordinarios determina valores, bj, como estimador de βj
para poder minimizar la suma delos residuales al cuadrado. La función de regresión
estimada (el valor esperado) para el yi estimado y el residual estimado es:
Existen dos ventajas esenciales en este modelo. El primero es computacional, ya que el
método sólo requiere la solución de un sistema de ecuaciones lineales. El segundo es
estadístico, aquí los estimados poseen un grupo de propiedades. En particular los bj son
estimaciones insesgadas de βj los cuales tienen una varianza muy mínima entre los
5
estimadores insesgados. Ahora si asumimos normalidad, nos permite hacer inferencias
simples en el βj. El valor estimado de σ2 también es insesgado y tiene varianza mínima.
2.3 Modelo
En nuestro modelo además de logaritmo natural del salario, número de años de
educación formal completada, experiencia y experiencia cuadrado de la ecuación de
Mincer; se utiliza otras variables adicionales para mejorar nuestra estimación como: la
variable dummy mujer, la variable dummy Origen de la institución de educación(oficial o
privada) y una desagregación del nivel de formación (maestría, doctorado, formación
técnica profesional, tecnológica Universitaria). Cuando se usan estas categorías
educativas, el modelo queda especificado como sigue:
𝐿𝑛(𝑠𝑎𝑙𝑎𝑟𝑖𝑜) = 𝛽𝑜 + 𝛽1(𝑒𝑥𝑝𝑒𝑟) + 𝛽2(𝑒𝑥𝑝𝑒𝑟2) + 𝛽3(𝑖𝑛𝑠𝑡. 𝑝𝑟𝑖𝑣𝑎𝑑𝑎) + 𝛽4(𝑒𝑑𝑢. 𝑡𝑒𝑐𝑛𝑖)
+ 𝛽4(𝑡𝑒𝑐𝑛𝑜𝑙) + 𝛽5(𝑚𝑎𝑒𝑠𝑡𝑟) + 𝛽6(𝑑𝑜𝑐𝑡𝑜) + 𝛽7(𝑚𝑢𝑗𝑒𝑟)
2.4 Procesamiento del modelo
Se va a trabajar primero verificando si el modelo tiene multicolinealidad por medio del
comando “collin” en STATA. Luego se va a verificar heterocedasticidad del modelo por
medio de heterocedasticidad multiplicativa y si no se puede solucionar se procederá a
trabajar con la prueba de White robusta. Por último se procederá a verificar la normalidad
de los residuales y se demostrará a través de los graficos de kernel y de histograma de
frecuencia.
3. Datos
Los datos fueron obtenidos del Observatorio Laboral para la Educación del Ministerio de
Educación Nacional.
El Observatorio Laboral es un sistema de información especializado para el análisis de la
pertinencia en la educación superior a partir del seguimiento a los graduados del país y
su empleabilidad en el mercado laboral colombiano.
Este sistema de información hace parte del portafolio de productos del Ministerio de
Educación Nacional al servicio de la comunidad. Al interior del módulo de consulta del
Observatorio Laboral encontrará información acerca de:
o Oferta de graduados
o Perfil de los graduados
o Ingreso mensual promedio
o Vinculación al sector formal de la economía
El Observatorio Laboral para la Educación pone a su disposición un sistema de
información que le permite obtener la caracterización académica (Perfil Graduados) y de
mercado laboral (Situación Laboral) de 2.261.294 titulados del país en el periodo 2001-
2012. Se puede construir estos perfiles a través de características como: nivel de
6
formación del graduado, ubicación geográfica, origen de la institución en la que estudió,
su ingreso base de cotización al sistema de seguridad social, tasa de cotización, entre
otras.
3.1 Diseño de la muestra
En este trabajo nos centramos en el estudio de las características básicas de las
personas con niveles de educación de superior. Presentando especial interés en la
relación existente entre la educación y los salarios, con el fin de obtener y analizar los
resultados que nos ayuden a entender mejor cuál es el verdadero valor agregado de la
educación.
Genero: M Hombre, F Mujer
Experiencia: Año de graduación de pregrado-Año en que fue tomada la muestra
Universo: Población con estudios de educación de nivel superior.
Población asalariada; niveles de educación: técnicas, tecnológicos, pregrado, maestría y
doctorados.
Tamaño muestral: 219.937 personas.
Origen de la Institución de Educación: 1 Oficial, 2 Privada
Nivel de Formación
1 Especialización
2 Maestría
3 Doctorado
4 Formación técnica profesional
5 Tecnológica
6 Universitaria
Ingreso : Ingreso Base de Cotización.
Fuente: Base laboral del 2001 al 2011, Observatorio Laboral del Ministerio de Educación
Nacional.
Ecuación de salario
Variable dependiente:
Logaritmo natural del salario, Ln
(salario)
Logaritmo natural del salario mensual para cada
individuo.
Variables independientes:
Experiencia Años de experiencia: Año de graduación de
pregrado-Año en que fue tomada la muestra
Experiencia cuadrado Años de experiencia al cuadrado
Institución privada Variable dummy institución
7
Educación técnica Variable dummy técnica
Tecnológico Variable dummy tecnológico
Maestría Variable dummy maestría
Doctorado Variable dummy doctorado
Mujer Variable dummy mujer
4. Resultados
Al cargar nuestros datos al software STATA, lo primero que quisimos estudiar fue la
estadística descriptiva básica de los datos y analizar que había en cada uno de los datos
para las variables caso de estudio.
lnsalario float %9.0g LN SALARIO
ingresobc long %12.0g INGRESOBC
doctorado byte %8.0g DOCTORADO
maestria byte %8.0g MAESTRIA
pregrado byte %8.0g PREGRADO
tecnologico byte %8.0g TECNOLOGICO
educaciontecn~a byte %8.0g EDUCACION TECNICA
institucionpr~a byte %8.0g INSTITUCION PRIVADA
experiencia2 int %8.0g EXPERIENCIA^2
experiencia byte %8.0g EXPERIENCIA
aniogrado int %8.0g ANIO GRADO
mujer byte %8.0g MUJER
fechanacimiento str10 %10s FECHANACIMIENTO
individuo long %12.0g Individuo
variable name type format label variable label
storage display value
size: 7,477,858
vars: 14
obs: 219,937
Contains data
. describe
8
Figura 1: Estadística descriptiva de los datos.
En la Figura 1 se puede observar una muestra lo bastante grande para realizar nuestro
estudio, ya que contamos con 219.937 individuos los cuales son personas con
experiencia entre 3 y 13 años. En la muestra encontramos personas con salarios entre
$535.600 pesos y $13.400.000 pesos con una media de $1.608.742. Nuestro logaritmo
natural del salario por hora sería lo que una persona se estaría ganando por hora y
encontramos una media de $14.087 con un intervalo entre $13.191 y $16.410. Las otras
variables son tomadas como variables dummy.
Con estas observaciones básicas, nos podemos hacer una idea de los datos con los que
se va a trabajar, es decir, se conocen los datos y se empiezan a tomar hipótesis y
conjeturas sobre ellos.
A continuación, se realizó la regresión en STATA y se obtuvo los resultados determinados
en la Figura 2.
mujer 219937 .5448287 .4979875 0 1
doctorado 219937 .001114 .0333575 0 1
maestria 219937 .0349918 .1837595 0 1
tecnologico 219937 .146451 .3535586 0 1
educaciont~a 219937 .0603718 .238175 0 1
institucio~a 219937 .5811028 .4933796 0 1
experiencia2 219937 27.50735 17.5949 9 169
experiencia 219937 5.044613 1.435007 3 13
Variable Obs Mean Std. Dev. Min Max
. summarize experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer
Total 83851.2988219936 .381253177 Root MSE = .56992
Adj R-squared = 0.1481
Residual 71434.4984219928 .324808566 R-squared = 0.1481
Model 12416.8004 8 1552.10004 Prob > F = 0.0000
F( 8,219928) = 4778.51
Source SS df MS Number of obs = 219937
9
Figura 2. Regresión
Todas las variables son individualmente significativas, ya que presentan un p-valor muy
cercano a 0 y menor a 0.05.
El coeficiente de determinación es 0,1481, una cifra bastante satisfactoria para una
ecuación de mincer. Como explica Wooldridge (2006), “Que una R-cuadrada sea
pequeña, implica que la varianza del error es relativamente grande en relación con la
varianza de y, lo cual significa que es posible que sea difícil estimar con precisión las 𝛽𝑗.
Pero recuerde que una varianza grande del error puede ser contrarrestada con un tamaño
de muestra grande: si se tienen suficientes datos, es posible que se puedan estimar con
precisión los efectos parciales, aun cuando no se hayan controlado muchos de los
factores no observados. El que se puedan o no obtener estimaciones suficientemente
precisas depende de la aplicación (pag.199)”.
Como se puede observar en nuestra regresión lineal la experiencia aumenta en un once
por ciento el aumento de nuestro salario, al igual lo hace si la persona estudia o termino
sus estudios en una universidad de carácter privado, en la cual se da un aumento
significativo del diez por ciento en el que se aumenta su salario. Posteriormente la
maestría y el doctorado aumentan respectivamente en un 65% y un 115% lo cual es muy
relevante el hacer estudios posteriores al pregrado.
Es de especial atención que las mujeres ganan un 14% menos que los hombres, lo cual
deja ver una clara discriminación salarial acorde al género.
4.1. Multicolinealidad
Es de precisar que hay que tener presente que se requiere no tener una linealidad
perfecta entre los regresores o predictores o , para de esa manera , no encontrarnos con
problemas de multicolinealidad entre los regresores y no estén tan estrechamente
relacionados los unos con los otros que no den lugar a estimaciones imprecisas e
inestables, por lo que se utiliza el test de de VIF (Variance Inflation Factor) el cual mide
la inflación del error en la varianza para detectar multicolinealidad, a un valor mayor a 10
podrá presentarse indicios de colinealidad y con un número de condición mayor a 30. En
la Figura 3 se puede ver el VIF y el número de condición para este ejercicio:
_cons 13.67278 .0103502 1321.02 0.000 13.6525 13.69307
mujer -.1402015 .0024451 -57.34 0.000 -.1449939 -.1354092
doctorado 1.156384 .0364566 31.72 0.000 1.08493 1.227838
maestria .6492735 .0066567 97.54 0.000 .6362265 .6623204
tecnologico -.3054449 .0034797 -87.78 0.000 -.3122651 -.2986248
educaciontecnica -.4620026 .0051755 -89.27 0.000 -.4721465 -.4518587
institucionprivada .1021126 .0024901 41.01 0.000 .0972321 .1069931
experiencia2 -.0034115 .0002802 -12.18 0.000 -.0039606 -.0028623
experiencia .1137287 .0034357 33.10 0.000 .1069948 .1204627
lnsalario Coef. Std. Err. t P>|t| [95% Conf. Interval]
10
Figura 3. Test para multicolinealidad, VIF
En este caso el VIF global o la media de este es de 4.88, por lo que no se encuentran
problemas de multicolinealidad, dado no que supera un valor mayor a 10.
Pero el número de condición nos da 38.2634, que es mayor a 30, lo cual nos indica
problemas de multicolinealidad. Esto se debe a la relación existente entre experiencia y
experiencia2. Aunque estas variables muestran multicolinealidad, ambas son relevantes
para el modelo y por ende no se debe omitir ninguna de ellas. Esto se debe a que causaría
un error de especificación.
(obs=219937)
. collin experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer
. *VERIFICAMOS EXISTENCIA DE MULTICOLINEALIDAD
Mean VIF 4.88
----------------------------------------------------
mujer 1.00 1.00 0.9961 0.0039
doctorado 1.00 1.00 0.9986 0.0014
maestria 1.01 1.01 0.9870 0.0130
tecnologico 1.02 1.01 0.9757 0.0243
educaciontecnica 1.03 1.01 0.9719 0.0281
institucionprivada 1.02 1.01 0.9785 0.0215
experiencia2 16.45 4.06 0.0608 0.9392
experiencia 16.46 4.06 0.0608 0.9392
----------------------------------------------------
Variable VIF VIF Tolerance Squared
SQRT R-
Collinearity Diagnostics
Det(correlation matrix) 0.0580
Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept)
Condition Number 38.2634
---------------------------------
9 0.0029 38.2634
8 0.1155 6.1052
7 0.3956 3.2995
6 0.4299 3.1651
5 0.7368 2.4177
4 1.0000 2.0752
3 1.0004 2.0748
2 1.0126 2.0623
1 4.3064 1.0000
---------------------------------
Eigenval Index
Cond
11
4.2. Homocedasticidad - Heterocedasticidad
Lo que buscamos es verificar que la varianza de los residuales es homogénea, es decir,
que existe homocedasticidad. Una forma de revisar este supuesto puede ser Utilizando
el test de Breusch-Pagan:
Figura 4. Test de Breush- Pagan
Dado que tenemos problemas de heterocedasticidad hacemos heterocedasticidad
multiplicativa y obtenemos:
# unadjusted p-values
simultaneous 4214.94 8 0.0000
mujer 789.03 1 0.0000 #
doctorado 19.88 1 0.0000 #
maestria 467.34 1 0.0000 #
tecnologico 905.63 1 0.0000 #
educaciont~a 743.42 1 0.0000 #
institucio~a 83.43 1 0.0000 #
experiencia2 833.65 1 0.0000 #
experiencia 964.23 1 0.0000 #
Variable chi2 df p
Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
. generate double luhatsq = log(uhatsq)
. generate double uhatsq = uhat^2
. predict double uhat, resid
. quietly regress lnsalario experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer
. *HETEROCEDASTICIDAD MULTIPLICATIVA
. *MINIMOS CUADRADOS GENERALIZADOS FACTIBLES
12
Vela F. (2010), nos explica que con bastante regularidad los datos no se ajustan a las
condiciones idealizadas del modelo de regresión lineal clasico. Asi, por ejemplo, es
frecuente encontrar errores heterocedasticos, particularmente en datos de conrte
transversal. Una razon de ello radica en que la varianza de la variable dependiente
raramente se mantiene constante cuando el nivel de una o mas variables explicativas
aumenta o disminuye.
Luego, procedemos a tirar la regresión con heterocedasticidad por medio de
heterocedasticidad multiplicativa:
reg lnsalario1 experiencia1 experiencia21 institucionprivada1 educaciontecnica1
tecnologico1 maestria1 doctorado1 mujer1 cte1
_cons -2.788272 .0397477 -70.15 0.000 -2.866177 -2.710368
mujer -.1397595 .0093899 -14.88 0.000 -.1581634 -.1213555
doctorado -1.207006 .1400044 -8.62 0.000 -1.481411 -.9326011
maestria .0037073 .0255637 0.15 0.885 -.0463969 .0538114
tecnologico -.3185087 .0133631 -23.83 0.000 -.3447 -.2923173
educaciontecnica -.4507881 .0198756 -22.68 0.000 -.4897438 -.4118324
institucionprivada .0694479 .0095627 7.26 0.000 .0507053 .0881905
experiencia2 -.0061582 .0010759 -5.72 0.000 -.008267 -.0040494
experiencia .137467 .0131942 10.42 0.000 .1116066 .1633274
luhatsq Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 1061606.93219936 4.82689023 Root MSE = 2.1887
Adj R-squared = 0.0076
Residual 1053509.21219928 4.79024595 R-squared = 0.0076
Model 8097.71779 8 1012.21472 Prob > F = 0.0000
F( 8,219928) = 211.31
Source SS df MS Number of obs = 219937
. reg luhatsq experiencia experiencia2 institucionprivada educaciontecnica tecnologico maestria doctorado mujer
13
Luego, se vuelve a hacer la prueba de Breuch-Pagan y pasa lo siguiente:
Lo cual todavía no nos corrige del todo el problema de heterocedasticidad, entonces
procedemos a solucionarlo por medio de la prueba de White:
_cons 9.594187 .7393577 12.98 0.000 8.145065 11.04331
cte1 11.33261 .1820229 62.26 0.000 10.97585 11.68937
mujer1 .0630387 .0157821 3.99 0.000 .0321062 .0939712
doctorado1 2.498515 .1054632 23.69 0.000 2.29181 2.70522
maestria1 .644523 .0068157 94.56 0.000 .6311643 .6578816
tecnologico1 .1441595 .0343743 4.19 0.000 .0767867 .2115323
educaciontecnica1 .1590594 .0476916 3.34 0.001 .065585 .2525337
institucionprivada1 .0013619 .0081282 0.17 0.867 -.0145693 .017293
experiencia21 .0050798 .000694 7.32 0.000 .0037195 .0064401
experiencia1 -.0823928 .0150804 -5.46 0.000 -.11195 -.0528356
lnsalario1 Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 4421772.29219936 20.1048136 Root MSE = 1.8508
Adj R-squared = 0.8296
Residual 753319.265219927 3.42531506 R-squared = 0.8296
Model 3668453.02 9 407605.891 Prob > F = 0.0000
F( 9,219927) = .
Source SS df MS Number of obs = 219937
# unadjusted p-values
simultaneous 530.55 8 0.0000
mujer1 56.25 1 0.0000 #
doctorado1 157.05 1 0.0000 #
maestria1 298.74 1 0.0000 #
tecnologico1 0.19 1 0.6592 #
educaciont~1 12.67 1 0.0004 #
institucio~1 0.74 1 0.3889 #
experienc~21 0.01 1 0.9052 #
experiencia1 0.88 1 0.3474 #
Variable chi2 df p
Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
14
Se estimó por el método de heterocedastiidad robusta porque por el método de
heterocedasticidad multiplicativa porque asumimos que no se cumple el supuesto de:
Se estimó por el método de heterocedastiidad robusta porque por el método de
heterocedasticidad multiplicativa porque asumimos que no se cumple el supuesto de:
4.2. Normalidad en residuales
Uno de lo principales supuestos que tenemos que tener en cuenta en nuestro trabajo es
verificar que nuestros residuales se distribuyan de forma normal con media cero y
varianza constante, por lo que se realiza el histograma y el kdensity de Kernel con un
ajuste de una normal para evidenciar este supuesto. En la que claramente podemos
observar en el histograma de residuales y el histograma de kdensity de las figuras 5 y 6
respectivamente, una distribución claramente que los residuales llevan una distribución
normal lo cual cumple el supuesto de normalidad en los residuales. Esto se hace con la
función hist residuales, frequency normal (teniendo en cuenta que se predijeron los
residuales y se les llamo ”residuales”.
Total 5283.77 50 0.0000
Kurtosis 23.11 1 0.0000
Skewness 4391.39 9 0.0000
Heteroskedasticity 869.26 40 0.0000
Source chi2 df p
Cameron & Trivedi's decomposition of IM-test
Prob > chi2 = 0.0000
chi2(40) = 869.26
against Ha: unrestricted heteroskedasticity
White's test for Ho: homoskedasticity
15
Figura 5. Histograma de normalidad en los residuos
A continuación se utiliza el comando kdensity para producir un diagrama de densidad de
kernel con la opción normal de solicitar que una densidad normal se superponga a la
grafica o plano. El kdensity representa la estimación de densidad de kernel. Se puede
considerar como un histograma con los compartimientos estrechos y media móvil.
Figura 6. Estimación de densidad de Kernel
Para analizar problemas de eficiencia y sesgo en los estimadores se estudió si la
regresión presentaba problemas de multicolinealidad y/o heterocedasticidad.
0
.05
.1.1
5.2
De
nsity
-15 -10 -5 0 5 10Residuals
Kernel density estimate
Normal density
kernel = epanechnikov, bandwidth = 0.1423
Kernel density estimate
16
4.3 Regresion Lineal Robusta.
La regresión robusta, lo que hace es pesar las variables en función de su varianza, de
forma que desestima automáticamente o minimiza el efecto de aquellas que están más
alejadas de la media Comparacion de ingresos para encontrar diferencia en rentabilidad.
reg lnsalario experiencia experiencia2 institucionprivada educaciontecnica tecnologico
maestria doctorado mujer, vce(robust)
Figura 7. Regresion lineal robusta
Heriberto l, Urbisaia y juana z. Brufman, mencionan que “la robustez de un método de
estimación se refiere a su condición para obtener estimaciones insensibles ante posibles
violaciones de alguno de los supuestos fijados al especificar un modelo, en particular, el
relativo a la distribución admitida para la perturbación aleatoria. Un estimador robusto
produce “buenas” estimaciones” (en algún sentido), ante una amplia variedad de posibles
procesos generadores de datos”.
Como podemos observar nuestros coeficientes siguen iguales lo que cambian son
nuestros errores estandar o desviaciones que quedan como desviaciones robustas en
nuestra figura.
Calculos en excel:
Se procede con los calculos respectivos para realizar la comparacion de ingresos entre
un individuo que no continua sus estudios hasta completar su maestria y uno que si.
Usando los coeficientes que corresponden a la ultima regresion procedemos en una
rchivo de excel en el cual encontramos el salario va incrementando deacuerdo a la
_cons 13.67278 .010529 1298.59 0.000 13.65215 13.69342
mujer -.1402015 .0024626 -56.93 0.000 -.1450282 -.1353749
doctorado 1.156384 .0281974 41.01 0.000 1.101118 1.211651
maestria .6492735 .0076687 84.67 0.000 .6342431 .6643039
tecnologico -.3054449 .0031662 -96.47 0.000 -.3116505 -.2992393
educaciontecnica -.4620026 .0043605 -105.95 0.000 -.470549 -.4534562
institucionprivada .1021126 .0024911 40.99 0.000 .09723 .1069952
experiencia2 -.0034115 .0003028 -11.26 0.000 -.004005 -.0028179
experiencia .1137287 .0036005 31.59 0.000 .1066718 .1207857
lnsalario Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust
Root MSE = .56992
R-squared = 0.1481
Prob > F = 0.0000
F( 8,219928) = 4908.54
Linear regression Number of obs = 219937
17
experiencia que va adquiriendo el individuo. Luego hacemos la comparacion respectiva
entre este salario y el salario que podria obtener en caso de completar una maestria la
cual realizaria mientras que esta trabajando y pagaria en un periodo de seis años. Este
estudio se pagaria por medio de un prestamo del ICETEX que se diferiria en cuotas a 6
años dos correspondientes a los cuales esta persona se encuentra realizando sus
estudios. Se continua luego analizando si la maestria si seria rentable o no y cual seria la
diferencia entre su ingreso total en un periodo de trabajo de 35 años con y el estudio de
maestria y sin maestria.
Maestría en Gerencia de Proyectos
#semestre Valor UME UME por semestre Valor Semestre
semestre 1 710,987 10 7.109,870
semestre 2 740,987 10 7.409,870
semestre 3 770,987 9 6.938,883
semestre 4 800,987 12 9.611,844
Valor Maestria 31.070,467
Promedio valor
semestral 7.767,616
Regresión Relevancia en el modelo
lnsalario Pregrado Maestría
institucion privada 0.1021126 0 0
educacion tecnica -.4620026 0 0
tecnologico -.3054449 0 0
maestría 0.6492735 0 1
doctorado 1.15638 0 0
experiencia 0.1137287
experiencia2 -0.0034115
mujer -0.1402015 1 1
constante 13.67278 0 0
18
5. Conclusiones
Las principales conclusiones que podemos extraer del trabajo es que dada la ecuación
estimada y los tratamientos que se derivan de la ecuación de mincer, teniendo los datos
del observatorio laboral, se podrá dar un estimado del salario generado para personas
con y sin maestría. El modelo resulta ser bastante explicativo y razonable en cuanto a los
valores de los coeficientes y su significancia económica, aun entendiendo que existen
mas variables que pueden ser significativas a la hora de definir el modelo como por
ejemplo raza o etnia del trabajador o también habilidades del individuo, pero es un
Años Trabajados Cuotas Salario Neto Maestria
0 12.319.079,67$
1 13.254.481,92$
2 14.260.910,37$
3 15.343.758,11$
4 6.706.740,00$ 9.802.087,76$
5 6.836.860,00$ 10.925.502,52$
6 6.436.392,00$ 30.074.318,41$
7 6.436.392,00$ 32.846.619,71$
8 6.436.392,00$ 35.829.425,12$
9 6.436.392,00$ 39.038.718,46$
10 48.928.089,23$
11 52.643.256,75$
12 56.640.521,32$
13 60.941.302,90$
14 65.568.647,91$
15 70.547.352,67$
16 75.904.096,36$
17 81.667.583,92$
18 87.868.699,88$
19 94.540.673,89$
20 101.719.258,76$
21 109.442.922,04$
22 117.753.052,19$
23 126.694.180,31$
24 136.314.218,84$
25 146.664.718,24$
26 157.801.143,27$
27 169.783.170,19$
28 182.675.006,54$
29 196.545.735,22$
30 211.469.684,70$
31 227.526.827,26$
32 244.803.207,59$
33 263.391.403,86$
34 283.391.023,79$
35 304.909.238,44$
Sin Maestria Con Maestria Cuotas Maestria
$ 12.319.079,67 12.319.079,67$
$ 12.671.588,83 12.671.588,83$
$ 13.034.185,01 13.034.185,01$
$ 13.407.156,83 13.407.156,83$
$ 13.790.801,21 8.188.264,22$ 5.602.536,99$
$ 14.185.423,53 8.725.352,85$ 5.460.070,67$
$ 14.591.337,92 22.961.787,12$ 4.914.194,93$
$ 15.008.867,51 23.975.567,22$ 4.698.083,10$
$ 15.438.344,67 25.002.668,56$ 4.491.475,24$
$ 15.880.111,27 26.044.162,22$ 4.293.953,39$
$ 16.334.518,97 31.206.237,57$
$ 16.801.929,51 32.099.200,76$
$ 17.282.714,94 33.017.715,99$
$ 17.777.258,00 33.962.514,45$
$ 18.285.952,36 34.934.348,20$
$ 18.809.202,95 35.933.990,88$
$ 19.347.426,31 36.962.238,23$
$ 19.901.050,86 38.019.908,77$
$ 20.470.517,33 39.107.844,44$
$ 21.056.279,02 40.226.911,27$
$ 21.658.802,21 41.378.000,08$
$ 22.278.566,55 42.562.027,18$
$ 22.916.065,37 43.779.935,08$
$ 23.571.806,16 45.032.693,30$
$ 24.246.310,90 46.321.299,05$
$ 24.940.116,52 47.646.778,12$
$ 25.653.775,32 49.010.185,64$
$ 26.387.855,39 50.412.606,92$
$ 27.142.941,08 51.855.158,34$
$ 27.919.633,47 53.338.988,21$
$ 28.718.550,83 54.865.277,71$
$ 29.540.329,12 56.435.241,83$
$ 30.385.622,51 58.050.130,31$
$ 31.255.103,89 59.711.228,65$
$ 32.149.465,38 61.419.859,14$
$ 33.069.418,93 63.177.381,91$
VP
Costo Total Maestria
29460314,32
$ 156.399.939,83
$ 317.162.812,43 788521455,9
Beneficios Totales Sin Maestria
758228110,3
1346797515
Beneficios Totales Con Maestria
Diferencia Entre Mujer Con Maestria y Sin Maestria
588569404,2
Faltando 10 años para la jubilacion
724.655.083,31$
906.121.226,26$
Incremento salarial por maestria (%)
0,07$
844.970.069,52$
Diferencia Con y Sin Maestria ($)
61.151.156,74$
Faltando 10 años para la jubilacion
Beneficios Totales Con MaestriaBeneficios Totales Sin Maestria
19
problema de información que no se obtuvo dentro de la muestra del observatorio laboral.
Las conclusiones más interesantes e importantes es que se cumple la teoría general del
capital humano descrita en mucha literatura del contexto social y económico, es que a
mayor nivel de formación se ve reflejado en un aumento de su salario, lo cual es
consistente con los coeficientes de la regresión lineal del modelo. Otro punto es que las
mujeres reciben un menor salario aun estando en las mismas condiciones de trabajo,
referido esto como en los mismos niveles de formación, una observación adicional es que
al agregarle la variable dummy instituciones privadas nos reflejo que estos ganan mas
que personas egresadas de universidades e instituciones oficiales.
Como trabajo a futuro se espera plantear una investigación mas detallada y cuidadosa
ya que se presentaron problemas de heterocedasticidad, dado el tamaño y la repetición
de algunas muestras tomadas, en este caso muchas personas con bajos salarios que nos
desajustaban el modelo hacia una cola. De esta manera a través de nuevos y mas
justificados estudios econométricos, realizar en el ámbito de nivel de formación versus
salarios, obtener y presentar aplicaciones de carácter general en los datos ya obtenidos
aquí para crear mas estudios de interés general para la esfera académica y empresarial.
6. Bibliografía
Álvarez, M. T., & Seoane, M. J. F. (2010). Las ecuaciones de Mincer y las tasas de
rendimiento de la educación en Galicia. Investigaciones de Economía de la Educación
volumen 5, 5, 285-304.
Greenberg, I. (2001). REGRESSION ANALYSIS. Encyclopedia Of Operations Research
& Management Science, 704-706.
Griliches, Z. (1996). Education, human capital, and growth: a personal perspective (No.
w5426). National Bureau of Economic Research.
Hansen, P., Pereyra, V., & Scherer, G. (2013). Least Squares Data Fitting with
Applications. Baltimore.
Heriberto l, Urbisaia y juana z. Brufman. Estimación robusta. Notas de clase, Universidad
de Buenos Aires-Facultad de Ciencias Económicas. Extraído de:
<http://www.econ.uba.ar/www/institutos/epistemologia/marco_archivos/XVI%20Jornadas
%20de%20Epistemologia/L%F3gica%20Aplicada/URBISAIA%20y%20BRUFMAN-
%20Estimacion%20robusta.pdf>
Mincer, J. (1974). Schooling, Experience and Earnings, National Bureau of Economic
Research, New York.
20
Psacharopoulos, G., & Patrinos*, H. A. (2004). Returns to investment in education: a
further update. Education economics, World Bank Working Paper 2881. Washington D.C.
United States.12 (2), 111-134.
Sapelli, C. (2003). Ecuaciones de Mincer y las tasas de retorno a la educación en Chile:
1990-1998. Pontificia Universidad Católica de Chile, Instituto de Economía.
Stata web book:
http://www.ats.ucla.edu/stat/stata/webbooks/reg/chapter2/statareg2.htm. (s.f.).
Vela, F. (2010). Varianza del error no constante: heterocedasticidad. Notas de clase,
Universidad Autónoma Metropolitana. Extraído de:
<http://fvela.files.wordpress.com/2010/10/heterocedasticidad_notas.pdf>
Wooldridge, J. M. (2006). Introducción a la econometría: un enfoque moderno. Editorial
Paraninfo
Top Related