Un Modelo Teórico Práctico de Minería de Datos Aplicado al ...

156
Un Modelo Teórico-Práctico de Minería de Datos Aplicado al Comportamiento de los Clientes en las Grandes Superficies Colombianas Proyecto de Grado Administración de Empresas Diego Francisco Martínez Quiñones Administrador de Empresas Ingeniero de Sistemas y Computación Código 199821062 Asesor: Alfonso J. Pedraza Martínez Magíster en Ciencias Económicas Ingeniero Industrial Documento de Tesis de Grado Facultad de Administración Universidad de Los Andes Julio de 2006

Transcript of Un Modelo Teórico Práctico de Minería de Datos Aplicado al ...

Un Modelo Teórico-Práctico de Minería de Datos Aplicado al Comportamiento de los

Clientes en las Grandes Superficies Colombianas

Proyecto de Grado

Administración de Empresas

Diego Francisco Martínez Quiñones

Administrador de Empresas

Ingeniero de Sistemas y Computación

Código 199821062

Asesor:

Alfonso J. Pedraza Martínez

Magíster en Ciencias Económicas

Ingeniero Industrial

Documento de Tesis de Grado

Facultad de Administración

Universidad de Los Andes

Julio de 2006

A mi madre y mi familia,

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

1

Indice de Capítulos:

1. Introducción....................................................................................................................................3

2. Justificación.....................................................................................................................................4

2.1. Resultados esperados .................................................................................................................5

3. Marco Teórico..................................................................................................................................6

3.1. El Comportamiento de los Clientes en las Grandes Superficies Colombianas ...................................7

3.1.1. Las Grandes Superficies Colombianas.....................................................................................7

3.1.2. Las Bases de Datos de Clientes..............................................................................................8

3.1.3. El Consumidor de las Grandes Superficies ..............................................................................9

3.2. Grandes Volúmenes de Información y Técnicas de Minería de Datos ...........................................12

3.2.1. La Minería de Datos ............................................................................................................12

3.2.2. Antecedentes .....................................................................................................................12

3.2.3. Árboles de Clasificación .......................................................................................................15

3.2.4. Market Basket Analysis (Análisis de la Canasta de Mercado) ..................................................21

3.2.5. Regresión Logística .............................................................................................................23

3.2.6. Redes Neuronales ...............................................................................................................29

3.2.7 Medición de Resultados y Comparación de Modelos ...............................................................34

4. Aplicación de las Técnicas de Minería de Datos en el Modelo Experimental ........................................37

4.1. La Investigación.......................................................................................................................37

4.1.1. Objetivo General.................................................................................................................37

4.1.2. Objetivos específicos...........................................................................................................37

4.2. Metodología .............................................................................................................................39

5. El Modelo Experimental de Comportamiento....................................................................................41

5.1. Procesos Generadores de Datos ................................................................................................41

5.2. El Modelo Computacional ..........................................................................................................42

5.3. La Estructura de Datos .............................................................................................................46

5.3.1. Estrato ...............................................................................................................................47

5.3.2. Sexo ..................................................................................................................................47

5.3.3. Edad ..................................................................................................................................48

5.3.4. Situación Laboral ................................................................................................................48

5.3.5. Profesión u Oficio ...............................................................................................................49

5.4. El Modelo de Minería de Datos ..................................................................................................50

5.4.1. Distribución del Aceite de Cocina .........................................................................................52

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

2

5.4.2. Distribución de: Rubor ........................................................................................................52

5.4.3. Distribución de: Gelatina .....................................................................................................53

5.5. Las Técnicas de Minería de Datos sobre el Modelo Experimental .................................................54

5.5.1. Árboles de Clasificación:......................................................................................................55

5.5.2. Regresión Logística:............................................................................................................59

5.5.3. Redes Neuronales:..............................................................................................................63

5.5.4. Market Basket Analysis........................................................................................................67

5.6. Comparación de Modelos de Minería de Datos............................................................................70

5.6.1. ‘Aceite de Cocina’................................................................................................................70

5.6.2. ‘Rubor’ ...............................................................................................................................71

5.6.3. ‘Gelatina’ ............................................................................................................................71

6. Conclusiones .................................................................................................................................72

7. Alcances y Limitaciones..................................................................................................................75

8. Bibliografía ....................................................................................................................................76

8.1. Bibliografía utilizada en la investigación .....................................................................................76

8.1.1 Libros, Documentos y Papers................................................................................................76

8.1.2. Vínculos en Internet............................................................................................................77

8.2. Bibliografía utilizada para la creación del Modelo Experimental....................................................78

8.2.1 Libros, Documentos y Papers................................................................................................78

8.2.2. Vínculos en Internet............................................................................................................78

9. Anexos..........................................................................................................................................79

Anexo 1: Formato de Entrevista .......................................................................................................79

Anexo 2: Patrones de comportamiento encontrados..........................................................................81

Anexo 3: Productos utilizados ..........................................................................................................85

Anexo 4: El Modelo Experimental – Documentación ........................................................................ 139

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

3

1. Introducción

El sector de las Grandes Superficies en Colombia ha crecido de forma importante durante los

últimos quince años, tiempo en el cual algunas cadenas han pasado de tener un carácter

local o regional, a convertirse en empresas de nivel nacional e incluso internacional. Al

mismo tiempo varias cadenas internacionales han ingresado al mercado interno, como

Carrefour en 19981 y Casino, con la adquisición del 25% de las acciones de Éxito-Cadenalco

en 19992.

Si bien por ahora la mayoría de los colombianos prefieren comprar sus mercancías en

tiendas de barrio, pequeños mercados y superétes, es innegable que la conveniencia de

encontrar todas las mercancías en súper e hipermercados ha venido tomando fuerza,

especialmente en los estratos altos de la sociedad3.

Este tipo de empresas se caracterizan por tener un fuerte poder económico, que les permite

realizar inversiones importantes en logística y publicidad, que se ven reflejadas en la

capacidad de atraer clientes a sus establecimientos.

Por ese motivo, y buscando agregar valor a sus clientes para aumentar sus ingresos,

muchas de estas compañías han generado enormes bases de datos, en las cuales registran,

además de la compra y venta de los productos, algunas características adicionales de las

transacciones como el volumen total, el estrato socioeconómico del comprador (o sus niveles

de ingreso) y el modo de pago, con la finalidad de encontrar patrones de comportamiento

que les permitan tomar decisiones que se ajusten a las necesidades de los compradores.

Una de las técnicas que se creó para manejar este tipo de información es la minería de

datos, que como su nombre lo indica, obtiene información de “cavar” profundamente en los

grandes volúmenes de datos, en este caso reflejado en registros de transacciones realizadas

por los clientes, para obtener esa información relevante que permita aumentar la cantidad

de productos que el comprador desea adquirir, y por ende incrementar las ventas y

utilidades de la empresa.

1 Tomado de: Carrefour en los Años 90, http://www.carrefour.com/english/groupecarrefour/annees90.jsp, Septiembre de 2005. 2 Tomado de: Almacenes Éxito – Nuestra Historia. 3 Tomado del Boletín Trimestral de Almacenes publicado por el DANE en septiembre de 2005.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

4

2. Justificación

Si bien existen investigaciones que muestran los beneficios de las técnicas de minería de

datos en las grandes superficies más importantes y reconocidas a nivel mundial (ej.

WalMart)4, los resultados obtenidos en ellas comprenden comportamientos y hábitos

correspondientes a culturas diferentes.

En Colombia el estudio de la minería de datos es incipiente y por lo tanto representa la

oportunidad de trabajar sobre aplicaciones prácticas de una teoría que traerá beneficios, en

principio al sector de las grandes superficies y posteriormente a otros sectores sobre los

cuales se realicen investigaciones.

Se efectúa este estudio sobre las grandes superficies porque en este tipo de empresas es

evidente el manejo de grandes volúmenes de datos de clientes y proveedores entre otros, y

por lo tanto representan uno de los modelos más organizados, complejos y completos para

el estudio de la minería de datos.

Las razones por las cuales se utilizará un modelo experimental en lugar de una aplicación

práctica directamente en una empresa del sector son las siguientes:

• El acceso a las bases de datos de clientes es muy restringido y éstas representan en

muchos casos una de las ventajas competitivas de las empresas, y por lo tanto la

obtención de esa información se convierte en una seria limitante.

• La creación del modelo experimental permitirá generar conocimiento más allá del alcance

de este proyecto, al utilizarlo en otras investigaciones de laboratorio en ámbitos de

mercadeo, logística y procesos productivos entre otros.

4 Tomado de: What is Data Mining? – Excerpt, What can Data Mining Do? – WalMart example.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

5

2.1. Resultados esperados

Por las características de esta investigación, existen dos etapas igualmente importantes

sobre las cuales se obtendrán resultados relacionados.

La primera comprende la concepción de un modelo experimental de elaboración de grandes

volúmenes de datos sobre arquitecturas de información estadísticamente viables para el

sector de las grandes superficies, que permita el estudio de minería de datos en un entorno

suficientemente equiparable a la realidad como para obtener conclusiones acertadas acerca

de las metodologías que se utilizarán a continuación.

La segunda etapa comprende la aplicación de las técnicas de minería de datos sobre ese

modelo experimental, con la finalidad de obtener conclusiones acerca de la mejor

metodología aplicable al sector de las grandes superficies. Se espera que las conclusiones

obtenidas de este modelo entreguen datos suficientes como para demostrar empíricamente

las ventajas de la utilización de estas metodologías en las G.S.

Finalmente, el proceso de crear un modelo experimental de este tipo permite la utilización

académica del mismo en aplicaciones futuras de minería de datos y temas relacionados, y se

convierte en un simulador de comportamientos de los clientes de grandes superficies que

será útil en otros ámbitos de la investigación en administración, quedando a disposición,

como proyecto de grado, para experimentaciones futuras.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

6

3. Marco Teórico

La finalidad de este proyecto es encontrar las técnicas de minería de datos que mejor se

aplican al análisis de información de las diferentes Grandes Superficies en Colombia,

mediante dos estudios correlacionados:

El primero, la creación de una base de datos simulada que busca capturar las características

más relevantes de aquellas manejadas en la realidad, convirtiéndose así en una

experimentación de laboratorio que permitirá una continua investigación sobre datos que

representan cabalmente la realidad, y que podrá ser utilizada académicamente en

exploraciones futuras.

El segundo, el estudio de la aplicación de los diferentes métodos de minería de datos sobre

la base de datos experimental, para reconocer cuales son algunos de los comportamientos

más importantes de los clientes de las grandes superficies, así como identificar cual de los

métodos utilizados entrega mayor información acerca de los citados comportamientos, y es

el más conveniente para ser aplicado en ese sector de la economía colombiana.

Para la creación de un modelo teórico sobre el comportamiento de los clientes en las

Grandes Superficies, es necesario conocer ampliamente el funcionamiento de sus

componentes. Con ese fin, se expondrá el modelo que manejan las grandes superficies

colombianas, su estructura y el manejo de la información. Luego se presentará la estructura

técnica de las bases de datos que manejan estas empresas, para finalmente explicar

brevemente el comportamiento típico de los clientes.

En segundo lugar se mostrarán cuatro diferentes modelos de minería de datos, a saber:

Árboles de Clasificación, Redes Neuronales, Regresión Logística y Market Basket Analysis, y

su funcionamiento técnico, con la finalidad de entender el modelo que ha sido generado para

simular el comportamiento de los clientes, y la estructura de los procesos que serán

empleados para obtener información relevante de los datos obtenidos.

Finalmente se mostrará el proceso de generación de datos, que es el modelo sobre el cual

serán realizadas las simulaciones de comportamiento de los clientes. Estos procesos se

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

7

basan en la información recopilada del sector mediante entrevistas, estudios e información

de segundo nivel.

3.1. El Comportamiento de los Clientes en las Grand es Superficies Colombianas

3.1.1. Las Grandes Superficies Colombianas

A las hipertiendas, supermercados, hipermercados, bodegas de venta, y en general todo

comercio que se dedique a la venta de productos en grandes volúmenes, se les considera

una Gran Superficie5. Existen dos tipos, aquellas que son especializadas y aquellas que no.

Las especializadas6 se enfocan en un nicho de mercado específico, de características

homogéneas, dedicando los esfuerzos hacia proveer los productos necesarios para satisfacer

las necesidades de los clientes que corresponden a ese espacio de mercado. Ejemplos de

este tipo de grandes superficies son Homecenter (Construcción), Ktronix (Electrónicos),

Blockbuster (Películas y entretenimiento), etc.

Las no especializadas son más comunes y de mayor reconocimiento, dedicadas a cubrir un

espectro mucho más amplio de productos y servicios, en espacios usualmente más amplios.

Existen dos conformaciones habituales en este tipo de empresas:

• Por departamentos, en las cuales existe una clara división entre espacios dedicados a los

diferentes tipos de producto. Ejemplos de ellas son Fedco, Casa Estrella, Pepe Ganga,

Baby Ganga, Etc.

• Generales, en las cuales la conformación está dada por el tipo de producto y no por el

mercado. Fundamentalmente la diferencia radica en la venta de abarrotes y comestibles

junto con otra variedad importante de productos, organizados por góndolas y por

categorías (víveres, comestibles, bebidas, prendas de vestir, aseo, salud, etc.) Ejemplos

de ellas son Alkosto, CAFAM, Carrefour, Carulla-Vivero, Colsubsidio, Éxito-Cadenalco, La

14, etc. 5 Esta definición propia hace uso de la agrupación que hacen el DANE y el DNP en varios estudios acerca de los diferentes formatos de este modelo de negocios según la característica común de tratarse de espacios amplios para realizar compras. 6 El DANE en su Boletín Trimestral de Almacenes hace referencia a las diferencias que existen entre unos y otros modelos de tiendas especializadas y no especializadas, por departamentos, generales, etc.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

8

Es esa última conformación de grandes superficies no especializadas a la que hace referencia

esta investigación, ya que en ellas existe una mayor necesidad de entender el

comportamiento de los clientes, puesto que en los demás tipos de tiendas la conformación

está preestablecida y es bastante menos flexible.

Las Grandes Superficies (G.S.) modernas manejan electrónicamente los inventarios con la

ayuda de tecnologías como los códigos de barras. Una vez el comprador pasa por la caja

registradora, ésta descarga los productos que el cliente ha adquirido de la base de datos, y

genera un registro nuevo en el cual se guarda la información de la actividad de ese cliente,

los productos que está comprando, el método de pago (efectivo, cheque, tarjeta débito,

tarjeta crédito, etc.). Si se trata de un cliente reconocido (ej. un afiliado a la Caja en el caso

específico de CAFAM o un poseedor de tarjeta de cliente del Éxito), también se anota su

información personal.

3.1.2. Las Bases de Datos de Clientes

Cada Gran Superficie Colombiana tiene un modelo diferente de manejo de sus bases de

datos. Es así que algunas manejan cada nueva compra como un cliente diferente, mientras

que otras utilizan registros comunes e identificación directa de clientes. Sin embargo,

existen similitudes visibles. Cuando el cliente realiza una compra, automáticamente ésta es

registrada con por lo menos los siguientes datos7:

• Lugar de compra (Almacén, usualmente un código de identificación del mismo)

• Fecha de compra

• Número de Caja registradora en que se realizó la compra

• Persona que atendió esa caja (mediante un código de la misma)

• Productos adquiridos (mediante un número único de registro de cada uno)

• Valor parcial, descuentos y total de la compra

• Medio de pago (efectivo, cheque, tarjeta débito, tarjeta crédito, bonos, etc.)

Sin embargo, y mediante el uso de tarjetas de descuentos especiales, de afiliación o

similares, varias G.S. toman un registro extra, un número de identificación del cliente que

7 Fuente: Entrevista realizada con el encargado de la sección de mercadeo de CAFAM y otra información obtenida de fuentes secundarias como IBOPE y el DANE.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

9

les permite obtener datos más allá de aquellos generados por el proceso de compra, con los

que cuentan en otra base de datos, entre los que usualmente se encuentran:

• Datos básicos del cliente (nombre completo, dirección, teléfono, etc.)

• Datos de ingresos (salario o estrato)

• En algunos casos, empresa en la cual trabajan.

Existe una tercera fuente de información que obtiene datos del cliente y sus actividades: el

uso de tarjetas de crédito. Las entidades que manejan estos formatos (En Colombia

Credibanco y Master Card principalmente) registran a su vez la actividad de compra de los

clientes y la compilan, entre otras actividades, para reconocer el servicio que le deben

prestar a sus cuenta-habientes, los topes y el endeudamiento promedio al que se someten.

3.1.3. El Consumidor de las Grandes Superficies

Son diversas las razones para diferenciar el cliente de una Gran Superficie de uno de tienda

de barrio. Entre otros comportamientos, el comprador de tienda de barrio desea encontrar

artículos puntuales para solventar una necesidad momentánea, y en ocasiones comprará

exclusivamente las unidades necesarias para sortear el momento o el día. Por el contrario,

el cliente de Grandes Superficies tiende a buscar un abastecimiento más completo, se toma

su tiempo para realizar la compra y adquiere en una sola operación una importante variedad

de artículos8.

La primera razón es el nivel de ingresos. Se ha demostrado que en los últimos años, tras la

recesión económica del país, muchas personas han cambiado sus hábitos hacia volver a las

tiendas, en las cuales compran exactamente lo indispensable para el día 9. El consumidor de

Gran Superficie adquiere usualmente en un solo mercado la cantidad suficiente para al

menos una semana10.

La segunda razón es la distancia entre el lugar de trabajo y la vivienda. Muchos

consumidores se detienen en el camino hacia sus hogares a realizar las compras, y si el

8 Fuente: IBOPE, Encuesta TGI-EGM Colombia 2004 ola I. 9 Tomado del Boletín Trimestral de Almacenes. DANE, Septiembre de 2005. 10 Tomado del Boletín Trimestral de Almacenes. DANE, Septiembre de 2005.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

10

trayecto es suficientemente grande, preferirán ingresar a una G.S. que a las tiendas de

barrio11.

En tercer lugar, el hecho de contar con un vehículo propio. Los clientes que cuentan con

este servicio pueden desplazarse con mayor facilidad hacia los puntos de venta de las G.S.,

y tienden a llevar mayores cantidades de mercancías. Esta situación es tan evidente que el

Día Sin Carro (primer jueves de febrero), las ventas de las G.S. bogotanas se disminuyen

considerablemente12.

El comportamiento de los clientes de las Grandes Superficies es relativamente predecible, ya

que según diversos estudios, el consumidor regresa a comprar una serie de productos de

forma habitual, y sólo algunos otros por impulso. Aumentar ese consumo por impulso y

convertirlo en consumo habitual es una estrategia que pueden desarrollar las G.S., pero

para ello se debe conocer cuáles son esos hábitos de consumo que tiene el comprador

promedio, y qué productos adquiere por impulso. Para contestar este tipo de preguntas se

puede utilizar la minería de datos.

Entre los patrones que siguen los consumidores, según la investigación realizada sobre los

datos de IBOPE, utilizando tablas cruzadas de datos demográficos versus productos

disponibles en supermercados y grandes superficies, están, entre otros, los siguientes:

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Mantenimiento compran:

• Absorbentes para Incontinencia Urinaria First Quality • Champú Aquamarine ó Kwell • Productos para Limpieza Facial Revlon • Ron Cortez Ron ó Sun Dry • Té JC • Tequila Herradura • Vodka Koskenkorva ó de Otras marcas • Whisky,J&B

• Hombres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Servicios Generales compran: • Absorbentes para Incontinencia Urinaria de Otras marcas • Bebidas Energizantes Erektus • Bebidas Hidratantes de Otras marcas • Condones de Otras marcas • Jugos Envasados Listos Santal Light • Pañales Desechables Pampers • Productos para el Control del Acné Clinique

• Hombres de estrato 6 que tienen entre 20 y 24 años y que se dedican a la Educacion compran: • Aperitivos / Cocteles Preparados de Otras marcas

11 Tomado del Boletín Trimestral de Almacenes. DANE, Septiembre de 2005. y Entrevista con la Sección de Mercadeo de CAFAM. 12 Tomado del entrevista con la Sección de Mercadeo de CAFAM y Alcaldía de Bogotá; IBOPE, TGI-EGM Colombia 2004 ola I.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

11

• Hombres de estrato 3 que tienen entre 12 y 34 años y que se dedican a la Produccion compran: • Bebidas Hidratantes,Zapp

• Hombres de estrato 6 que tienen entre 25 y 34 años y que trabajan en oficios administrativos compran: • Bebidas Hidratantes Zapp • Ron Boyacá

• Mujeres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Finanzas compran: • Cereales Special K

• Hombres de estrato 3 que tienen entre 45 y 54 años y que trabajan en Otros Servicios compran: • Cerveza Amstel Light • Champú Shampiojos • Cigarrillos American Gold ó Caribe ó Imperial ó L&M Rojo ó President • Ponqués de Paquete,Colsubsidio

• Mujeres de estrato 2 que tienen entre 35 y 44 años y que trabajan en Ventas compran: • Gelatina Arcoiris • Jabones de Tocador Líquidos Neutrogena • Jugos Envasados Listos Colibrí • Perfumes y Colonias Estée Lauder • Remedios para el Malestar Estomacal Colaxín

• Mujeres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Ventas compran: • Perfumes y Colonias Estée Lauder • Productos para Protección Solar Coppertone

• Personas de estrato 3 que tienen entre 35 y 44 años que están desempleadas y cuyo oficio son las Ventas compran: • Remedios para el Malestar Estomacal Imodium

• Personas de estrato 2 que tienen entre 35 y 44 años y que trabajan en Educacion compran: • Remedios para la Gripa. Tos. Fiebre y Dolor de Garganta Cheracol

• Mujeres de estrato 4 que tienen entre 25 y 34 años y que trabajan en Salud compran: • Vodka de Otras marcas

Para un listado completo de estos patrones, por favor remítase al anexo 3 de este

documento.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

12

3.2. Grandes Volúmenes de Información y Técnicas de Minería de Datos

3.2.1. La Minería de Datos

Las técnicas de minería de datos han tomado cada vez más fuerza como un método para

obtener información relevante a partir del manejo de grandes volúmenes de información. Lo

novedoso de esta técnica, formulada por primera vez en 199513, radica en la capacidad de

realizar predicciones y manejar un nivel de inteligencia artificial sobre la información

contenida en esas fuentes mediante el uso de diversas técnicas entre las que se encuentran:

árboles de clasificación, regresión logística, market basket analysis y redes neuronales entre

otras.

La implementación de este tipo de estructuras en las organizaciones es bastante reciente,

pero aún así ha demostrado resultados positivos e interesantes en la obtención utilidades,

tanto en términos financieros como de mercadeo, logística y otras muchas ramas

administrativas, al permitir la exploración de variaciones, comportamientos, patrones, etc.

en las bases de datos que por años se han venido manejando. Un ejemplo claro es el

manejo de proveedores que realiza actualmente WalMart, que basándose en la información

de compras previas, es capaz de predecir el momento justo de la próxima compra,

disminuyendo así los costos por inventarios y los tiempos de entrega de cada uno de los

productos14.

3.2.2. Antecedentes

La primera descripción de minería de datos fue concebida durante el primer taller

“International Workshop on Knowladge Discovery and Data Mining” en 1995. En ese evento

se mencionaron las bases teóricas de las técnicas de minería de datos que incorporan

conocimientos de las ciencias aplicadas, la ingeniería y los negocios.

13 Fue durante ese año que se realizó el “First International workshop on Knowledge Discovery and Data Mining”. 14 Tomado de: Enhanced Decision Making using Data Mining

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

13

Sin embargo, en los diez años que lleva acuñado el término dentro del léxico académico no

se ha logrado un consenso acerca de la verdadera definición del mismo, aunque si existe

coincidencia en los aspectos esenciales de la minería de datos. Aún así, el Grupo Gartner15

entrega una definición que es tal vez la más completa y aceptada, que cita:

“La minería de datos es el proceso de descubrir

nuevas correlaciones significativas, patrones y

comportamientos, filtrando grandes volúmenes de

datos almacenados en repositorios, usando

tecnologías de reconocimiento de patrones así como

técnicas estadísticas y matemáticas.”16

Sin embargo existen otras definiciones igualmente interesantes, como la de M.J.A. Barry et

al17:

“La minería de datos es la exploración y análisis,

por medio del uso de métodos automáticos y

semiautomáticos, de grandes volúmenes de datos

con el fin de descubrir reglas y patrones

significativos”18

El Instituto Tecnológico de Massachussets (MIT), en sus desarrollos e investigaciones

avanzadas sobre este tema, cataloga las posibles interacciones entre la minería de datos y la

aplicación organizacional como “directivas”, y propone que tiene implicaciones en varios

aspectos de la vida empresarial, que son19:

• Mercadeo: pasa de enfocarse en productos y servicios hacia un enfoque en los clientes.

15 El Grupo Gartner es una corporación dedicada a la investigación y al análisis de la industria de las tecnologías de información a nivel mundial. 16 Traducción propia, tomada de: Data Mining Overview, MIT. 17 Traducción propia, tomada de: Data Mining Techniques For Marketing, Sales and Customer Relationship Management 18 Traducción propia, tomada de: St@tServ Data Mining Page. 19 Fuente: Data Mining Overview, MIT. En este documento se da un vistazo a la forma en la cual se ven beneficiadas las organizaciones al utilizar técnicas de minería de datos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

14

• Tecnologías de Información: pasa del enfoque en balances a-la-fecha20, hacia un enfoque

de patrones de transacciones, bodegas de datos y tecnologías OLAP.

• Impacto en los costos: mediante la disminución dramática en costos de bodegaje, que se

logra con el uso de volúmenes inmensos de datos para predecir comportamientos de

ventas y así el manejo de la logística operacional.

• Captura automática de datos transaccionales: uso de CRM, captura de datos esenciales,

localización de clientes, códigos de barras, etc.

• Internet: mediante la interacción personalizada y manejo longitudinal de datos.

Para ese fin, se utiliza el conocimiento adquirido en diferentes disciplinas, entre las que se

cuentan los métodos estadísticos, especialmente modelos descriptivos y de regresión, así

como de clusters; las técnicas en sistemas, especialmente en redes neuronales; las reglas

de asociación en las bases de datos; desarrollos paralelos: métodos por árboles y

herramientas orientadas al manejo de grandes volúmenes de datos dinámicos como OLAP.

Bajo estas condiciones y proposiciones, se muestra a la minería de datos como un conjunto

de herramientas para obtener mayores utilidades en varios ámbitos empresariales mediante

el estudio en detalle de sus bases de datos. Este tipo de investigaciones aún es incipiente

en muchos lugares del mundo, incluyendo a Colombia.

20 Un balance a-la-fecha se refiere al manejo diario de información sin tener en cuenta patrones de registro que sirvan para prever situaciones futuras. Este tipo de balances son los que maneja la mayoría de empresas, incluyendo las Grandes Superficies.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

15

3.2.3. Árboles de Clasificación

En 1986, Leo Breiman et al., con el libro “Classification and regression Trees” crearon las

bases para esta técnica de minería de datos. La idea del modelo es simple: servir como

herramienta para clasificar la información que se tiene de forma que se agrupe en la menor

cantidad de conjuntos o clases posibles que contengan datos del mismo tipo.

Para comprender este modelo primero se debe entender qué es un árbol en términos

matemáticos. Gries y Schneider describen un árbol como “Un grafo conexo libre de giros

que no contiene ciclos”21. Esto significa un grupo de nodos de un grafo, cada uno conectado

al menos con otro (ninguno libre o suelto), y con un único camino posible y existente (sin

ciclos) para llegar de uno nodo específico a otro.

Figura 1: Un grafo de tipo árbol binario

La figura 1 muestra un árbol binario, que corresponde a un grafo en el cual cada nodo tiene

únicamente un nodo padre y éste tiene máximo dos nodos hijos. En este ejemplo se ve

claramente que existe únicamente un camino para llegar de un nodo cualquiera a otro, y

además no hay subárboles o nodos sueltos.

El árbol de clasificación es exactamente un grafo de tipo árbol eneario (cada nodo tiene un

único padre y no tiene límite en la cantidad de hijos) de las características anteriormente

descritas, utilizado para repartir los datos en subgrupos más pequeños.

Se trata de dividir un espacio -con tantas dimensiones como tipos de datos existan en el

modelo- en subespacios que representan agrupaciones más depuradas de los datos, es

21 Traducción propia tomada de: D. Gries, F. Schneider, A Logical Approach to Discrete Math, 497p. pg. 452.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

16

decir, en las cuales se encuentre una amplia mayoría de un tipo específico de datos, y pocos

o ninguno de otro tipo.

El espacio original será la raíz del árbol, y cada uno de los subespacios resultantes (por tipo)

serán los nodos “hijo” de la raíz. Una vez realizado ese proceso, se debe repetir una y otra

vez recurrentemente hasta tanto se hayan dejado absolutamente todos los datos separados

en nodos o subespacios en los cuales no existan datos de otro tipo.

El problema de dividir los datos de forma homogénea es bastante complejo, razón por la

cual la mayoría de las particiones se realizan de forma intuitiva. Sin embargo, el problema

contrario, reconocer si una partición realizada es “pura” o “buena” es bastante sencillo. De

ahí que en la práctica se evalúa la “pureza” de diferentes particiones que parecen lógicas

intuitivamente, tomando la que los algoritmos sugieren que es la más pura de todas.

La pureza se puede describir, según M.J.A. Berry et al, como una medida que varía entre 0

(cuando no hay dos ítems en la muestra que pertenezcan a la misma clase) y 1 (cuando

todos los ítems de la muestra hacen parte de la misma clase). Existe también la medida

complementaria, Diversidad, que se refiere al extremo contrario (1 – pureza = diversidad).

Existen varios algoritmos que son capaces de evaluar la pureza de una partición, entre las

que se cuentan los algoritmos de GINI o de Diversidad de Población, Entropía o Ganancia de

Información, y la prueba Chi-cuadrado. No es el objetivo de este documento describir a

profundidad todos los algoritmos para dividir agrupaciones de datos22. Sin embargo, para

mayor ilustración, a continuación se expone el algoritmo GINI.

El algoritmo, nombrado tras su creador, Corrado Gini, fue ideado para medir la distribución

de la riqueza existente a principios del siglo XX. En su documento “Variabilità e mutabilità”

de 1912, Gini explicó que la “inequidad” de la riqueza se puede describir en un número

matemático. Este número corresponde al área existente entre la distribución perfecta de

riquezas –en la cual cada individuo tiene exactamente la misma riqueza- y la Curva de

Lorenz, que describe la distribución de riqueza desde un punto de vista económico23.

22 Para una descripción detallada de dichas técnicas, consulte: M.J.A Berry et al, p176. 23 Para mayor información sobre el coeficiente Gini y la Curva de Lorenz, remítase a: Paper A 04.01: Measuring Inequality: The Origins of the Lorenz Curve and the Gini Coefficient, M. Schneider, Escuela de Negocios, Universidad La Trobe, Australia.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

17

La gran ventaja de este número es que permite disponer en forma de coeficiente la

distribución de la riqueza de una región o un país. Es así que en la actualidad una medida

muy aceptada para comparar el bienestar social de los países es el coeficiente Gini.

La aplicabilidad que tiene el coeficiente Gini en la minería de datos radica en la capacidad de

describir de una forma sencilla la distribución de “riquezas” o en este caso datos en una

población de los mismos. Este cálculo se puede realizar de la siguiente forma24:

Sea U el universo de todos los datos que van a ser evaluados, S el conjunto de subespacios

en que se dividirá el universo U y Sj un subespacio de ese conjunto S con las mismas

características de U. Sea Di el conjunto de subespacios de un solo tipo de datos que se

encuentran en el espacio Sj y Dij un conjunto que contiene un único tipo de datos con las

propiedades25:

∑∑==

==

=

=

=

=

=

iC

iijj

K

jj

ijij

ii

jj

NNyNN

DN

DC

SN

SK

UN

11

La pureza de un nodo Sj está dada por:

( ) ( ) [ ]∑∑==

=

=

jj N

ijijj

N

i j

ijj SDPSPurezaó

N

NSPureza

1

2

1

2

)|(

Y la pureza de la partición S es:

( )∑=

=K

jj

jTotal SPureza

N

NPureza

1

24 La descripción matemática y de conjuntos expuesta en este documento se trata de una adaptación propia basada en los ejemplos propuestos por M.J.A. Berry et al, p81. 25 Matemáticamente los paréntesis planos determinan la cardinalidad de un conjunto. En este caso, |U| determina la cantidad de elementos presentes en el universo de los datos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

18

Una vez se reconoce que una partición es pura, se puede proceder a realizar otra partición,

esta vez sobre cada uno de los subespacios resultantes hasta tanto se haya dividido el

universo de los datos en subespacios que contengan únicamente datos de un mismo tipo en

cada hoja del árbol.

Hecho ese procedimiento, se puede notar que el resultado es un árbol en el cual cada nodo

es un subespacio del espacio inmediatamente superior.

Esa clasificación preliminar permite reconocer algunas características, como la dispersión

existente entre los datos, al hacerse necesarios más o menos niveles en el árbol para

distribuirlos totalmente. La noción detrás es que entre menos niveles sean necesarios,

menos dispersos están los datos, y viceversa.

Sin embargo, una vez se han clasificado todos los datos, especialmente cuando se trata de

grandes volúmenes, las clasificaciones resultantes no entregan información evidente, y en la

mayoría de los casos contienen más órdenes de los necesarios para obtener datos

relevantes. Es necesario un paso más para lograr evidenciar las relaciones existentes;

“podar” el árbol de forma que sean visibles las correlaciones.

Para esto se realiza un procedimiento estadístico de mínimo error. Se identifica la cantidad

mínima de niveles tras la cual el error estándar se mantiene relativamente estable. Se ha

comprobado empíricamente que en la mayoría de los casos estudiados, la distribución del

error adquiere una forma que tiende a ser asintótica horizontalmente en los árboles de

clasificación, y que por lo tanto después de cierta cantidad de niveles, el error no decrece de

forma significativa. Este punto se conoce como “mejor poda”. Si se trata de datos muy

diversos, cuya dispersión es tal que el error nunca decrece, el procedimiento concluirá que

se debe tomar la totalidad del árbol para ser estudiado.

Sin embargo esta “mejor poda” puede o no coincidir con otro concepto, la “poda de mínimo

error”, en la cual se evidencia el mínimo error de clasificación, con la menor cantidad de

niveles posibles. Depende entonces del algoritmo utilizado, ya sea CART, C5 u otro tipo, si

se debe utilizar uno u otro concepto a la hora de realizar este paso26.

26 M.J.A. Berry et al, p185 describe los métodos para podar los árboles de clasificación.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

19

El algoritmo más conocido y usado para podar árboles de clasificación es el CART o

Algoritmo de Árboles de Clasificación y Regresión, por sus siglas en inglés, que consiste en

encontrar la Tasa de Error Ajustado, que estará dado en términos de hojas. Ese error

tenderá a decrecer en la mayoría de los casos cuando se aumentan los niveles, y por lo

tanto se deben tomar tantos niveles como sea el punto en el cual ese Error Ajustado se

estabiliza y ya no decrece significativamente.

La tasa de error proviene de la forma en que se realiza la prueba. Los paquetes de software

toman dos grupos de datos, que se llamarán “datos de entrenamiento” y “datos de

validación”. Ambos grupos serán sometidos al mismo procedimiento, con la diferencia que

se hará primero uso de los datos de entrenamiento, y luego, reconociendo ya las reglas

existentes en el modelo obtenidas a partir de ese procedimiento, se utilizan los datos de

validación, sobre los cuales se deben obtener las conclusiones.

Estos dos tipos de datos, que deben ser disyuntos, se comportarán como dos curvas, siendo

la obtenida a partir de los datos de validación la que dirá, en su punto mínimo o el lugar

donde comienza a ser asintótica, cual es el nivel de profundidad al que debe hacerse la

poda.

Existe un tercer grupo, llamado “datos de prueba”, que por la manera en que se trabaja

estadísticamente, se utilizan al final para comprobar que el comportamiento de los datos no

se debe a un evento estadísticamente improbable que invalidaría las conclusiones sobre los

resultados.

La ecuación de error ajustado en CART consiste en la siguiente fórmula:

)(__)()( thojasdecuentatEtEA α+=

Donde EA(t) es el error ajustado que se está buscando, E(t) es la tasa de error, α es un

factor de ajuste que se va aumentando con respecto a la cantidad de subárboles que se han

creado, y cuenta_de_hojas(t) es la cantidad de hojas que existen en el modelo en un punto t

específico.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

20

Abstrayendo el modelo al proyecto que compete a esta investigación, el universo puede ser

el comportamiento de los clientes frente a un grupo definido de productos, siendo los datos

los diversos productos. Existirán productos (ramificaciones del árbol) que serán muy poco

dispersos (muy relacionados) y por lo tanto no tendrán muchos niveles. Así mismo habrá

otros que estarán bastante dispersos y necesitarán por lo tanto de varios niveles para ser

clasificados.

Una vez realizado el procedimiento de “poda”, se deben obtener grupos específicos, que

pueden ser asimilados como “clases de clientes”, o tipos de clientes que se comportan de

forma similar. Si se cuenta con suficiente información, se puede inclusive identificar alguna

característica que defina con mayor frecuencia a todos los clientes de esa clase, formando

así una clasificación bajo un nombre específico, por ejemplo clientes con edades entre X y Y,

que corresponden al estrato N.

El resultado será que se puede afirmar que todos los clientes que se encuentren entre el

rango especificado, y por lo tanto pertenecen a una clasificación específica, tienen el

consecuente patrón de consumo frente a los productos estudiados con cierta probabilidad.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

21

3.2.4. Market Basket Analysis (Análisis de la Canas ta de Mercado)

El término ACM fue acuñado durante la segunda mitad de la década de 198027, como una

prometedora forma de buscar correlaciones existentes en las ya en ese entonces inmensas

bases de datos, que habían recolectado la información de sus ventas y sus clientes durante

más de un decenio.

En ese momento no existía suficiente capacidad tecnológica en las computadoras accesibles

a las empresas para procesar ese volumen tan alto de datos, y por lo tanto muchas de ellas

decidieron no ingresar en el mundo de la minería de datos hasta casi diez años después.

La lógica detrás del ACM es básica y simple: reconocer si el comprador que tomó un

producto específico, por ejemplo leche, tiene una probabilidad importante de llevar otro

producto, por ejemplo pan, que se convierte en un patrón de comportamiento común.

Esta lógica tiene algunas particularidades. Entre otras, no cumple la ley de simetría, es

decir, el hecho de llevar leche si puede significar llevar pan, pero no necesariamente la

existencia del pan en el carro de mercado implica que la leche estará allí también. Existe

además la posibilidad de que aquel que está comprando pan y leche también lleve huevos,

pero si solo lleva pan o solo lleva leche, no necesariamente va a llevar los huevos. Esto

significa que se trata de encontrar reglas de asociación entre productos diversos, algunas

veces uno a uno, en otras ocasiones uno a varios, varios a uno o varios a varios.

Esas reglas de asociación son las que permiten manejar un concepto matemático y

probabilístico detrás de este tipo de análisis. Para ello se utilizan tres ecuaciones diferentes,

a saber28:

Soporte, o la posibilidad real que haya dos o más productos (Xi) en una canasta de mercado.

Se define como:

),...,,( 21 nXXXPS =

27 Market-Basket Mystery. Retail Technology Quarterly. May 2005. 28 M.J.A. Berry et al, p309 describe la estructura matemática que da soporte a las reglas de asociación, base del Análisis de la Canasta de Mercado.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

22

Confianza, o la probabilidad de que estén dos o más productos en la canasta (Xi,…, Xj),

dividida en la probabilidad de que una parte de éstos (Yi,…, Yj) esté en la canasta. Se define

como:

,...,,,...,,,),...,,(),...,,(

212121

21nk

k

n XXXYYYYYYP

XXXPC ∈=

Y Mejora (o interés, o lift), que es la cantidad de veces más probable de encontrar un grupo

de productos (Yi,…, Yj) dado que otro grupo específico (Xi,…, Xj) está en la canasta. Se

define como:

),...,,(),...,,|,...,,(

21

2121

n

nn

YYYP

XXXYYYPM =

Es así que, utilizando estas ecuaciones, se puede reconocer si un producto o conjunto de

productos existentes en la canasta de mercado hacen más probable la existencia de otro u

otros productos en la misma.

Por su calidad, facilidad de uso e interpretación, en la actualidad este modelo es uno de los

más difundidos entre los grandes almacenes minoristas o “retailers”29, ya que describe de

forma muy sencilla los patrones de consumo de los clientes, basándose en relaciones muy

claras y entendibles.

29 Wal-Mart ha usado este método para obtener mayores utilidades con la distribución de los productos. Así mismo aumenta la calidad del servicio y disminuye los costos de proveedores. Remítase también a: Enhanced Decision Making using Data Mining.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

23

3.2.5. Regresión Logística

Regresión logística es un modelo estadístico que se caracteriza por tener variables binarias

(1 ó 0, positivas o negativas), y cuya finalidad es describir de forma apropiada la

distribución de esos datos.

Sus orígenes se remontan al siglo XIX, cuando por primera vez se buscó responder la

incógnita de cómo crece la población humana en el mundo. La respuesta fue más

interesante de lo que se esperaba, ya que los matemáticos de entonces encontraron que con

el paso del tiempo la población iba creciendo en una progresión aritmética del orden de Xn,

donde n es el número de generaciones y X es el número de neonatos en el mundo30.

Esta situación fue particularmente estudiada por el astrónomo Alphonse Quetelet (1795-

1874), quien se planteó la imposibilidad de sustentar esa fórmula tras el paso de algunas

pocas generaciones, ya que es asintótica verticalmente y por lo tanto infinita en cuestión de

unos pocos cientos de años (cada generación tiene en promedio 25 años).

Él y su pupilo, Pierre-François Verhulst (1804-1849), mostraron que existe una función a la

cual se asemeja más el crecimiento, y que ésta es de forma sigmoide (empinada en principio

y llana pasado un factor de inflexión), con lo cual, aplicando la ya entonces conocida

ecuación de regresión lineal, mostraron que el comportamiento poblacional es realmente

dependiente de factores aparte de los nacimientos, y por lo tanto con un incremento que en

principio si parece una función exponencial simple, pero que pasados algunos años, esa

población tiene que estabilizarse porque existen límites para el crecimiento.

Verhulst publicó sus hallazgos en un pequeño ensayo de cuatro páginas titulado

“Correspondance Mathématique et Physique”, en el cual, mostró el crecimiento de la

población en función de otras variables, bajo la fórmula:

t

t

e

etW βα

βα

+

+

+Ω=

1)(

30 The origins of Logistic Regression, J.S. Cramer. Muestra cómo el primer caso que se intentó suplir con la regresión logística fue el crecimiento de la población frente a la creencia que el mismo es exponencial.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

24

Donde W es la población total, t es el tiempo, Ω es un límite poblacional por país, α es la

constante de regresión y β es el parámetro de crecimiento en el tiempo.

En posteriores publicaciones, el mismo Verhulst explicó que esta ecuación se ajusta bastante

al crecimiento poblacional en países como Rusia, Bélgica y Francia entre otros. También le

dio un nombre a la curva sigmoide resultante, llamándola “curva logística”, en

contraposición a la curva exponencial, o como se le conocía entonces: “curva logarítmica”.

Doscientos años después, la curva logística sigue siendo utilizada para describir poblaciones

y mercados, así como para mostrar el crecimiento que tendrá la introducción de nuevos

métodos o catalíticos en reacciones químicas y procesos industriales.

Sin embargo no fue sino hasta la segunda mitad del siglo XX, cuando ya se intentaban

sustentar y manejar los modelos desde el punto de vista computacional, que se asimiló la

reconstrucción de la ecuación de Verhulst y se creó la ecuación logit (despejada por

Berkerson), basada en una forma de la ecuación normal llamada probit, que era usada para

definir modelos logarítmicos con distribuciones normales, especialmente en casos de química

y farmacología. El logit, que será explicado más adelante, fue la forma de hacer que la

regresión logística se asemejara a una regresión lineal y por lo tanto mostrara un

comportamiento computable con las herramientas del momento.31

En general la regresión es una herramienta matemática de ajustar datos hacia una figura

específica como una línea, una curva, o en casos mucho más complejos, un plano o un

espacio, de tal manera que exista la menor distancia posible de todos los datos de la

muestra frente a la figura que se está estudiando.

La más común de las regresiones es la lineal, en la cual se busca acercar los datos hacia un

polinomio de grado 1 o lineal, de tal manera que todos los datos se aproximen lo más

posible a esa recta32. La forma más usual de representar esta regresión es el modelo:

nnXXXY ββββ ++++= ...22110

31 The origins of Logistic Regression, J.S. Cramer. Habla sobre los orígenes de la función logística desde el siglo XIX hasta finales del siglo XX. 32 En Probabilidad y Estadística aplicadas a la Ingeniería, Montgomery et al. p471-623, se puede encontrar detalladamente el modelo de regresión lineal.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

25

Donde β1 a βn son los coeficientes de la regresión. Este modelo tiene como característica

importante que cada uno de los β representa el ajuste hacia la recta Y=f(X1,X2,…,Xn).

Sin embargo, como la mayoría de los modelos estadísticos, la recta que representa

realmente los datos es desconocida, y los ajustes que se realizan se hacen por estimación de

los coeficientes. Para obtenerlos existen tres métodos con amplia difusión:

El primero es el de momentos, en el cual se toma la función de probabilidad y se deriva

frente a la función de momentos. Sin embargo, este método es poco útil en la regresión, ya

que la ecuación no es precisamente una función de densidad de probabilidad, y la aplicación

de momentos sobre ecuaciones con múltiples factores resultaría en el mejor de los casos

impráctica.

El segundo y más comúnmente usado en las regresiones es el de mínimos cuadrados, en el

cual se toma cada dato y se compara con la recta, tomando los cuadrados de las distancias

“paralelas a Y” entre los puntos en que se encuentran los datos y sus correspondientes

puntos estimados sobre la recta. De esa forma, se obtiene la siguiente ecuación:

YXXX TT 1)( −→

=β)

Donde X es la matriz de los Xnk observaciones (variables independientes) que se realizaron,

k son la cantidad de clases de datos y n es el número de datos por clase que se tomaron.

Así mismo β es el elemento vectorial de cada uno de los βk estimadores presentes y Y es el

vector de las Yn variables dependientes.

El tercer método, más usado para obtener estimadores de parámetros externos a la

regresión, es el de máxima verosimilitud, proceso en el cual se logra encontrar

matemáticamente un estimador que cumple con ser viable frente al parámetro real

mediante la maximización de la función de verosimilitud, o en palabras más claras,

encontrando el estimador que hace más factible que la función de verosimilitud se parezca al

parámetro que se desea encontrar. La función es la siguiente:

∏=

=n

iiXfL

1

),()( ββ

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

26

Para encontrar el máximo de una función, matemáticamente se puede derivar ésta e

igualarla a cero (punto en el cual la pendiente es cero, por lo tanto es máxima o mínima).

El estimador de máxima verosimilitud por lo tanto será:

0)(ln =

ββ

d

Ld, despejando β.

La regresión logística no es diferente. Se trata de acercar los datos existentes hacia una

curva logarítmica, que para el efecto de la minería de datos se ajusta más a modelos de

grandes volúmenes, ya que suaviza los casos excepcionales y extremos (por utilizar la

función logarítmica) y clasifica por medio de probabilidades las clases que se pueden

encontrar en la base de datos.

Otra característica particular de este modelo es el uso de una variable éxito-fracaso o binaria

para el manejo de clasificaciones, de tal manera que se puede decir, en palabras, que esta

aproximación permite “reconocer que tan probable es que, en el conjunto de los datos, el

caso Yi sea cierto”.

Finalmente, lo que logra este formato es comprobar matemática y estadísticamente que una

clasificación dada, o una agrupación específica de datos (patrón) es probabilísticamente

viable, al definir numéricamente con qué probabilidad una agrupación se puede dar -frente a

la posibilidad de que no sea así-, o un patrón se puede presentar -frente a la opción que no

lo haga-. La fórmula utilizada para esta expresión es33:

nn

nn

XXX

XXX

i e

eP ββββ

ββββ

++++

++++

+= ...

...

22110

22110

1

Esta ecuación se puede reescribir en una de regresión lineal múltiple, de la siguiente forma:

33 Esta fórmula corresponde a la versión actual de la ecuación original de Verhulst, y que como se verá más adelante, corresponde claramente a una ecuación logística. Para mayor ilustración vea: The origins of Logistic Regression, J.S. Cramer.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

27

nni

i

XXX

i

i

XXXi

i

XXXi

XXX

XXX

i

XXXP

P

eP

P

eP

P

eP

e

eP

nn

nn

nn

nn

nn

ββββ

ββββ

ββββ

ββββ

ββββ

ββββ

++++=

−=

=−

=

=−=

+==

+=

++++

++++

++++

++++

++++

...1

ln

1

11

111

1

22110

...

...

...

...

...

22110

22110

22110

22110

22110

Donde la función resultante de la izquierda se conoce como “logit”, que es el logaritmo de la

razón de posibilidades, más conocida como odd ratio, consistente en la división de la

probabilidad de éxito sobre la de fracaso, lo cual permite estimar que tan “positivo” es un

evento específico de los datos estudiados. Un patrón de comportamiento tomado desde este

punto de vista estaría dado por una cantidad alta de probabilidades de éxito frente a una

baja de posibilidades de fracaso (razón mayor que uno), que demostraría la existencia de

una clase Pi con alta probabilidad de ocurrencia.

Esta expresión tiene dos bondades: la primera es la capacidad de exponerla como una

regresión lineal múltiple, que permite hacer el estudio de correlaciones, pruebas de bondad

de ajuste y todos aquellos exámenes que se requieran sobre esta ecuación con las

herramientas más sencillas, conocidas y difundidas. La segunda es la explicación de los

datos, ya que, tomando la ecuación

nnXXX

i

i eP

P ββββ ++++=−

...22110

1

Ésta también se puede expresar, por las propiedades de los exponenciales, como:

nXn

XX

eeeeP

P

i

i ββββ *...***1

22

110=

Donde cada uno de los factores exponenciales expresa la representación de los β existentes,

y así mismo su impacto en la regresión. Esto significa que además, un β que esté cerca de

un valor cero, mostrará que la razón de posibilidades depende en menor cuantía de ese

factor, pues e0=1.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

28

Para el caso específico de las Grandes Superficies, cada uno de los Xi corresponden a un

producto y los β hacen referencia al impacto que tiene ese producto sobre un patrón

específico de comportamiento. Ese patrón debe ser de la forma éxito-fracaso, por ejemplo

estudiar si aquellas personas que consumen cerveza, además incluyen en su compra

gaseosa, pañales y cigarrillos. El éxito radicará en reconocer si realmente es probable que

los consumidores de cerveza compren los demás productos.

La ventaja de utilizar este modelo consiste en que si ese hecho va relacionado con los

pañales y los cigarrillos, pero no con la gaseosa, la regresión mostrará que no se puede

rechazar la hipótesis de que el coeficiente β asociado a la gaseosa es cero, y por lo tanto se

podrá asegurar estadísticamente que la compra de cerveza no tiene relación con la compra

de la gaseosa. Finalmente, y ya que se trata de un modelo numérico, el β asociado también

mostrará el factor (para el ejemplo la cantidad de productos) que identifica la compra y así

reconocerá que el comprador de cerveza, por ejemplo, gusta de comprar más de un

cigarrillo por cada una que decida llevar.

De esa manera, se puede indicar que si bien clasificar no es el fuerte de esta herramienta de

minería de datos, generar y comprobar patrones precisos de comportamiento a través de

regresiones es muy común y suele ser bastante acertado. Además, tras utilizar las

clasificaciones, que pueden ser o no encontradas usando este modelo, se puede estudiar su

validez utilizando herramientas estadísticas de este tipo.

Las dificultades más importantes del modelo radican en la complejidad de interpretación de

los resultados, que como tal muestran muy poco para aquellas personas que no están

entrenadas para distinguirlos. Se trata de experimentos estadísticos que generan

ecuaciones y resultados diversos, y con al menos tres modelos de estudio y corrección sobre

los mismos (prueba de contingencia34, prueba de ANOVA35 y prueba de bondad de ajuste36)

esta situación hace que, si bien las conclusiones en todos los casos usualmente son bastante

cercanas, existe la posibilidad de llegar a diferentes soluciones por diferentes métodos. 34 La prueba de contingencia consiste en comparar datos tabulares muestrales con valores esperados para los mismos, de manera que se pueda concluir si corresponden a las distribuciones en principio planteadas. Probabilidad y Estadística aplicadas a la Ingeniería, Montgomery et al. p. 456. 35 La prueba ANOVA consiste en analizar la varianza que tienen los datos muestrales, de tal manera que se pueda contemplar si la prueba corresponde o no a las hipótesis planteadas. Probabilidad y Estadística aplicadas a la Ingeniería, Montgomery et al. 493. 36 La prueba de bondad de ajuste consiste en definir que tanto se acerca la distribución de los datos a una distribución conocida, ya sea ésta normal, ji-cuadrada, student o poisson por nombrar solo algunas. Para Probabilidad y Estadística aplicadas a la Ingeniería, Montgomery et al. p.444.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

29

3.2.6. Redes Neuronales

Una red neuronal, en su forma más básica, es un modelo que busca simular la forma en la

cual funcionan las neuronas cerebrales. La primera aproximación a este paradigma apareció

a finales del siglo XIX, como el modelo matemático básico que describe la forma en la cual

se comporta, en teoría, un cerebro biológico. Sin embargo, no fue sino hasta los años 1950

que Frederick von Hayek describió ese comportamiento en su escrito “The Sensory Order”

en términos de neuronas independientes y simples que se organizan espontáneamente.

Hayek llegó a esta conclusión conexionista prácticamente al tiempo que Donald Hebb, quien

casi diez años antes había descrito el mecanismo de “plasticidad” de las neuronas, que

consiste en una forma de aprendizaje sin supervisión, conocida como el Aprendizaje

Hebbiano37.

Con base en ese conocimiento, el Laboratorio Aeronáutico de Cornell en Buffalo, N.Y.,

desarrolló el Perceptron, un “clasificador lineal” basado en una forma muy simple de red

neuronal de una sola vía. De esa manera, ajustando pesos, se logra hacer que el modelo se

haga más preciso cada vez. La ecuación del Perceptron es la siguiente:

bxwxf +•= )()(r

Donde w es un vector de pesos, b es un número y x es el dato o datos estudiados. El

producto punto entre el vector w y la variable x permite que la función tenga un signo, de

tal manera que se puede clasificar a x como una instancia positiva o negativa.

Así mismo, la ecuación Perceptron tiene un algoritmo de aprendizaje, que compara uno a

uno el valor obtenido con la ecuación y el valor real, de la siguiente forma:

( ) ( ) nn dxdxDn ,,...,, 11=

Donde n es la cantidad de ejemplos, xi es el dato ingresado y di es el valor real, o dato

objetivo. Sin embargo, esta segunda ecuación no describe la forma en la cual se encuentra

el error, que es la siguiente:

( ) iii xyd −η

37 La referencia a esta breve historia de las redes neuronales se puede encontrar en: M.A. Arbib The Handbook of Brain Theory and Neural Networks. Y M.J.A. Berry et al, Data Mining Techniques For Marketing, Sales and Customer Relationship Management.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

30

Siendo yi el resultado obtenido con la ecuación de Perceptron yη la tasa de aprendizaje que

se desea.

En ese momento histórico la tecnología se hizo insuficiente para manejar la cantidad de

información que requería procesar este algoritmo, de manera que las redes neuronales

entraron en un período de estancamiento. Solo hasta la primera parte de la década de 1980

se retomaría de lleno este modelo.

Entre tanto, en 1975, aparece el modelo teórico del Cognitron, un modelo neuronal un poco

más complejo, en el cual el adelanto más significativo era la existencia de más de una capa

de neuronas, sin embargo aún con la misma limitante del aprendizaje en una sola vía. Esa

limitante hacía impráctico el uso de las redes neuronales, ya que cada vez que el algoritmo

tanto Perceptron como Cognitron termina una función, debe “aprender” calculando en el

mismo sentido la ecuación mediante el ajuste de pesos y errores.

A principios de los años ochenta, John Hopfield38, del Instituto Tecnológico de California,

creó la ecuación de “Propagación de Errores hacia atrás” o Backpropagation. Este avance

dio fuerza a una rama de la tecnología informática: la inteligencia artificial, ya que permite

realizar el proceso de estimación y luego, de forma inmediata, trascender el error hacia

atrás, de tal manera que cada nodo obtiene información acerca del mismo para ser

distribuidos en el sistema de pesos de forma que en la siguiente oportunidad el resultado

sea más exacto. En términos coloquiales, el algoritmo de Backpropagation permite a la red

aprender de sus errores.

Actualmente se utilizan diversos métodos de ejecución y complejidad con las redes

neuronales, dependiendo de la necesidad que se tenga en la estimación. Aún así, el modelo

básico sigue siendo el mismo: Una o más entradas de datos que alimentan la red, un

procesamiento interno que puede ser directo o con algunos niveles ocultos de neuronas, y

una o más salidas que entregan el resultado de la operación. Finalmente, se retroalimenta

el modelo con los resultados reales mediante el uso del algoritmo de Backpropagation y se

ajusta el peso de cada neurona de forma tal que entregue un resultado más ajustado cada

vez. Gráficamente una red neuronal se puede ver de la siguiente forma:

38 Hopfield, en su artículo Neural network and physical systems with emergent collective computational abilities, describió la forma en la cual se puede generar la propagación hacia atrás en las redes neuronales.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

31

Red Neuronal (Caja Negra)

Entrada 1

Entrada 2

Entrada 3

Entrada 4

Salida 1

Salida 2

Red Neuronal (Caja Negra)

Entrada 1

Entrada 2

Entrada 3

Entrada 4

Salida 1

Salida 2

Figura 2: Una red neuronal con cuatro entradas y dos salidas39.

En la Figura 2 se puede observar la estructura básica de la red neuronal. En este caso

específico, existen cuatro entradas de información. Para el usuario de esta red, el

procesamiento interno de la misma será desconocido, y producirá dos salidas de información

con los datos originales procesados.

Otra particularidad que tiene la red neuronal de la Figura 2 es la existencia de un nivel

oculto, el cual realiza un procesamiento interno. Un ejemplo de una red que funciona de

esta forma es un modelo de predicción de la efectividad de una estrategia de mercadeo40,

así:

• Entrada 1: Número de personas involucradas en la publicidad.

• Entrada 2: Tipo de promoción realizado.

• Entrada 3: Lugar de dicha promoción.

• Entrada 4: Valor invertido en la publicidad.

Y las salidas serán:

• Salida 1: Aumento en las utilidades resultado de la publicidad.

• Salida 2: Aumento en el número de clientes.

Este ejemplo básico muestra uno de los usos más comunes de las redes neuronales: la

predicción de resultados. En los primeros intentos, con certeza, el modelo va a tener

dificultades para producir buenos resultados, ya que los pesos aún no se ajustan

específicamente al modelo de predicción. Sin embargo, tras varios procesos de predicción y

aprendizaje, la red se hará cada vez más eficaz.

39 Esta red neuronal es una representación gráfica creada a partir del ejemplo citado subsecuentemente, en el cual se hace referencia a un modelo de predicción sobre la efectividad de una estrategia de mercadeo. 40 El modelo descrito corresponde a una hipotética investigación sobre la efectividad de cuatro factores iniciales básicos presentes en toda actividad publicitaria, evaluada en factor de dos resultados concretos y válidos como lo son el aumento en las utilidades y el aumento en el número de clientes.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

32

Ahora bien, este modelo tiene una base estadística importante, ya que desde el punto de

vista matemático, el resultado de una red neuronal corresponde a un proceso de estimación

utilizando un método de regresión, siendo los pesos en realidad coeficientes, y los resultados

funciones de probabilidad. El modelo se maneja de la siguiente forma:

En primer lugar se realiza el proceso de estimación o predicción, que puede ser el simple

método de estimación “hacia adelante”, en el cual cada neurona recibe la información

según41:

( )efYxwe ik

n

iijij =⇒=∑

=1

Donde Wij corresponde al peso de la neurona i de la capa j, Xij corresponde al valor

resultante de la neurona i de la capa j, n corresponde al número de neuronas que están

conectadas detrás de la neurona que se está estudiando y Yik corresponde al resultado de la

neurona que se está estudiando.

Finalmente, el resultado o resultados del proceso completo estarán dados por la secuencia

recurrente de seguir los caminos de las neuronas y manejar para cada una de ellas la

sumatoria antes mencionada.

La consecuencia del proceso será por lo tanto un número. Una vez éste es obtenido, se

debe proceder a retroalimentar el sistema, de manera que el mismo pueda aprender del

error. Para ello se utiliza el método de propagación hacia atrás así:

∑=

=n

iikikij w

1

δδ

Donde j es la capa de neuronas que se está estudiando y ikδ corresponde al resultado de

propagar hacia atrás el nivel de error. Es decir, para las salidas se calcula una variación

correspondiente a YY −= 'δ siendo Y el resultado de la salida y Y’ el valor real (que debió

prever la red neuronal). Posteriormente se envía hacia el anterior nivel ese error al sumar la

multiplicación de los pesos correspondientes con las variaciones de las neuronas

subsiguientes. Ese resultado es la variación de cada neurona con respecto al valor que

entregó originalmente.

41 Ecuaciones tomadas de: Students' Project: "Neural networks and artificial inteligence in electronics", Electronics V, AGH University of Science and Technology, Krakovia, Polonia.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

33

Sin embargo, para calcular el peso se debe realizar una operación más, esta vez hacia

adelante así:

( )ijikijij x

de

edfww ηδ+='

Este peso resultante tiene como característica que depende de una variación que no es

exacta, es decir, que no garantiza la efectividad total del resultado. De hecho se utiliza el

parámetro η como un coeficiente de velocidad de ajuste, que permite amortiguar el impacto

del aprendizaje sobre los pesos de las neuronas.

Se debe recordar que el ajuste de propagación hacia atrás debe ser realizado una

considerable cantidad de veces para que el aprendizaje lleve a la red a obtener resultados

más cercanos a la realidad.

El mayor de los inconvenientes de este método es su dificultad de interpretación, ya que es

usual que el resultado de la red sea un número que poco o nada tiene que ver con el valor

solicitado, y requiere una conversión para ser asimilado como tal. Por esta razón suele ser

aplicado a problemas de negocio en los que no se necesita interpretabilidad inmediata de

resultados, por ejemplo, en análisis de fraudes. Otro inconveniente, tal vez no tan evidente,

es el peligro de sobreestimación, es decir la posibilidad de que la red neuronal aprenda de

tal forma un proceso que tras intentarlo en un entorno diferente, el error producido sea

bastante alto.

Esta técnica tiene varias aplicaciones en minería de datos. Las redes neuronales tienen la

suficiente flexibilidad como para realizar procesos de reconocimiento de grupos o clusters

mediante el uso de redes de mapas auto organizados, o la descripción de patrones de

comportamiento utilizando como entradas los datos de las compras de los clientes y como

salidas las diferentes agrupaciones comunes de objetos y la probabilidad de ocurrencia de

ese evento.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

34

3.2.7 Medición de Resultados y Comparación de Model os

3.2.7.1 La Razón ‘Lift’

‘Lift’, cuya traducción al español más aceptada es ‘Ganancia’, muestra en forma de una

razón de proporciones la ventaja de utilizar modelos de minería de datos frente a no hacerlo.

Matemáticamente la función que da sustento a la razón ‘lift’ es42:

( )( )poblacionpercentilP

muestrapercentilPLift

t

t

||=

Se asume por principio que realizar predicciones sin utilizar minería de datos es lo mismo

que indicar que la muestra será igual que la población (ya que no se va a utilizar ninguna

clase de modelo), y por lo tanto la razón lift, cualquiera que sea la probabilidad, será 1.0.

Esta base provee un comparativo para reconocer que tantas veces más es capaz un modelo

de minería de datos de encontrar predicciones sobre los datos.

Sin embargo, este indicador por su cuenta es únicamente capaz de dar luces acerca de la

capacidad superior de utilizar un modelo de minería de datos frente a no utilizarlo, y desde

ningún punto de vista se puede asumir que con base en el valor lift encontrado se asegura

que la aplicación del modelo de minería de datos será útil para predecir un comportamiento

o una clasificación específica43.

La utilidad del lift radica en su capacidad de comparar modelos de minería de datos que se

basan en una estructura de datos similar. De esta forma, un modelo que tenga en el

percentil 1 un lift acumulado de 14.3 y que es de las mismas características de otro modelo

de minería de datos que tiene un lift acumulado de 10.7, mostrará que aquel con mayor lift

acumulado será más habil para pronosticar resultados sobre el grupo de datos o la

información que se está utilizando.

42 M.J.A. Berry et al, p81 describe esta ecuación de lift en términos de clases. Sin embargo, en la práctica se utilizan siempre percentiles, de allí que se ha sustituído este valor en la fórmula. 43 M.J.A. Berry et al, p83 muestra que el grave problema con el lift es que no es una razón confiable para conocer que tan bueno resultará aplicar un método de minería de datos y si acarrear los costos de aplicarlo realmente dará mayores frutos que no hacerlo.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

35

Es así que en un caso hipotético en el cual se están utilizando tres modelos: Regresión

Logística, Arboles de Clasificación y Redes Neuronales para obtener clasificaciones y por

ende patrones de comportamiento, se puede saber cuál de los tres representa mejor los

datos así:

Gráfico 1: Lift Acumulado. En este modelo la curva inferior corresponde al árbol de clasificación, la intermedia a la red neuronal y la superior a

la regresión logística. Gráfico obtenido de SAS Enterprise Miner.

En el caso del gráfico 1, de los tres modelos se puede decir claramente que aquel con mayor

lift acumulado, en esta ocasión la regresión logística, es el método que puede realizar

mejores predicciones sobre los datos ingresados.

3.2.7.2. Otros Métodos de Medición de Resultados

Existe una amplia variedad de metodologías para medir resultados44. Sin embargo, la que

atañe a esta investigación consiste en la comparación directa de resultados frente a modelos

esperados.

Ya que se utiliza una simulación para generar el comportamiento de los clientes, a priori se

cuenta con la información necesaria sobre los patrones que se desean encontrar. En este

44 Las formas de medir resultados van desde la fuerza bruta, en la cual simplemente se evalúa el impacto que tienen los diferentes modelos sobre entornos reales, hasta complejos métodos de remuestreo y manejo de carga (assessment) y objetivo (scoring) como los utilizados por SAS.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

36

caso es particularmente ventajoso el modelo, pues al final se reconocerá cuáles de los

métodos de minería de datos es más útil para predecir comportamientos en las grandes

superficies, y ya que se está haciendo uso de una simulación estadísticamente viable45, se

puede concluir que el modelo con mejores resultados los tendrá también en las bases de

datos reales de las Grandes Superficies colombianas.

Este método de medición de resultados radica en comparar los resultados de procesar la

información por los cuatro métodos de minería de datos y hacer énfasis en aquellos patrones

y productos que fueron descritos correctamente, y aquellos que no lo fueron.

Al terminar el procedimiento, se podrá reconocer cuáles métodos encontraron resultados

más cercanos a los patrones inicialmente propuestos y por lo tanto describen más

confiablemente las predicciones sobre los datos.

45 La información sobre la simulación se encuentra en el capítulo 5 de este documento.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

37

4. Aplicación de las Técnicas de Minería de Datos e n el Modelo Experimental

4.1. La Investigación

La finalidad de esta investigación es reconocer el potencial que tiene la aplicación de las

diferentes técnicas de minería de datos sobre el sector de las grandes superficies en

Colombia, para lo cual se utilizaron algunas de las técnicas más comunes de minería de

datos y se compararon sus resultados.

La información requerida para realizar esta investigación, que es esencial para el correcto

desarrollo de la misma, tiene carácter de confidencialidad en la mayoría de las empresas del

sector, razón por la cual es necesario acudir a otros métodos para el estudio sobre el mismo

mercado sin recurrir a la información real. Por lo tanto, se generó un modelo simulado de

base de datos sobre la cual se midió el ajuste de cada una de las técnicas antes expuestas.

Se utilizaron así mismo fuentes secundarias como las bases de datos de IBOPE, Radar y

DANE, y se realizó el envío de misivas y correos electrónicos, infructuosamente, a profesores

de facultades de negocios en universidades como Harvard, MIT y Yale entre otras.

4.1.1. Objetivo General

Determinar el ajuste que tienen los diferentes modelos de minería de datos en el

comportamiento de los clientes de las grandes superficies en Colombia, mediante la creación

y posterior uso de modelos experimentales sobre una base de datos simulada.

4.1.2. Objetivos específicos

1. Recopilar información acerca del contenido de las bases de datos de clientes que

manejan las grandes superficies colombianas, en términos de los campos utilizados y los

procesos de mercadeo, financieros, logísticos, etc., envueltos en el proceso de selección

de los mismos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

38

2. Realizar un estudio acerca de los procesos de generación de datos, distribuciones

estadísticas en los comportamientos de los clientes y en particular el método para

conformar datos correctos sobre los hábitos de consumo y comportamiento de los

clientes de las grandes superficies colombianas.

3. Conformar y crear el modelo experimental utilizado para generar los datos pertinentes

en el resto de la investigación.

4. Realizar una investigación detallada acerca de los cuatro métodos más relevantes para

este tipo de estudio en la minería de datos, que son: árboles de clasificación, regresión

logística, redes neuronales y market basket analysis.

5. Generar y validar procesos utilizando herramientas como SAS Enterprise Miner para

cada uno de los citados métodos de minería de datos, de manera que sean relevantes

para el estudio de los datos de las grandes superficies colombianas, en la base de datos

desarrollada.

6. Aplicar los algoritmos al modelo experimental para obtener conclusiones acerca de las

técnicas más acertadas para este sector.

7. Concluir sobre los datos obtenidos y plantear las razones por las cuales los métodos de

minería de datos obtienen resultados más o menos relevantes sobre el comportamiento

de los clientes.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

39

4.2. Metodología

MIT46 plantea un modelo del proceso que se debe seguir para obtener un correcto desarrollo

de una aplicación práctica en minería de datos. Esa estructura, aplicada a la investigación

que se va a desarrollar, y con algunos cambios pertinentes para el desarrollo del modelo

experimental, es la siguiente:

1. Entender el funcionamiento del manejo de los clientes en las grandes superficies

colombianas. La meta final es resolver cuales de los métodos de minería de datos son

los más apropiados para la construcción del modelo sobre estas organizaciones.

2. Realizar un estudio de campo para encontrar las variables que corresponden a los

modelos reales de manejo de clientes en las grandes superficies colombianas. Este

estudio se realizó a través de entrevistas y contactos directos con el área de mercadeo

de CAFAM y el uso de fuentes secundarias como las bases de datos de Radar e IBOPE.

Se debe anotar que originalmente se buscó realizar la investigación mediante

entrevistas directas y fuentes primarias, pero al ser ésta información privilegiada,

únicamente la anotada caja de compensación estuvo dispuesta a permitirlas.

3. Crear un modelo simulado mediante la implementación de la información conseguida

anteriormente.

4. Concebir un modelo de generación de datos, basado en los estudios y conclusiones

sobre las distribuciones estadísticas de los patrones de compra de los clientes en las

grandes superficies colombianas. El modelo experimental fue desarrollado sobre una

base de datos MySQL y utilizando Java para la creación de la aplicación simuladora de

datos.

5. Estudiar las cuatro metodologías de aplicación de minería de datos que fueron aplicadas

al modelo y obtener suficiente información para desarrollarlas sobre el modelo

experimental. Este estudio se realizó utilizando la herramienta SAS.

46 El Instituto de Tecnología de Massachussets (MIT) plantea en la información del Sloan School of Management un proceso que debe seguir toda aplicación de Minería de Datos para su correcto desarrollo, que será la utilizada para este proyecto. Data Mining Overview. Open Courseware, Data Mining Course, Lecture Notes.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

40

6. Obtener conclusiones de la aplicación de dicho modelo. Al final de este proceso, se

deben obtener resultados de patrones de comportamiento de los clientes, que serán

reflejo de los patrones reales de consumo y por lo tanto los resultados permitirán

concluir sobre el comportamiento de los clientes.

7. Iterar entre los puntos 4 y 6 para desarrollar la investigación sobre cada una de las

cuatro técnicas de minería de datos.

8. Obtener conclusiones generales de la aplicación de los modelos y generalizar sobre el

uso de la minería de datos en las grandes superficies colombianas, y obtener resultados

acerca de la técnica que mayores beneficios trae en términos de resultados para el

sector estudiado.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

41

5. El Modelo Experimental de Comportamiento

5.1. Procesos Generadores de Datos

Los procesos generadores de datos se enfocan en la capacidad que tiene la aplicación de

representar el comportamiento de los clientes en las grandes superficies colombianas. Esta

simulación se llevó a cabo utilizando datos de consumo obtenidos directamente de

entrevistas como la realizada a CAFAM y fuentes secundarias como la base de datos de

IBOPE.

Se reconoce que una simulación es correcta cuando genera datos de forma que se asemejen

a la realidad de una forma comprobable. En este caso se utilizó el método de generar

comportamientos a través de tres factores reconocidos, a saber: consumo en términos

porcentuales de productos por parte de los colombianos (según datos de IBOPE para 2005),

Distribución de la población colombiana en estratos socioeconómicos, sexo y edad; y

finalmente clasificación de los productos según su exclusividad en el consumo.

Para este experimento, se suma a ese grupo de datos un compendio de registros que

contienen los patrones que se encontraron anteriormente (ver Anexo 3: Patrones de

Comportamiento Encontrados), de manera que a la postre puedan ser encontrados por los

modelos de minería de datos.

El resultado de esta simulación es un modelo de datos en el cual se contabilizan

aproximadamente 2.500 ítems (productos y marcas), para el caso de 100.000 compras

realizadas por clientes, simuladas utilizando los patrones citados al principio de este

documento, y utilizando valores porcentuales existentes según las fuentes primarias y

secundarias para los registros restantes.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

42

5.2. El Modelo Computacional

Gráfico 2: Ventana principal de la aplicación creada

Para lograr una generación adecuada de datos, se creó una aplicación en JAVA47 con formato

Modelo-Vista-Controlador48 a manera de simulación, de forma que los registros de compra

puedan ser generados recurrentemente y guardados. Con ese fin se utiliza una base de

datos49 creada a partir de los resultados de la investigación; así se garantiza que la

generación tanto de clientes como de productos es correcta. Esto permite la creación de

registros de compra que corresponden al comportamiento de consumo de los colombianos, y

en particular en grandes superficies.

El resultado de la utilización de este modelo es una tabla de registros que tiene los 2500

ítems citados anteriormente acumulados en 116 productos diferentes. La documentación de

clases la aplicación50 se encuentra en el anexo 4: Modelo Experimental.

47 JAVA es un lenguaje de programación de software generado por la casa Sun Microsystems, que tiene como características esenciales el manejo de objetos y la capacidad de funcionar sobre prácticamente cualquier plataforma computacional existente (Windows, Linux, Mac y BSD por nombrar solo algunas). 48 El modelo MVC se trata de un formato de arquitectura de aplicaciones en la cual el software se divide en tres partes a saber: Modelo o Mundo, que contiene el motor de la aplicación y las funciones que le dan utilidad al programa; Vista o Interfaz, que es la presentación final al usuario incluyendo imágenes, botones, espacios de trabajo, etc.; y Controlador, que funciona como un intermediario entre el Modelo y la Interfaz, haciendo transparente el paso de información entre uno y otro. Para más información remítase a: UML y Patrones de Craig Larman, p.281-284. 49 Como sistema manejador de bases de datos se utilizó MySQL, tal vez la base de datos más conocida y utilizada en el software libre. Existe una importante variedad de empresas que la utilizan para almacenar sus datos por sus características de confiabilidad y eficiencia. 50 La documentación presente en el anexo 4: Modelo Experimental, se refiere a los formatos autogenerados por JAVA, mediante la utilización de una herramienta llamada JavaDoc, que es capaz de generar documentos sobre cada una de las clases pertenecientes a las aplicaciones, en este caso, el generador de datos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

43

La aplicación tiene un formato bastante simple: En primer lugar, un modelo de base de

datos que consta de tres tablas básicas: Patrones, con la información de los patrones de

comportamiento según la investigación sobre IBOPE (ver capítulo 5.3.); Producto, con la

información de los productos (2500 items de 116 productos diferentes), generado también a

partir de IBOPE; y Cliente, una tabla que se genera automáticamente y que corresponde a

una simulación utilizando los datos demográficos obtenidos, que corresponde a diez mil

clientes que corresponden al comportamiento de los clientes en las grandes superficies

colombianas.

En segundo lugar, un modelo MVC (ver pie de página 48) de aplicación que tiene la

característica de ser más flexible para realizar programación.

Los siguientes dos gráficos muestran con claridad la estructura de base de datos y el modelo

de la aplicación:

Base de Datos(Clientes_GSC)

BDMain(Conector con BD)

GeneradorThread

Controlador

CreadorCSV(Generador de unarchivo separado

por comas)

Generador

MersenneTwister(Generador de

Númerosaleatorios)

VentanaClientes

DocumentoCSV

Modelo

Vista

Controlador

Base de Datos(Clientes_GSC)

BDMain(Conector con BD)

GeneradorThread

Controlador

CreadorCSV(Generador de unarchivo separado

por comas)

Generador

MersenneTwister(Generador de

Númerosaleatorios)

VentanaClientes

DocumentoCSV

Modelo

Vista

Controlador

Gráfico 3: Diagrama de la Aplicación

La clase VentanaClientes es la vista, es decir la ventana que muestra la aplicación.

La clase Generador es la responsable de utilizar los datos de la base de datos para realizar la

correspondiente simulación.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

44

La clase GeneradorThread genera un hilo de programación, de manera tal que la generación

de datos se de de forma independiente al resto de la aplicación. Esto se realiza más con

fines informativos que de funcionalidad.

La clase CreadorCSV genera documentos en el formato CSV, que corresponde a tablas de

valores separados por comas. Cabe anotar que la aplicación genera una tabla exactamente

igual en la base de datos. Esta clase se ejecuta una vez termina el proceso de generación

de datos.

La clase MersenneTwister es un desarrollo de la Universidad de Maryland, y cuya finalidad es

generar números aleatorios con mayores niveles de “aleatoriedad”, ya que en informática, el

azar es generado mediante la obtención de secuencias no aleatorias, a partir de semillas.

Esta clase tiene la característica de ser capaz de generar números con superior nivel de azar

que las librerías por defecto de JAVA.

Finalmente, la clase BDMain se trata de un desarrollo previo que compende un conector con

diversos tipos de bases de datos, para permitir un manejo de información más transparente

y centralizado en la aplicación. En teoría, ya que no se ha comprobado este hecho, esta

clase debe permitir que la aplicación funcione sobre prácticamente cualquier tipo de base de

datos que tenga un controlador JDBC51.

Cliente

IDNombresApellidosEstratoEdadSexoSit_LaboralProfesion_Oficio

Patrones

IDEstratoSexoEdadSit_LabAct_LabPDTO_01PDTO_02….PDTO_20

Producto

IDTipoNombreMarcaPorc_del_TotalPorc_ProductoPorc_MarcaIntervalo_CompraEstrato_Minimo

Clientes_GSC

Cliente

IDNombresApellidosEstratoEdadSexoSit_LaboralProfesion_Oficio

Patrones

IDEstratoSexoEdadSit_LabAct_LabPDTO_01PDTO_02….PDTO_20

Producto

IDTipoNombreMarcaPorc_del_TotalPorc_ProductoPorc_MarcaIntervalo_CompraEstrato_Minimo

Clientes_GSC

Gráfico 4: Tablas de la base de datos

51 JDBC es una sigla que significa “JAVA Database Connectivity”, y que corresponde a un pequeño aplicativo que permite el flujo de datos entre las diferentes bases de datos y las aplicaciones realizadas en lenguaje JAVA.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

45

Existen dos tablas más en esta base de datos, correspondientes a las tablas generadas como

resultado del proceso de simulación. Esas tablas contienen los datos demográficos del

comprador, y a continuación un recuento de los productos que adquirió en su visita a la gran

superficie.

Estan diseñadas específicamente para ser utilizadas en el estudio de minería de datos

utilizando el software SAS Enterprise Miner, como se describe en el capítulo 5.4., pero sus

resultados son también aplicables a otras ramas de la investigación administrativa.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

46

5.3. La Estructura de Datos

Por la disposición en la cual fue creada la aplicación, la simulación debe, según estos

fundamentos, generar un comportamiento que se asemeja singularmente al verdadero

proceder de los clientes de las grandes superficies colombianas. Se debe recordar que ese

comportamiento fue tomado directamente de los datos obtenidos de IBOPE, y que así

mismo, los comportamientos comparativos de los clientes fueron obtenidos de esa misma

base de datos mediante la comparación entre las variables demográficas pertinentes y los

productos y marcas existentes en dicha fuente de información.

Para ese desarrollo, fue necesario simular también la composición de esos clientes utilizando

los valores conocidos en IBOPE, con los datos de distribución porcentual en sexo, estrato (2

al 6), edades (12 a 69 años), situación laboral (que incluye trabajadores, desempleados,

jubilados, estudiantes y otros) y actividad laboral (correspondiente a la profesión u oficio).

A continuación se presenta una serie de datos sobre las distribuciones en las diferentes

variables utilizadas: estrato, sexo, edad, situación laboral y profesión u oficio.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

47

5.3.1. Estrato

Gráfico 5: Estrato vs. Porcentaje. Obtenido de SAS Enterprise Miner

con base en los registros generados automáticamente

La variable estrato tiene una distribución mayoritaria en los estratos 1 y 2, lo cual es

consistente con datos de IBOPE52 y también del DANE53.

5.3.2. Sexo

Gráfico 6: Sexo vs. Porcentaje. Obtenido de SAS Enterprise Miner

con base en los registros generados automáticamente

La variable sexo tiene una distribución uniforme, con igual probabilidad para ambos sexos,

siendo las diferencias mínimas entre uno y otro correspondientes al error estándar

estadístico.

52 Encuesta IBOPE, TGI-EGM Colombia 2004 ola I. 53 DANE, Indicadores Demográficos 1985-2015.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

48

5.3.3. Edad

Gráfico 7: Edad vs. Porcentaje. Obtenido de SAS Enterprise Miner

con base en los registros generados automáticamente

La variable edad tiene la característica de comportarse según una distribución normal,

siendo el punto central aproximado la edad de 25 años, tal cual lo muestra el DANE54 en sus

informes de población. Sin embargo, esta gráfica muestra únicamente a los mayores de

doce años, ya que éstos son los que realizan compras en establecimientos como Grandes

Superficies, según IBOPE.

5.3.4. Situación Laboral

Gráfico 8: Situación Laboral vs. Porcentaje. Obtenido de SAS Enterprise Miner

con base en los registros generados automáticamente

La situación laboral es una variable que corresponde al estado de trabajo que tiene el

comprador en Grandes Superficies. Se puede apreciar en ella un desempleo de menos del

10% y un grupo de personas de aproximadamente 40% que se encuentran laborando. Las

diferencias con los indicadores del DANE respecto a desempleo, personas jubiladas y otros

aspectos, se explican porque son aquellos que laboran y estudian en su mayoría los que se

encuentran en capacidad de realizar compras en establecimientos como las G.S.

54 DANE, Indicadores Demográficos 1985-2015.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

49

5.3.5. Profesión u Oficio

Gráfico 9: Profesión u Oficio vs. Porcentaje. Obtenido de SAS Enterprise Miner

con base en los registros generados automáticamente

Profesión u Oficio es una variable que muestra el tipo de ocupación de las personas. Como

es de esperarse, la mayor cantidad de personas se dedican a las ventas, siendo éstas de

cualquier tipo, desde mercaderistas y empresarios hasta vendedores ambulantes.

Es sobre este modelo experimental que se deben comprobar los cuatro modelos de minería

de datos. El proceso comienza al asignar un producto común al interior de los patrones de

compra como objetivo del estudio (ver Anexo 3: Patrones de Comportamiento Encontrados).

De esta forma, el modelo buscará cuáles características son comunes alrededor del mismo y

por lo tanto corresponden a un patrón de comportamiento.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

50

5.4. El Modelo de Minería de Datos

Para el estudio se utilizaron tres productos: ‘Aceite de cocina’, ‘Rubor’, y ‘Gelatina’. Las

razones para escoger estos productos sobre otros se fundamentan en su existencia dentro

de patrones de comportamiento que además incluyen otros productos, una baja

participación entre los grupos de patrones, y un nivel de compra comparativamente alto,

que genera oportunidades para que aparezcan falsos positivos.

Para reconocer la calidad de la información obtenida, se realizó un experimento utilizando

25% de datos generados a partir de patrones y el resto aleatoriamente. Se estudiaron los

cuatro modelos de minería de datos, cada uno mediante el uso del software SAS Enterprise

Miner para el manejo de los mismos. La estructura del proceso en SAS es la siguiente:

Gráfico 10: Diagrama de Estructura utilizada en SAS Enterprise Miner.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

51

Esta estructura corresponde al proceso de generación de los modelos. El primer paso,

generar datos correctos, comienza con la utilización de la tabla (en este caso de 116

productos (sin marca) con 100.000 registros llamada Registros Clientes. Posteriormente se

realiza una sustitución de variables ordinales y de intervalo por binarias55 (nodo Cambio

Variables)56.

El tercer paso corresponde al ajuste de las variables para ser estudiadas según el producto

(Aceite, Rubor o Gelatina), luego se generan las condiciones de remuestreo57 (resampling) y

finalmente se ejecuta cada uno de los modelos. El último paso determina una comparación

entre los modelos, que permitirá discernir entre la utilidad de unos y otros para encontrar

patrones de comportamiento en Grandes Superficies Colombianas.

No es el propósito de este documento describir en profundidad el manejo del software SAS y

por esa razón no se expondrá en su totalidad el manejo paso a paso. Para mayor

información, remítase a las referencias bibliográficas sobre SAS58.

En todos los casos, se escogió dentro de los modelos pasados por remuestreo, aquel que,

evaluado en su valor lift, se encuentra en la quinta mejor posición entre diez. La razón es

porque estadísticamente la mediana es una medida aceptable, y en este caso es

perfectamente viable asumir que el caso intermedio, con lift intermedio, será el que

represente la tendencia central de todos los modelos estudiados.

A continuación se muestra la distribución de los productos escogidos para entender su

probabilidad dentro del modelo.

55 Una variable ordinal es aquella que se distribuye entre algunos pocos valores que se caracterizan por tener un orden (El estrato es un buen ejemplo). Una variable de intervalo es aquella que además de las características de la variable ordinal, tiene un cero absoluto y se distribuye entre valores numéricos cuya distancia entre unos y otros es siempre la misma (La edad es un ejemplo). Finalmente, una variable binaria es aquella que tiene únicamente dos valores posibles, usualmente verdadero-falso o 1-0. 56 En este nodo se realiza un proceso en el cual se pasa, por ejemplo, de tener una única variable estrato con cinco valores, a tener cinco variables estrato_1 a estrato_5 cada una con valor binario. 57 El remuestreo se realiza mediante la técnica de bagging, que corresponde a un método estadístico de muestreo que realiza tomas aleatorias sobre el conjunto de datos, de tal forma que en promedio el 63.5% de los casos estudiados por el modelo serán diferentes. Esto representa una ventaja para evitar sobreestimaciones y subestimaciones dentro de los métodos de minería de datos, al proveer series diferentes de datos. Este tipo de algoritmo fue creado por Leo Breiman (El mismo autor de ‘Classification and Regression Trees’, esta vez en su escrito ‘Bagging Predictors, Machine Learning’ de 1996). 58 Entre otras: ‘Predictive Modeling Using SAS Enterprise Miner 5.1’ y ‘Applying Data Mining Techniques Using SAS Enterprise Miner’.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

52

5.4.1. Distribución del Aceite de Cocina

Gráfico 11: Aceite de Cocina vs. Porcentaje. Obtenido de SAS Enterprise Miner con base en los registros generados automáticamente

El estado 1, concerniente a las personas que adquirieron este producto del total,

corresponde a 3.73% de los clientes.

5.4.2. Distribución de: Rubor

Gráfico 12: Rubor vs. Porcentaje. Obtenido de SAS Enterprise Miner con base en los registros generados automáticamente

El estado 1, concerniente a las personas que adquirieron este producto del total,

corresponde a 1.67% de los clientes.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

53

5.4.3. Distribución de: Gelatina

Gráfico 13: Gelatina vs. Porcentaje . Obtenido de SAS Enterprise Miner con base en los registros generados automáticamente

El estado 1, concerniente a las personas que adquirieron este producto del total,

corresponde a 4.62% de los clientes.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

54

5.5. Las Técnicas de Minería de Datos sobre el Mode lo Experimental

El resultado de un modelo de minería de datos se mide en dos fases. La primera es la

capacidad de explicar datos o como en el caso de esta investigación, mostrar patrones de

comportamiento; la segunda es en términos de Ganancia (Lift)59. Esta segunda permitirá al

final comparar que tan bueno es un modelo frente a otro.

Se crearon tres diferentes grupos de información para cada uno de los modelos, que

corresponden a los utilizados para encontrar patrones frente a los productos: ‘Aceite de

cocina’, ‘Rubor’, y ‘Gelatina’.

Además se utiliza un proceso de remuestreo (resampling) que incluye diez procesos

consecutivos sobre los datos para tomar los datos promedio que realmente se ajusten a los

resultados y así se evite un error estadístico en el manejo de los resultados.

El procedimiento de la aplicación de las técnicas de minería de datos debe resultar en la

localización de los siguientes tres patrones, parte de los encontrados en el anexo 3:

• ‘Mujeres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Ventas compran: Aceite de

Cocina Ideal y Tampones O.B.’.

• ‘Mujeres de estrato 3 que tienen entre 35 y 44 años y que trabajan en administrativa compran:

Productos para Limpieza Facial Helena Rubinstein y Rubor Revlon’.

• ‘Mujeres de estrato 3 que tienen entre 35 y 44 años y que trabajan en Ventas compran: Champú

Finesse, Esmalte de Uñas Helena Rubinstein, Gelatina Arcoiris, Jugos Envasados Listos Orense

Premium, Maltas de Otras marcas, Productos Faciales Hidratantes Yardley, Productos para

Limpieza Facial Atrix, Remedios para el Malestar Estomacal Imodium’.

Como ya se explicó, estos productos tienen la característica de ser poco comunes y al mismo

tiempo compartir patrones con al menos otro producto. Esta situación permite saber si una

estimación por parte de los modelos se refiere a un error por falsos positivos o si por el

contrario los modelos han logrado predecir con buena certeza los patrones ingresados.

59 Capítulo 3.2.7. de este documento

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

55

5.5.1. Árboles de Clasificación:

Los árboles de clasificación son un buen método que en su mayoría se puede asimilar como

gráfico y por lo tanto sencillo de ver, leer e interpretar. Sin embargo, el modelaje se realizó

con la intención de poner a prueba el método frente a patrones existentes.

Para este modelo, los árboles están truncados en 10 niveles, y la metodología de selección

evita que cualquier división tenga menos de 50 elementos (en una muestra de 10.000). Se

utilizó siempre la metodología GINI para obtener las particiones más puras.

SAS Enterprise Miner entrega información importante junto con el esquema de árboles de

clasificación, de la siguiente forma:

En cada nodo, aparecen tres columnas, la primera se refiere a la nomenclatura del

resultado, la segunda a los datos de prueba y la tercera a los de validación.

Horizontalmente, las dos primeras filas se refieren al comportamiento porcentual de los

posibles resultados (en este caso 1 ó 0), y las siguientes dos a la cantidad de elementos que

cumplen con los citados resultados binarios.

Finalmente, la última fila, corresponde al total de los elementos que se están teniendo en

cuenta para realizar los cálculos.

Los porcentajes citados a continuación corresponden siempre al caso positivo (1) salvo que

sea indicado de otro modo, y para la partición de prueba (columna central).

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

56

5.5.1.1. Con referencia a ‘Aceite de Cocina’

Gráfico 14: Arbol resultante del modelo utilizando ‘Aceite de Cocina’.

Obtenido de SAS Enterprise Miner con base en los registros generados automáticamente

El árbol muestra que aquellos que compran Tampones (51.9% de los que consumen aceite

de cocina) y que pertenecen al estrato 3 (85.9% de los que compran tampones), están

seriamente ligados al producto ‘aceite de cocina’. Esta situación se encuentra reflejada en

55 casos y se asemeja al patrón ‘Mujeres de estrato 3 que tienen entre 25 y 34 años y que

trabajan en Ventas compran: Aceite de Cocina Ideal y Tampones O.B.’.

El árbol ha clasificado correctamente los dos productos pertenecientes a este patrón. Sin

embargo, también ha mostrado otras relaciones, como el hecho de que se presenta aceite

de cocina junto con productos para el control del acné (cuando los tampones no están

presentes), y la leche (33.3% de los que consumen productos para el control del acné).

Este patrón aparece en 46 entre diez mil consumidores y se asemeja a ‘Hombres de estrato 3

que tienen entre 25 y 34 años y que trabajan en Ventas compran: Absorbentes para Incontinencia

Urinaria de Otras marcas, Aceite de Cocina Ideal, Bebidas Energizantes Erektus ó UFO, Leche Deleyte,

Productos para el Control del Acné Clinique y Tequila Sauza’.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

57

5.5.1.2. Con referencia a ‘Rubor’

Gráfico 15: Arbol resultante del modelo utilizando ‘Rubor’.

Obtenido de SAS Enterprise Miner con base en los registros generados automáticamente

Este árbol muestra una asociación clara de tres variables, el hecho que el consumidor

compre rubor implica la existencia de productos para la limpieza facial (12.5% de los que

usan rubor), en personas que tienen profesiones administrativas (81% de los que usan

productos para la limpieza facial). Este patrón se observa en 43 entre diez mil ocasiones y

es claramente similar al de ‘Mujeres de estrato 3 que tienen entre 35 y 44 años y que trabajan en

administrativa compran: Productos para Limpieza Facial Helena Rubinstein y Rubor Revlon’.

Ante la inexistencia de otros nodos, se puede concluir que en este caso, existe una relación

directa que el árbol fue capaz de predecir. Sin embargo, se debe anotar que aún así no

explicó las variables demográficas del patrón, con excepción de la profesión administrativa.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

58

5.5.1.3. Con referencia a ‘Gelatina’

Gráfico 16: Arbol resultante del modelo utilizando ‘Gelatina’.

Obtenido de SAS Enterprise Miner con base en los registros generados automáticamente

Este modelo muestra que aquellos que consumen gelatina (4.9% del total), consumen

también Productos Faciales Hidratantes (21.2% de los que consumen gelatina) y Champú

(88.6% de los que consumen esmalte de uñas). Este patrón se asemeja a ‘Mujeres de estrato

3 que tienen entre 35 y 44 años y que trabajan en Ventas compran: Champú Finesse, Esmalte de Uñas

Helena Rubinstein, Gelatina Arcoiris, Jugos Envasados Listos Orense Premium, Maltas de Otras marcas,

Productos Faciales Hidratantes Yardley, Productos para Limpieza Facial Atrix, Remedios para el

Malestar Estomacal Imodium’.

El modelo es bastante lacónico con respecto al patrón establecido. No se puede decir

claramente que las 35 de cada diez mil personas que consumen champú, esmalte de uñas y

gelatina, sean el total de personas que pertenecen al patrón establecido.

Las razones para este exceso de concreción son varias. Entre ellas, el hecho que las

particiones se hacen con mínimo 50 elementos (y desde ya hay 35). Otras razones incluyen

la posibilidad de falsos positivos generados por la porción aleatoria de la simulación, la baja

cantidad de personas que cumplen con los datos demográficos del patrón y la situación de

enfrentarse a un patrón con nueve productos donde usualmente hay entre 1 y 5.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

59

5.5.2. Regresión Logística:

La regresión logística es un método estadístico de obtener predicciones, en este caso

patrones de comportamiento. La idea general alrededor es que busca los productos cuyos

coeficientes de regresión superan la prueba estadística y por lo tanto son significantes, es

decir, explican en parte, en este caso, la existencia de un producto específico. Para preparar

el modelo, se ha utilizado una metodología de selección de variables ‘Stepwise’60. También

se hace uso del método de optimización Double Dogleg61, que será el medio utilizado para

obtener la información de máximos y mayores valores de significancia y confiabilidad.

Los resultados obtenidos de la regresión consistirán en una tabla de productos que son

significativos y se asocian más fuertemente a los objetivos (‘Aceite de Cocina’, ‘Rubor’ y

‘Gelatina’).

Se utilizará el método de la Prueba T para conocer la significancia de los productos frente al

modelo62, ya que es éste el método de prueba que permite saber de forma clara si un

estimador de regresión tiene las características necesarias para ser verosímil ante la

regresión. SAS excluye las variables no significantes según su valor-p.

Los resultados tienen además un signo. La hipótesis nula de la regresión es que un

producto no se compra, es decir que el valor de la variable binaria objetivo es cero. Cuando

el signo es positivo, significará que se fortalece la hipótesis de que no se compra. En caso

de signo negativo, la variable irá en el sentido contrario y por lo tanto fortalecerá el hecho

de que se compre. Esta particularidad también es importante a la hora de encontrar las

relaciones, pues aquellas que tienen signo positivo, serán inversas (es decir que si se

encuentra en un registro de compra cualquiera de las variables con signo positivo, existe

una chance importante de que el producto objetivo no se encuentre en ese registro), y

aquellas que tienen signo negativo serán las que componen los patrones de consumo.

60 Esta metodología hace referencia a seleccionar las variables que más se ajustan al modelo utilizando, en principio, solo una, para posteriormente aumentar el número comparando con el nivel de significancia de la regresión. Aquellas que sobrepasan el nivel, o lo influencian, son tomadas. En este modelo es posible que una variable escogida en un principio sea posteriormente excluída. 61 El modelo Double Dogleg es un optimizador general no lineal que maneja las variables de forma tal que las clasifica y selecciona de modo que las predicciones se acerquen más a las deseadas. Este modelo tiene también la ventaja de ser bastante rápido. Para más información remítase a SAS Enterprise Miner Reference. 62 En Probabilidad y Estadística aplicadas a la Ingeniería, Montgomery et al. P558-560, se puede encontrar detalladamente el proceso de la prueba T para coeficientes de regresión lineal.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

60

5.5.2.1. Con referencia a ‘Aceite de Cocina’

La regresión ha encontrado, como se esperaba,

que el producto que más se relaciona con el

aceite de cocina son los tampones (con un

excluyente 13.7484 de efecto), seguido por la

profesión de ventas (6.98), situación laboral:

Trabaja (6.013), y posteriormete Estrato 3

(5.018). Esta estructura se asemeja al patrón

‘Mujeres de estrato 3 que tienen entre 25 y 34 años

y que trabajan en Ventas compran: Aceite de Cocina

Ideal y Tampones O.B.’.

También este modelo muestra que si bien no

con el mismo nivel de efecto, los productos

correspondientes al patrón ‘Hombres de estrato 3

que tienen entre 25 y 34 años y que trabajan en

Ventas compran: Absorbentes para Incontinencia Urinaria de Otras marcas, Aceite de Cocina Ideal,

Bebidas Energizantes Erektus ó UFO, Leche Deleyte, Productos para el Control del Acné Clinique y

Tequila Sauza’ también se encuentran dentro de este modelo exceptuando Leche.

Esos productos faltantes, así como

la inclusión de algunos falsos

positivos (como las demás

profesiones citadas en la tabla, la

edad de 12 a 19, el queso crema y

la pestañina), se deben al efecto

de sobreestimación a que está

sometido con frecuencia el modelo

de regresión lineal. Otras razones

son la existencia de valores aleatorios que pueden influir en la existencia de otros productos

y un algoritmo ‘Stepwise’ que pudo sustentar erróneamente la significancia de una variable.

Efecto Producto Prueba T Absoluto (T) SignoX1 TAMPONES 0 -13,748410 13,748410 -X2 PROF_OF_VENTAS__ 0 -6,986347 6,986347 -X3 SITLAB_TRABAJA 0 -6,013441 6,013441 -X4 PROF_OF_JURIDICA 0 -5,686046 5,686046 -X5 ABSORBENTES_PARA_INC 0 -5,607194 5,607194 -X6 PROF_OF_TRANSPOR 0 -5,455787 5,455787 -X7 ESTRATO_3 0 -5,018488 5,018488 -X8 PRODUCTOS_PARA_EL_CO 0 -4,766970 4,766970 -X9 PROF_OF_MANTENIM 0 -4,510260 4,510260 -X10 PROF_OF_ENTRETEN 0 -4,490550 4,490550 -X11 PROF_OF_SERVIGEN 0 -4,122959 4,122959 -X12 PANALES_DESECHABLES 0 3,721677 3,721677 +X13 PROF_OF_OTRSERVI 0 -3,653097 3,653097 -X14 PROF_OF_SALUD___ 0 -3,473286 3,473286 -X15 BEBIDAS_HIDRATANTES 0 3,455620 3,455620 +X16 PROF_OF_CONSTRUC 0 -3,386769 3,386769 -X17 JUGOS_ENVASADOS_LIST 0 3,350856 3,350856 +X18 REFRESCOS_EN_POLVO 0 3,017653 3,017653 +X19 PERFUMES_Y_COLONIAS 0 2,999065 2,999065 +X20 PROF_OF_EDUCACIO 0 -2,985725 2,985725 -X21 TEQUILA 0 2,961987 2,961987 +X22 VITAMINAS__CALCIO_Y_ 0 2,765094 2,765094 +X23 MANTEQUILLA_Y_MARGAR 0 2,684284 2,684284 +X24 EDAD_55_64 0 2,671117 2,671117 +X25 SITLAB_OTRA___ 0 -2,638284 2,638284 -X26 CHICLES 0 2,612159 2,612159 +X27 PROF_OF_PRODUCCI 0 -2,560519 2,560519 -X28 PASABOCAS_EN_PAQUETE 0 2,498487 2,498487 +X29 QUESO_CREMA 0 -2,489232 2,489232 -X30 PESTANINA 0 -2,458867 2,458867 -X31 ADEREZOS_PARA_ENSALA 0 2,371732 2,371732 +X32 EDAD_12_19 0 -2,256954 2,256954 -

Tabla 1: Valores de la prueba T de estimadores Tomado de SAS Enterprise Miner

Gráfico 17: Regresión Lineal usando ‘Aceite de Cocina’. Obtenido de SAS Enterprise Miner con base en los registros

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

61

5.5.2.2. Con referencia a ‘Rubor’

El modelo sobre la variable rubor encontró

que el elemento que más se relaciona con

ésta son los Productos para Limpieza Facial

(10.247), seguido de la profesión

administrativa (9.603), y el sexo femenino

(2.791); comprobando nuevamente el

patrón ‘Mujeres de estrato 3 que tienen entre

35 y 44 años y que trabajan en administrativa

compran: Productos para Limpieza Facial Helena

Rubinstein y Rubor Revlon’.

Sin embargo, se debe resaltar que no se

ingresaron otros patrones significativos con

éste producto y sin embargo es bastante

claro que también está relacionada de forma

negativa (se compra también) Café

Instantáneo, Labial, Colorete, Brillo, y Cera

para Muebles entre otros, que se convertirían

en falsos positivos, sin perjuicio de la

absoluta certeza con que el modelo predijo el

comportamiento antes mencionado.

También se puede aclarar que el modelo de regresión propone que las personas de estrato

2, o las que consumen Perfumes y colonias o chicles, están inversamente relacionados con

un producto como el rubor. Esto significa que en condiciones normales, una persona no

comprará rubor si cumple con cualquiera de las características mencionadas.

Efecto Producto Prueba T Absoluto (T) SignoX1 PRODUCTOS_PARA_LIMPI 0 -10,247103 10,247103 -X2 PROF_OF_ADMINIST 0 -9,602918 9,602918 -X3 PROF_OF_TRANSPOR 0 -5,732335 5,732335 -X4 PERFUMES_Y_COLONIAS 0 5,281016 5,281016 +X5 PROF_OF_FINANZAS 0 -4,459812 4,459812 -X6 CAFE_INSTANTANEO 0 -4,337617 4,337617 -X7 LABIAL_COLORETE_BRIL 0 -3,390936 3,390936 -X8 CERA_PARA_MUEBLES 0 -3,304631 3,304631 -X9 ESTRATO_2 0 3,238805 3,238805 +X10 VERDURAS_ENLATADAS 0 -3,145632 3,145632 -X11 POSTRES_ENVASADOS_LI 0 -3,126307 3,126307 -X12 PROF_OF_SERVIGEN 0 -2,996501 2,996501 -X13 VITAMINAS__CALCIO_Y_ 0 -2,880776 2,880776 -X14 EDAD_20_24 0 -2,802490 2,802490 -X15 SEXO_F 0 -2,791432 2,791432 -X16 CHICLES 0 2,640393 2,640393 +X17 UNGUENTOS__CREMAS_Y_ 0 -2,506961 2,506961 -

Tabla 2: Valores de la prueba T de estimadores Tomado de SAS Enterprise Miner

Gráfico 18: Regresión Lineal usando ‘Rubor’ Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

62

5.5.2.3. Con referencia a ‘Gelatina’

Según este modelo de regresión, las variables que

se relacionan (signo -) con la gelatina son:

Productos Faciales Hidratantes (3.986), Remedios

para el Malestar Estomacal (3.893), Esmalte de

uñas (3.758) y edad de 35 a 44 años (3.025) entre

otras.

El patrón se asemeja a ‘Mujeres de estrato 3 que

tienen entre 35 y 44 años y que trabajan en Ventas

compran: Champú Finesse, Esmalte de Uñas Helena

Rubinstein, Gelatina Arcoiris, Jugos Envasados Listos

Orense Premium, Maltas de Otras marcas, Productos

Faciales Hidratantes Yardley, Productos para Limpieza

Facial Atrix, Remedios para el Malestar Estomacal

Imodium’. Si bien no lo explica en su totalidad, es bastante claro que este patrón está

descrito en el modelo de regresión.

Este modelo mostró además algunas características de otro patrón que contiene gelatina,

que se trata de ‘Mujeres de estrato 2 que tienen entre 35 y 44 años y que trabajan en Ventas

compran: Gelatina Arcoiris, Jabones de

Tocador Líquidos Neutrogena, Jugos Envasados

Listos Colibrí, Perfumes y Colonias Estée

Lauder’. La regresión ha encontrado que

el jabón de tocador líquido (1.768) y los

perfumes y colonias (2.002) también se

relacionan con la gelatina, y por lo tanto

corresponden también a un patrón de

comportamiento.

Se debe destacar que el Estrato 2, que

hace parte del segundo patrón descrito, aparece como fuertemente inverso a la gelatina,

mostrando que existen descriptores de falsos positivos y efectos generados por la

aleatoriedad de la prueba que permiten este tipo de situaciones.

Efecto Producto Prueba T Absoluto (T) SignoX1 Intercept:GELATINA=1 -7,299742009 7,299742009 -X2 ESTRATO_2 0 5,240728465 5,240728465 +X3 PRODUCTOS_FACIALES_H 0 -3,986404856 3,986404856 -X4 REMEDIOS_PARA_EL_MAL 0 -3,892567343 3,892567343 -X5 CERVEZA 0 3,800868363 3,800868363 +X6 ESMALTE_DE_UNAS 0 -3,758209084 3,758209084 -X7 AGUA_ENVASADA 0 3,394930096 3,394930096 +X8 POSTRES_ENVASADOS_LI 0 3,153026769 3,153026769 +X9 ESTRATO_5 0 -3,084157348 3,084157348 -X10 EDAD_35_44 0 -3,024742896 3,024742896 -X11 PAN_EMPACADO 0 2,975474761 2,975474761 +X12 PASABOCAS_EN_PAQUETE 0 2,968565281 2,968565281 +X13 DULCES_GOLOSINAS_GOM 0 2,913218521 2,913218521 +X14 DESODORANTES_Y_ANTIT 0 2,820368869 2,820368869 +X15 ESTRATO_3 0 2,732517614 2,732517614 +X16 VERDURAS_ENLATADAS 0 2,707937786 2,707937786 +X17 PROF_OF_ENTRETEN 0 -2,542831684 2,542831684 -X18 PROF_OF_SEGURIDA 0 -2,466488112 2,466488112 -X19 DETERGENTES_Y_JABONE 0 2,450631816 2,450631816 +X20 PAPEL_HIGIENICO 0 2,394823287 2,394823287 +X21 LECHE 0 2,332455752 2,332455752 +X22 CONDONES 0 2,276046211 2,276046211 +X23 COMIDA_PERROS_Y_GATO 0 -2,262899585 2,262899585 -X24 GASEOSAS 0 2,245142125 2,245142125 +X25 POLVOS_Y_BASE_FACIAL 0 2,194206574 2,194206574 +X26 ABSORBENTES_PARA_INC 0 2,170722022 2,170722022 +X27 ATUN_ENLATADO 0 2,03032162 2,03032162 +X28 TOALLAS_HIGIENICAS 0 2,021954835 2,021954835 +X29 WHISKY 0 2,015531959 2,015531959 +X30 PERFUMES_Y_COLONIAS 0 -2,002370926 2,002370926 -X31 MANTEQUILLA_Y_MARGAR 0 1,989924638 1,989924638 +X32 JABONES_DE_TOCADOR_L 0 -1,767972398 1,767972398 -

Tabla 3: Valores de prueba T de estimadores Tomado de SAS Enterprise Miner

Gráfico 19: Regresión Lineal usando ‘Gelatina’ Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

63

5.5.3. Redes Neuronales:

Las redes neuronales son un método estadístico que implica internamente una regresión

sobre los datos, pero que tiene como característica esencial que con el paso del tiempo se

hace cada vez más acertado en predecir los comportamientos.

Para este modelo en particular, se utilizó una red basada en 10 neuronas distribuidas en una

única capa oculta, que realiza 50 iteraciones antes de arrancar el modelo de entrenamiento

y predicción. El entrenamiento lo realiza mediante el método Double Dogleg63 que efectúa

mínimo 100 y máximo 500 iteraciones.

Interpretar los resultados de una red neuronal es particularmente difícil. Los resultados son

entregados en términos de coeficientes llamados ‘pesos’ que muestran el puntaje y

distribuidos entre neuronas que muestran su relación con el producto objetivo.

La forma de leer correctamente esos datos es en concordancia con los modelos de mapas

auto-organizados. La última capa de neuronas (en este caso única), influencia directamente

al objetivo, y aquella neurona que lo hace de mayor forma (la de mayor peso positivo; ver

tabla 4) será la encargada de sustentar el modelo. Ahora, se toma el peso relativo que tiene

cada una de las variables de ingreso sobre la neurona escogida. El mayor peso negativo

(Ver tabla 5) será entonces el que corresponde a la variable que más influencia al objetivo.

5.5.3.1. Con referencia a ‘Aceite de Cocina’

El patrón que se busca es ‘Mujeres de

estrato 3 que tienen entre 25 y 34 años y que

trabajan en Ventas compran: Aceite de Cocina

Ideal y Tampones O.B.’.

El primer paso para encontrar ese patrón

es buscar la acción de las neuronas sobre

el producto ‘Aceite de Cocina’.

63 El modelo Double Dogleg de las redes neuronales es exactamente el mismo que el utilizado en regresiones logísticas.

Desde Hacia Peso SignoH13 ACEITE_DE_COCINA1 4,053 +H12 ACEITE_DE_COCINA1 2,116 +H15 ACEITE_DE_COCINA1 1,240 +H110 ACEITE_DE_COCINA1 0,681 +H17 ACEITE_DE_COCINA1 0,405 +H16 ACEITE_DE_COCINA1 0,156 +H18 ACEITE_DE_COCINA1 -0,151 -H11 ACEITE_DE_COCINA1 -0,627 -H14 ACEITE_DE_COCINA1 -1,385 -H19 ACEITE_DE_COCINA1 -1,701 -BIAS ACEITE_DE_COCINA1 -2,220 -

Tabla 4: Pesos de las neuronas sobre el producto ‘Aceite de Cocina’. Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

64

En este caso, la que más lo explica es la H13, con un peso de 4.053. Esto significa que los

productos, como estén clasificados frente a la neurona H13, serán los más acertados para

reconocer el impacto sobre el producto.

Tampones es la variable más representativa

(3.152), seguida de estrato 3 (2.157) y

situación laboral: trabajando (1.2).

Finalmente, muestra que la edad más

representativa son los 25 a 34 años (0.862),

tal como se cita en el patrón.

Muestra también, aunque no totalmente, al

igual que su contraparte de regresión logística,

el patrón ‘Hombres de estrato 3 que tienen entre

25 y 34 años y que trabajan en Ventas compran: Absorbentes para Incontinencia Urinaria de Otras

marcas, Aceite de Cocina Ideal, Bebidas Energizantes Erektus ó UFO, Leche Deleyte, Productos para el

Control del Acné Clinique y Tequila Sauza’.

Existe sin embargo una clasificación incorrecta con el ‘Tequila’ porque aparece con signo

positivo, lo que significa, teóricamente, que es inverso a la adquisición de ‘Aceite de

Cocina’, y como se reconoce en el segundo patrón, esto es claramente errado.

En general, los valores de clasificación de este

modelo son correctos, al existir una ganancia

promedio muy similar entre el entrenamiento

y la validación, con diferencia inferior al 0.2%,

que permite aseverar que el modelo no está

demasiado sobreestimando.

También se puede apreciar la razón

‘Misclassification’ que muestra que tan capaz

es el modelo de clasificar las variables

correctamente. En este caso, se trata de valores supremamente bajos con el aliciente de

tener una diferencia muy baja entre datos de prueba y de validación.

Desde Hacia Peso Absoluto SignoTAMPONES0 H13 -3,152 3,152 -ESTRATO_30 H13 -2,157 2,157 -PRODUCTOS_PARA_EL_CO0 H13 -1,878 1,878 -ABSORBENTES_PARA_INC0 H13 -1,512 1,512 -TEQUILA0 H13 1,453 1,453 +ESTRATO_60 H13 -1,385 1,385 -SITLAB_TRABAJA0 H13 -1,200 1,200 -QUESO_CREMA0 H13 -1,199 1,199 -PROF_OF_ENTRETEN0 H13 1,033 1,033 +ACONDICIONADORES0 H13 -0,960 0,960 -EDAD_25_340 H13 -0,862 0,862 -CHOCOLATINAS0 H13 -0,759 0,759 -VITAMINAS__CALCIO_Y_0 H13 -0,680 0,680 -PANALES_DESECHABLES0 H13 0,503 0,503 +BEBIDAS_HIDRATANTES0 H13 0,468 0,468 +BIAS H13 -0,386 0,386 -PROTECTORES_DIARIOS0 H13 -0,217 0,217 -ESPONJAS__ESPONJILLA0 H13 -0,187 0,187 -UNGUENTOS__CREMAS_Y_0 H13 -0,034 0,034 -

Tabla 5: Pesos de productos sobre la neurona H13. Tomado de SAS Enterprise Miner

Tabla 6: Valores estadísticos de la regresión sobre ‘Aceite de Cocina’. Tomado de SAS Enterprise Miner.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

65

5.5.3.2. Con referencia a ‘Rubor’

Este modelo muestra que la neurona que más

explica (tiene mayor peso positivo) la

existencia de rubor es la H11, y por lo tanto

será ésta la evaluada.

Con esa información se explica el patrón que

contiene las variables Situación laboral:

Trabaja (1.643), Sexo Femenino (1.603),

profesión administrativa (1.389) y productos

para limpieza facial (1.091), parte del patrón ‘Mujeres de estrato 3 que tienen entre 35 y 44 años

y que trabajan en administrativa compran: Productos para Limpieza Facial Helena Rubinstein y Rubor

Revlon’.

Se debe resaltar que al igual que

con la regresión lineal, el modelo

encontró otros productos asociados,

cuando según lo que se conoce por

los patrones, el rubor no está

asociado a más productos.

Finalmente, la tabla muestra que la

ganancia promedio del modelo de

prueba es superior al de validación, pero en una cuantía inferior al 0.3%, razón por la cual

se puede asumir que si bien existe

sobreestimación, ésta no es fuerte y por lo

tanto el modelo es correcto.

También la razón ‘Misclassification’ muestra

que el aprendizaje se ha dado, ya que es

bastante menor en los datos de validación, y

por lo tanto se puede afirmar que el modelo

tiene una buena acertividad en las

clasificaciones que predice.

Desde Hacia Peso SignoH11 RUBOR1 4,005 +H18 RUBOR1 1,166 +H13 RUBOR1 0,700 +H110 RUBOR1 0,461 +H12 RUBOR1 0,260 +H14 RUBOR1 -0,156 -H19 RUBOR1 -0,171 -H16 RUBOR1 -0,184 -H17 RUBOR1 -0,756 -H15 RUBOR1 -0,802 -BIAS RUBOR1 -2,435 -

Tabla 7: Pesos de las neuronas sobre el producto ‘Rubor’ Tomado de SAS Enterprise Miner

Desde Hacia Peso Absoluto SignoSITLAB_TRABAJA0 H11 -1,643 1,643 -PROF_OF_EDUCACIO0 H11 -1,613 1,613 -SEXO_F0 H11 -1,603 1,603 -PRODUCTOS_FACIALES_H0 H11 -1,525 1,525 -PROF_OF_ADMINIST0 H11 -1,389 1,389 -PROF_OF_VENTAS__0 H11 1,155 1,155 +PRODUCTOS_PARA_LIMPI0 H11 -1,091 1,091 -BIAS H11 -1,072 1,072 -COMIDA_PERROS_Y_GATO0 H11 -0,521 0,521 -CERA_PARA_MUEBLES0 H11 -0,473 0,473 -VERDURAS_ENLATADAS0 H11 -0,197 0,197 -SITLAB_ESTUDIA0 H11 -0,083 0,083 -ESTRATO_20 H11 0,059 0,059 +

Tabla 8: Pesos de los diferentes productos sobre la neurona H11 Tomado de SAS Enterprise Miner

Tabla 9: Estadísticos de la regresión sobre ‘Rubor’ Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

66

5.5.3.3. Con referencia a ‘Gelatina’

Esta primera tabla muestra que la neurona H15 es

la que más tiene peso sobre el producto Gelatina.

En este caso, como se está buscando que gelatina

esté (valor 1), la neurona que, con signo positivo,

más influencie el producto, será la más viable.

Así mismo, una vez reconocido eso, se debe buscar

la clasificación de la neurona H15 (Con signo

negativo, mostrando que, al igual que con la regresión logística, el modelo es inverso).

Entre los productos encontrados, se encuentran Remedios para el Malestar Estomacal

(3.854), Jabones de Tocador Líquidos

(3.773), Esmalte de uñas (3.281) y

Productos Faciales Hidratantes (3.034),

que hacen parte del patrón ‘Mujeres de

estrato 3 que tienen entre 35 y 44 años y que

trabajan en Ventas compran: Champú Finesse,

Esmalte de Uñas Helena Rubinstein, Gelatina

Arcoiris, Jugos Envasados Listos Orense

Premium, Maltas de Otras marcas, Productos

Faciales Hidratantes Yardley, Productos para

Limpieza Facial Atrix, Remedios para el Malestar

Estomacal Imodium’.

Este modelo mostró además características

del patrón ‘Mujeres de estrato 2 que tienen entre

35 y 44 años y que trabajan en Ventas compran:

Gelatina Arcoiris, Jabones de Tocador Líquidos

Neutrogena, Jugos Envasados Listos Colibrí,

Perfumes y Colonias Estée Lauder’.

También se observa que tiene una buena

ganancia y buena tasa ‘Misclassification’.

Desde Hacia Peso SignoH15 GELATINA1 4,624065769 +H19 GELATINA1 0,968410776 +H17 GELATINA1 0,526400675 +H16 GELATINA1 0,502276288 +H110 GELATINA1 0,396804926 +H11 GELATINA1 0,328651287 +H13 GELATINA1 -0,212308767 -H14 GELATINA1 -0,372146024 -BIAS GELATINA1 -0,640142719 -H18 GELATINA1 -0,941094781 -H12 GELATINA1 -1,318103557 -

Tabla 10: Pesos de las neuronas sobre el producto ‘Gelatina’. Tomado de SAS Enterprise Miner

Desde Hacia Peso Absoluto SignoREMEDIOS_PARA_EL_MAL0 H15 -3,854 3,854 -JABONES_DE_TOCADOR_L0 H15 -3,773 3,773 -ESMALTE_DE_UNAS0 H15 -3,281 3,281 -PRODUCTOS_FACIALES_H0 H15 -3,034 3,034 -PERFUMES_Y_COLONIAS0 H15 -2,460 2,460 -BIAS H15 -1,958 1,958 -COMIDA_PERROS_Y_GATO0 H15 -1,259 1,259 -VERDURAS_ENLATADAS0 H15 1,218 1,218 +PROF_OF_EDUCACIO0 H15 -1,109 1,109 -CONDONES0 H15 -0,862 0,862 -PASABOCAS_EN_PAQUETE0 H15 0,609 0,609 +PROF_OF_FINANZAS0 H15 0,420 0,420 +ESTRATO_20 H15 -0,398 0,398 -AGUA_ENVASADA0 H15 0,362 0,362 +PROF_OF_SISTEMAS0 H15 -0,355 0,355 -TAMPONES0 H15 -0,280 0,280 -ESTRATO_50 H15 0,258 0,258 +PROF_OF_ENTRETEN0 H15 -0,229 0,229 -DESODORANTES_Y_ANTIT0 H15 0,218 0,218 +DULCES_GOLOSINAS_GOM0 H15 0,217 0,217 +PAN_EMPACADO0 H15 0,166 0,166 +EDAD_35_440 H15 -0,164 0,164 -POSTRES_ENVASADOS_LI0 H15 0,127 0,127 +CERVEZA0 H15 -0,076 0,076 -PROF_OF_SEGURIDA0 H15 -0,015 0,015 -

Tabla 11: Pesos de los productos sobre la neurona H15 Tomado de SAS Enterprise Miner

Tabla 12: Estadísticos de la Regresión sobre ‘Gelatina’ Tomado de SAS Enterprise miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

67

5.5.4. Market Basket Analysis

Este modelo, como fue explicado en el marco teórico, se basa en el manejo de asociaciones

por medio de los tres factores de Soporte, Confianza y Lift. La idea es encontrar los

patrones de comportamiento dentro de la canasta de mercado (más que al interior de los

datos demográficos). De allí que los resultados obtenidos por este modelo de minería de

datos se medirán aparte de los otros tres y estarán dados en términos de asociaciones entre

productos.

Se utilizó el modelo de asociaciones de SAS Enterprise Miner. Para este tipo de estructura,

es necesario hacer una transposición de los datos, ya que la forma de asociar de SAS EM es

por productos y no por registros. En ese sentido, el resultado fue una tabla de

aproximadamente 670.000 registros. Cada uno de los registros representa los datos

demográficos (sexo, edad, estrato, situación y actividad laboral) y un único producto

(objetivo) comprado por ese específico tipo de cliente.

El modelo utilizado es el siguiente:

Gráfico 20: Diagrama de Asociaciones utilizado en SAS Enterprise Miner.

Donde Registros Clientes Asociaciones es la tabla con los datos en el formato antes

explicado, y Reglas de Asociacion es el nodo que realiza el proceso de asociación y genera

los resultados para el modelo. Las reglas de asociación se crearon utilizando una confianza

mínima del 50%, para asociaciones de máximo 4 productos por vez.

Se consiguieron así 11.328 asociaciones al utilizar esta metodología en una tabla de

aproximadamente 67.000 registros (10% de la tabla completa, similar a la muestra tomada

para las demás técnicas de minería de datos). De estas asociaciones, a continuación se

citan las 40 más fuertes según su lift.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

68

ID Confianza Soporte Lift Regla1 51,124% 1,932% 2,380 LECHE & DULCES_GOLOSINAS_GOM & AVENAS_ENVASADAS_LIS ==> CEREALES2 70,667% 2,250% 2,366 REFRESCOS_EN_POLVO & MALTAS & HELADOS_REFRESCOS_CO ==> YOGUR_KUMIS_BEBIDAS_3 57,962% 1,932% 2,289 GASEOSAS & GALLETAS_NO_DULCES & AVENAS_ENVASADAS_LIS ==> PONQUES_DE_PAQUETE4 56,442% 1,953% 2,278 JUGOS_ENVASADOS_LIST & GASEOSAS & AVENAS_ENVASADAS_LIS ==> MALTAS5 65,432% 2,250% 2,278 PONQUES_DE_PAQUETE & GALLETAS_DULCES & CHICLES ==> PASABOCAS_EN_PAQUETE6 63,636% 1,932% 2,252 PONQUES_DE_PAQUETE & GASEOSAS & AVENAS_ENVASADAS_LIS ==> GALLETAS_NO_DULCES7 55,758% 1,953% 2,251 GALLETAS_NO_DULCES & CHOCOLATE & AVENAS_ENVASADAS_LIS ==> MALTAS8 55,224% 2,356% 2,229 PONQUES_DE_PAQUETE & JUGOS_ENVASADOS_LIST & HARINA_DE_TRIGO_O_MA ==> MALTAS9 66,463% 2,314% 2,225 MALTAS & HELADOS_REFRESCOS_CO & AGUA_ENVASADA ==> YOGUR_KUMIS_BEBIDAS_10 63,889% 1,953% 2,225 GALLETAS_DULCES & CHICLES & CEREALES ==> PASABOCAS_EN_PAQUETE11 52,660% 2,101% 2,221 PONQUES_DE_PAQUETE & PASABOCAS_EN_PAQUETE & GALLETAS_NO_DULCES ==> PAN_EMPACADO '12 62,581% 2,059% 2,215 SOPAS_Y_CREMAS_EN_PA & GASEOSAS & DULCES_GOLOSINAS_GOM ==> GALLETAS_NO_DULCES13 54,762% 1,953% 2,211 PONQUES_DE_PAQUETE & LECHE & AVENAS_ENVASADAS_LIS ==> MALTAS14 63,265% 1,974% 2,203 HARINA_DE_TRIGO_O_MA & GALLETAS_DULCES & CEREALES ==> PASABOCAS_EN_PAQUETE15 55,000% 2,568% 2,198 PASABOCAS_EN_PAQUETE & HARINA_DE_TRIGO_O_MA & CHICLES ==> GALLETAS_DULCES16 63,087% 1,995% 2,197 PONQUES_DE_PAQUETE & PAN_EMPACADO & CHICLES ==> PASABOCAS_EN_PAQUETE17 66,897% 2,059% 2,196 PASABOCAS_EN_PAQUETE & MALTAS & CERVEZA ==> JUGOS_ENVASADOS_LIST18 54,922% 2,250% 2,195 REFRESCOS_EN_POLVO & DULCES_GOLOSINAS_GOM & CHICLES ==> GALLETAS_DULCES19 62,987% 2,059% 2,193 PAN_EMPACADO & CHOCOLATINAS & CHICLES ==> PASABOCAS_EN_PAQUETE20 62,712% 2,356% 2,192 REFRESCOS_EN_POLVO & PASABOCAS_EN_PAQUETE & GALLETAS_DULCES ==> CHICLES21 61,333% 1,953% 2,191 YOGUR_KUMIS_BEBIDAS_ & CHOCOLATE & AVENAS_ENVASADAS_LIS ==> AGUA_ENVASADA22 51,777% 2,165% 2,184 PASABOCAS_EN_PAQUETE & HELADOS_REFRESCOS_CO & GALLETAS_NO_DULCES ==> PAN_EMPACADO23 65,217% 2,547% 2,184 MALTAS & HELADOS_REFRESCOS_CO & HARINA_DE_TRIGO_O_MA ==> YOGUR_KUMIS_BEBIDAS_24 54,639% 2,250% 2,183 PONQUES_DE_PAQUETE & PASABOCAS_EN_PAQUETE & CHICLES ==> GALLETAS_DULCES25 54,082% 2,250% 2,183 YOGUR_KUMIS_BEBIDAS_ & REFRESCOS_EN_POLVO & HELADOS_REFRESCOS_CO ==> MALTAS26 51,366% 1,995% 2,180 MALTAS & JUGOS_ENVASADOS_LIST & AGUA_ENVASADA ==> CERVEZA27 51,685% 1,953% 2,180 PASABOCAS_EN_PAQUETE & MALTAS & GALLETAS_NO_DULCES ==> PAN_EMPACADO28 65,068% 2,017% 2,179 PAN_EMPACADO & MALTAS & HELADOS_REFRESCOS_CO ==> YOGUR_KUMIS_BEBIDAS_29 54,497% 2,186% 2,178 LECHE & CHICLES & AVENAS_ENVASADAS_LIS ==> GALLETAS_DULCES30 53,846% 2,080% 2,174 YOGUR_KUMIS_BEBIDAS_ & MEDICINAS_CON_PRESCR & LECHE ==> MALTAS31 62,428% 2,293% 2,174 MALTAS & CHOCOLATINAS & CHICLES ==> PASABOCAS_EN_PAQUETE32 53,810% 2,399% 2,172 YOGUR_KUMIS_BEBIDAS_ & REFRESCOS_EN_POLVO & HARINA_DE_TRIGO_O_MA ==> MALTAS33 67,532% 2,208% 2,169 MALTAS & GALLETAS_DULCES & AGUA_ENVASADA ==> HARINA_DE_TRIGO_O_MA34 54,229% 2,314% 2,167 PONQUES_DE_PAQUETE & PASABOCAS_EN_PAQUETE & HARINA_DE_TRIGO_O_MA ==> GALLETAS_DULCES35 51,366% 1,995% 2,166 YOGUR_KUMIS_BEBIDAS_ & MALTAS & DULCES_GOLOSINAS_GOM ==> PAN_EMPACADO36 57,368% 2,314% 2,164 YOGUR_KUMIS_BEBIDAS_ & PASABOCAS_EN_PAQUETE & MALTAS ==> REFRESCOS_EN_POLVO37 53,540% 2,568% 2,161 YOGUR_KUMIS_BEBIDAS_ & REFRESCOS_EN_POLVO & CHOCOLATE ==> MALTAS38 64,539% 1,932% 2,161 MALTAS & HELADOS_REFRESCOS_CO & CERVEZA ==> YOGUR_KUMIS_BEBIDAS_39 53,488% 1,953% 2,159 REFRESCOS_EN_POLVO & PAN_EMPACADO & HARINA_DE_TRIGO_O_MA ==> MALTAS40 57,225% 2,101% 2,158 MALTAS & CHOCOLATINAS & CHICLES ==> REFRESCOS_EN_POLVO

Entre los patrones encontrados, hay algunos que parecen bastante lógicos, como aquella

cansta que contiene ‘Ponqués de paquete’, ‘Pasabocas en paquete’ y ‘Galletas no dulces’,

que tiene una fuerte implicación sobre contener también ‘Pan empacado’.

Pero también existen otros como el que incluye ‘Yogur, kumis o bebidas lácteas’, ‘Medicinas

con prescripción’ y ‘Leche’ que tiene una fuerte asociación a comprar ‘Maltas’.

Las tres asociaciones buscadas con los demás modelos de minería de datos, no fueron

encontradas con este método porque se trata de productos que tienen una baja aparición en

las tablas de registros de ventas y por lo tanto, las estadísticas de clasificación estudiadas

para cada variable no tienen un valor suficientemente alto para ser incluidas por el software.

Este fenómeno es particularmente diciente acerca de la necesidad de estructurar

Tabla 13: Reglas de asociación encontradas usando el modelo de Market Basket Análisis Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

69

correctamente los problemas que se van a solucionar utilizando estas técnicas de minería de

datos.

En cuanto a la comparación de modelos, éste modelo no puede ser equiparado a los otros

tres a través de Lift, ya que la base de transacciones sobre la que está sustentado es

sustancialmente diferente a aquella sobre la que funcionan los demás modelos. Aún así, se

puede apreciar con facilidad la capacidad que tiene de mostrar patrones de comportamiento

en volúmenes importantes de datos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

70

5.6. Comparación de Modelos de Minería de Datos

Para esta comparación se utilizará la razón Lift, explicada en el capítulo 3.2.7. de este

documento. Se debe aclarar que en la comparación de modelos no participa el de Market

Basket Analysis, ya que ese método está basado en otra agrupación de datos y por lo tanto

el resultado de confrontar sus mediciones sería, en el mejor de los casos, inconsistente.

Las curvas Lift utilizadas para la comparación son, en todos los casos, la quinta con mayor

lift acumulado en el percentil 50, tal y como se mencionó en el capítulo 5.4. de este

documento, utilizando así la tendencia central mediana.

5.6.1. ‘Aceite de Cocina’

El comparativo en términos de Aceite de cocina

es bastante diciente. El modelo de regresión y el

de red neuronal son prácticamente iguales,

diferenciados levemente por los percentiles 40 al

70, siendo sin embargo mayor el de regresión.

El árbol, en cambio, es el menor de todos y

muestra claramente que su ventaja para

predecir este comportamiento es menor que la

de los otros dos métodos.

En cuanto a la capacidad de encontrar

específicamente el patrón buscado, se pudo

notar en el capítulo 5.4.1 que el modelo de

regresión es también el que se ajusta mejor al

patrón buscado, seguido muy de cerca por el modelo de redes, que predice básicamente las

mismas situaciones, y finalmente el de árboles, que fue capaz de predecir únicamente parte

de uno de los dos patrones posibles.

El resultado es, entonces, que para encontrar patrones cercanos al producto ‘Aceite de

Cocina’, el modelo de regresión logística es el que mejores resultados entrega, y el de

árboles el menos predictivo.

Gráfico 21: Lift comparativo de los tres modelos sobre el producto ‘Aceite de Cocina’. Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

71

5.6.2. ‘Rubor’

El resultado de la comparación de modelos en

términos de lift, muestra que en este caso el

modelo de Red Neuronal es mejor predictor que

sus dos contrapartes.

En esta situación es particularmente obvio que

el manejo de las redes supera ampliamente

cualquier tipo de uso que se de por medio de

otros modelos. Si bien clasificar no es el fuerte

de este método de minería de datos, si se

puede mostrar que enfrentado a la regresión,

en este caso específico, es capaz de superarla

ampliamente.

En términos de capacidad de encontrar los patrones preestablecidos, la red también ha sido

la más clara a la hora de mostrar resultados.

5.6.3. ‘Gelatina’

En la Gelatina se presenta el mismo fenómeno,

esta vez más acentuado. La red neuronal es

bastante mejor modelo predictivo y el árbol de

clasificación se queda resagado fuertemente.

Esta situación se debe probablemente al hecho

que su funcionamiento está truncado a nodos

que al menos tienen 50 elementos.

La regresión sigue el mismo camino de la red

neuronal y finalmente como modelo de

clasificación se encuentra prácticamente en la

misma situación de su contraparte neuronal.

Gráfico 22: Lift comparativo de los tres modelos sobre el producto ‘Rubor’

Tomado de SAS Enterprise Miner

Gráfico 23: Lift comparativo de los tres modelos sobre el producto ‘Gelatina’.

Tomado de SAS Enterprise Miner

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

72

6. Conclusiones

Según los boletines trimestrales de almacenes del DANE, cada vez aumenta el número de

clientes que realiza sus compras en grandes superficies, y por lo tanto, entre más crece esa

cantidad, mayores son los datos que pueden ser utilizados para obtener patrones

significativos de comportamiento.

Con ese aumento, conocer el comportamiento de los clientes se hace cada vez más

necesario puesto que permite, entre otras muchas cosas, atender de mejor forma a cada

consumidor, ayudándolo en sus compras, e inclusive informándolo de productos

complementarios o alternativos que puede adquirir, de forma tal que aumente el total de su

compra y así mismo se haga más efectivo, por ejemplo, un medio de publicidad.

La simulación permite emular el comportamiento de los clientes de grandes superficies a

través de la creación de datos por medio de modelos computacionales. Este tipo de

simulaciones son muy útiles para casos como este, en el cual trabajar con una fuente de

datos real es muy complicado. Por lo tanto, se debe tener en cuenta como una forma

válida, correcta y comprobable de estudiar diversos modelos cuando éstos no están

disponibles.

Por otra parte, la minería de datos es una herramienta para obtener mayor provecho de la

información y como tal, es útil a la hora de predecir, afirmar, clasificar y categorizar los

comportamientos de los clientes, permitiendo que las empresas que lo pongan en práctica,

se beneficien de esas estructuras de datos que por años han tenido y que por cualquier

motivo simplemente no ponen en práctica.

Los métodos de minería de datos son herramientas importantes a la hora de encontrar

información relevante en los grandes volúmenes de datos que existen en la mayoría de

empresas que han sistematizado sus modelos de compra y manejos de inventario. Esto

significa que, utilizando aplicaciones como SAS Enterprise Miner, esas compañías tienen en

sus manos una gran cantidad de información que podría beneficiar tanto sus ingresos al

aumentar las ventas y obtener más de cada consumidor, como disminuir sus costos y gastos

a través de la reducción de inventarios y de ciclos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

73

Los patrones simulados en el transcurso de esta investigación contienen información

importante, si bien incompleta, acerca de los consumidores y en particular de aquellos de las

grandes superficies, que pueden servir como base para reconocer la capacidad que tienen

ciertos productos para atraer la compra de otros, así como las falencias en términos

logísticos que pueden existir al permitir que productos altamente relacionados se encuentren

en lugares distantes o inapropiados.

Cada modelo de minería de datos tiene una ventaja sobre los demás, es así que, por

ejemplo, se encontró que los árboles son un poco más acertivos a la hora de realizar

clasificaciones, mientras que los modelos de regresión (incluyendo a las redes neuronales),

son más efectivos para obtener resultados puntuales, como ganancias, o predecir efectos,

como la puntuación futura de una acción bursátil.

Sin embargo, todos tienen la capacidad de realizar pronósticos correctos, y bajo las

condiciones apropiadas, entregar un poco más de información útil para aquellos interesados

en obtenerla. Es así que el ejercicio realizado en esta investigación es importante para

entender realmente la utilidad derivada de utilizar la minería de datos en el reconocimiento

de patrones de comportamiento de los consumidores de grandes superficies colombianas.

Los resultados de generar el modelo de simulación, y sobre él realizar estudios de minería

de datos son de gran importancia para reconocer la utilidad de manejar apropiadamente

esta información, y reconocer cuales modelos se ajustan más a este tipo de estructuras es

también esencial.

La evaluación de ganancia (lift) permite reconocer que el modelo de redes neuronales es el

que tiene la capacidad de realizar con mayor facilidad predicciones sobre los datos, seguido

muy de cerca por el modelo de regresión logística. Los árboles de clasificación muestran

cierta dificultad para predecir en su totalidad los datos. Cabe resaltar que este resultado no

es generalizable y se aplica únicamente a este conjunto de datos.

Las redes neuronales y la regresión logística son modelos complejos, que producen

resultados en términos matemáticos que no son evidentes para la mayoría de las personas;

Por esta razón, así sea claramente más fructífero utilizar éstos dos modelos, en ocasiones es

posible que sea más efectivo utilizar árboles para explicar asociaciones.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

74

Finalmente, el modelo de Market Basket Analysis demostró ser extremadamente útil para

este tipo de estructuras de datos, ya que es el que con mayor propiedad recupera patrones

de comportamiento de los productos, siendo especialmente claro el hecho que simplemente

se asegura de relacionar la existencia de productos específicos en la canasta de mercado con

otros adquiridos en la misma compra. Sin embargo, se concluye que la utilización de este

modelo está sujeta a un correcto planteamiento del problema inicial, ya que el enfoque se

fundamenta directamente en la existencia de productos, no específicamente en un producto

objetivo.

Es así que tanto la investigación como el desarrollo de estos modelos y la simulación, abren

campo para futuras exploraciones que tengan por finalidad conocer un poco más acerca del

comportamiento de los clientes y su relación frente al manejo de las diferentes herramientas

de minería de datos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

75

7. Alcances y Limitaciones

Esta investigación se basó en una simulación del comportamiento de los clientes y por lo

tanto no corresponde a datos observados en la realidad. Si bien los datos generados se

ajustan a las tendencias encontradas en IBOPE y otras fuentes, el proceso de creación es

artificial y necesariamente produce sesgos.

La aplicación que simula los datos para esta investigación puede ser utilizada para futuros

experimentos, a manera de laboratorio de datos, en cursos de investigación de mercados y

minería de datos.

El acceso restringido a la información llevó a replantear la metodología original.

Inicialmente la simulación se basaría en datos obtenidos de fuentes primarias a través de

entrevistas directas a encargados de las secciones de mercadeo de las grandes superficies

colombianas. Se obtuvo únicamente una entrevista en los primeros cinco meses que tomó

realizar la investigación, situación que conllevó a utilizar fuentes secundarias como IBOPE

para complementar el comportamiento de los clientes y obtener los datos necesarios para

realizarla.

Los sistemas computacionales disponibles no son suficientes para realizar análisis como los

efectuados por esta investigación, que incluye originalmente un modelo de 2.500 ítems

(productos y marcas) por 100.000 registros de compra, que corresponde a 250.000.000 de

datos. Esta situación hizo que se debiera tomar una muestra del 10% del total de registros,

y se redujera el número de ítems eliminando las marcas y tomando únicamente los

productos.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

76

8. Bibliografía

8.1. Bibliografía utilizada en la investigación

8.1.1 Libros, Documentos y Papers

• Association Rules, Massachusetts Institute of Technology (MIT), Sloan School of

Management, Open Courseware, Data Mining Course, Lecture Notes.

• Bagging predictors. Machine Learning. Breiman, Leo. p123-140, 1 Ed. 1996.

• Classification Trees, Massachusetts Institute of Technology (MIT), Sloan School of

Management, Open Courseware, Data Mining Course, Lecture Notes.

• Classification and Regression Trees. Breiman, Leo et al. Ed. Wadsworth, 1984.

• Clustering, Massachusetts Institute of Technology (MIT), Sloan School of Management,

Open Courseware, Data Mining Course, Lecture Notes.

• Data Mining Overview, Massachusetts Institute of Technology (MIT), Sloan School of

Management, Open Courseware, Data Mining Course, Lecture Notes.

• Data Mining Techniques: for marketing, sales, and customer relationship management,

Berry, Michael J. A. Linoff, G.S., 2nd ed., 2004.

• Enhance Decision Making using Data Mining: Applications for Retailers. Anderson, Joan

Ph.D., Kotsiopulos, Antigone Ph.D. Journal of Textile and Apparel, Technology and

Management. Volume 2, Issue 3, summer 2002.

• Market Basket Mistery. Nishi, Dennis. Chain Store Age, Retail Technology Quarterly,

May 2005. Suplemento. p12A-14A, 2p, 2c.

• Marketing, Connecting with Customers. Harrel, G.D., Frazier, G.L. 552p. 1Ed. 1999.

Prentice Hall, U.S.A.

• Measuring Inequality: The Origins of the Lorenz Curve and the Gini Coefficient, M.

Schneider, Paper A 04.01. Escuela de Negocios, Universidad La Trobe, Australia

• Neural Nets, Massachusetts Institute of Technology (MIT), Sloan School of Management,

Open Courseware, Data Mining Course, Lecture Notes.

• Neural network and physical systems with emergent collective computational abilities,

Hopfield, J. J. Proceedings of National Academy of Sciences, vol. 79 no. 8 pp.255

• Principles of Data Mining. Hand, David J., 1st ed., 2001.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

77

• Probabilidad y Estadística aplicadas a la ingeniería, Montgomery, D.C et al. 895p., 1 Ed.

McGraw Hill, Mexico.

• Students' Project: "Neural networks and artificial inteligence in electronics", Electronics

V, AGH University of Science and Technology, Krakovia, Polonia.

• The CRM Handbook: A Business Guide to Customer Relationship Management. Dyché,

Jill. Aug 2001

• The Handbook of Brain Theory and Neural Networks. M.A. Arbib. 1Ed. 1995.

• The origins of Logistic Regression. Cramer, J.S. Faculty of Economics and Econometrics,

University of Amsterdam and Tinbergen Institute. Nov 2002. Essay, 16p.

8.1.2. Vínculos en Internet

• Almacenes Éxito – Nuestra Historia, Documento Web, Septiembre de 2005.

http://www.exito.com.co/Archivos%5CHistoriaJunio2004.doc.

• Massachusetts Institute of Technology (MIT), Sloan School of Management, Open

Courseware, Data Mining Course: http://ocw.mit.edu/OcwWeb/Sloan-School-of-

Management/15-062Data-MiningSpring2003/CourseHome/index.htm

• Data Mining: What is Data Mining?, http://www.anderson.ucla.edu/faculty/jason.frand/

teacher/technologies/palace/datamining.htm

• Departamento Administrativo Nacional de Estadística, DANE. http://www.dane.gov.co

• Gartner Group: http://www.gartner.com

• St@tServ Data Mining Page, http://www.statserv.com/datamining.html

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

78

8.2. Bibliografía utilizada para la creación del Mo delo Experimental

8.2.1 Libros, Documentos y Papers

• Applying Data Mining Techniques Using SAS Enterprise Miner. SAS Course Notes, Feb.

2005.

• Cómo Programar En JAVA. Deitel, H.M, Deitel, P.J. 1056p. 1 Ed. 1998. Pearson,

Prentice Hall, Addison Wesley, Mexico.

• Predictive Modeling Using SAS Enterprise Miner 5.1. SAS Course Notes, Sep. 2004.

• UML y Patrones. Larman, Craig. 512p. 1 Ed. 1999. Pearson, Prentice Hall, Mexico.

8.2.2. Vínculos en Internet

• JavaTM 2 Platform Standard Edition 5.0 API Specification.

http://java.sun.com/j2se/1.5.0/docs/api/index.html

• Wikipedia, Online Encyclopedia. http://www.wikipedia.org

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

79

9. Anexos

Anexo 1: Formato de Entrevista

El siguiente formato fue entregado a cada uno de los posibles entrevistados en las Grandes

Superficies para la recolección de la información. Se hizo esta primera aproximación antes

de las entrevistas.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas, Un Modelo Teórico–Práctico de Minería de Datos.

Entrevistador: Diego F. Martínez Quiñones Ingeniero de Sistemas Administrador de Empresas Universidad de los Andes Facultad de Administración Tel. 300 5502108 - 3156562 Entrevistado: Nombre: Cargo: Empresa: Datos de contacto: Fecha: Duración de la entrevista: Objetivo de la entrevista: Este Trabajo de Grado pretende mostrar, utilizando un modelo estándar de las estructuras de bases de datos de clientes en las Grandes Superficies colombianas, un modelo teórico – práctico para analizar el comportamiento típico de los mismos, encontrando en ellas patrones de comportamiento y de resultados. La razón por la se deben realizar entrevistas, radica en la necesidad de trabajar con un modelo lo más ajustado posible a la realidad del mercado, para así obtener resultados que sean útiles tanto para el espacio académico como para la referencia futura de las mismas empresas del sector. Nos interesa utilizar toda esta información como punto de partida para crear un modelo estándar del Sector de las Grandes Superficies. La información que utilizará dicho modelo estará basada en los datos proporcionados, pero los datos como tal, por sus características de confidencialidad, permanecerán protegidos en todos los casos y serán utilizados únicamente para comprobar la eficacia del modelo. En la medida de lo posible se espera también tener una documentación en audio de la entrevista, para referencia en el momento de sustentar el proyecto. En general todos aquellos datos que se consideren confidenciales, formarán parte del sustento de la investigación, pero no serán publicados en ninguna forma.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

80

1. ¿Con cuántos puntos de venta cuenta? ¿Aproximadamente cuántos clientes recibe al día (Tanto en total como por punto de venta)?

2. ¿Cuántos productos maneja un punto de venta promedio? ¿Qué categorías de productos

maneja (abarrotes, lácteos, aseo, etc.)? 3. ¿Cuál es el horario de atención típico de los puntos de venta? 4. ¿Cuáles son las horas pico en los diferentes puntos de venta? ¿varían? ¿De qué dependen? 5. ¿Qué datos recolecta y/o considera relevantes para el estudio del comportamiento de los

clientes en su Gran Superficie? (ej. edad, estrato, etc.) 6. ¿Cuál es el producto más vendido por categoría (Pregunta 2)? ¿En qué cantidades se vende?

¿A qué precio? 7. ¿Qué datos recolecta y/o considera relevantes para el manejo de los productos? (precio, lugar

en la góndola, etc.) 8. ¿Qué relaciones entre el comportamiento de los clientes y los productos ha encontrado? ¿Esas

relaciones fueron encontradas intuitivamente o mediante el uso de algún instrumento, herramienta o consultor? ¿Ha realizado cambios (de lugar, de precios, de posición, etc.) con base en esas relaciones encontradas? ¿Ha encontrado mejoras en términos de ventas, utilidades, costos, etc., con los cambios realizados?

9. ¿Cómo centraliza el manejo de los datos que recopila sobre los clientes y los productos?

¿Utiliza una base de datos? ¿Cómo está estructurada? ¿La base de datos es centralizada, o se maneja punto por punto? ¿Existe alguien específico que maneje esa base de datos?

10. ¿Utiliza técnicas o herramientas estadísticas para el manejo del comportamiento de los

clientes? ¿Qué herramientas? ¿Utiliza minería de datos? ¿Cómo y con que modelos? (Inferencia, redes neuronales, árboles de decisión, regresión logística o lineal, etc.)

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

81

Anexo 2: Patrones de comportamiento encontrados

• Mujeres de estrato 3 que tienen entre 45 y 54 años y que trabajan en Servicios Generales compran: • Absorbentes para Incontinencia Urinaria Content • Pañales Desechables Velty

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Mantenimiento compran: • Absorbentes para Incontinencia Urinaria First Quality • Champú Aquamarine ó Kwell • Productos para Limpieza Facial Revlon • Ron Cortez Ron ó Sun Dry • Té JC • Tequila Herradura • Vodka Koskenkorva ó de Otras marcas • Whisky,J&B

• Hombres de estrato 2 que tienen entre 20 y 24 años y que trabajan en Mantenimiento compran: • Absorbentes para Incontinencia Urinaria de Otras marcas • Aderezos para Ensaladas de Otras marcas • Vodka Koskenkorva

• Hombres de estrato 2 que tienen entre 20 y 24 años y que trabajan en Ventas compran: • Absorbentes para Incontinencia Urinaria de Otras marcas • Aderezos para Ensaladas de Otras marcas

• Hombres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Servicios Generales compran: • Absorbentes para Incontinencia Urinaria de Otras marcas • Bebidas Energizantes Erektus • Bebidas Hidratantes de Otras marcas • Condones de Otras marcas • Jugos Envasados Listos Santal Light • Pañales Desechables Pampers • Productos para el Control del Acné Clinique

• Hombres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Ventas compran: • Absorbentes para Incontinencia Urinaria de Otras marcas • Aceite de Cocina Ideal • Bebidas Energizantes Erektus ó UFO • Leche Deleyte • Productos para el Control del Acné Clinique • Tequila Sauza

• Mujeres de estrato 2 que tienen entre 45 y 54 años y que trabajan en Produccion compran: • Absorbentes para Incontinencia Urinaria de Otras marcas

• Mujeres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Servicios Generales compran • Absorbentes para Incontinencia Urinaria Pañalsec • Jugos Envasados Listos Santal Light • Leche Progress • Productos para Protección Solar Nudebronze • Salsa para Pastas de Otras marcas • Té Algacel • Tequila Centenario

• Mujeres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Ventas compran: • Aceite de Cocina Ideal • Tampones O.B.

• Hombres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Transporte compran: • Aguardiente Cocochévere • Calzado Caprino

• Hombres de estrato 3 que tienen entre 35 y 44 años y que trabajan en Sistemas compran: • Aguardiente Superior

• Hombres de estrato 6 que tienen entre 20 y 24 años y que se dedican a la Educacion compran: • Aperitivos / Cocteles Preparados de Otras marcas

• Hombres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Construccion compran: • Bebidas Energizantes Jess ó UFO • Remedios para el Malestar Estomacal Colaxín ó Kaopectate

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Servicios Generales compran: • Bebidas Hidratantes de Otras marcas • Café Molido o Entero Tostión

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

82

• Condones de Otras marcas • Remedios para el Malestar Estomacal Sal Andrews • Tequila 3 Generaciones ó de Otras marcas

• Hombres de estrato 3 que tienen entre 12 y 34 años y que se dedican a la Produccion compran: • Bebidas Hidratantes,Zapp

• Hombres de estrato 6 que tienen entre 25 y 34 años y que trabajan en oficios administrativos compran: • Bebidas Hidratantes Zapp • Ron Boyacá

• Personas de estrato 2 que tienen entre 25 y 34 años y que trabajan en Produccion compran: • Café Molido o Entero Bemoka Descafeinado

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en oficios administrativos compran: • Café Molido o Entero Tostión • Productos para Protección Solar Nudebronze

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Ventas compran: • Caldos Concentrados Éxito • Jabones de Tocador Líquidos St. Ives • Perfumes y Colonias Estée Lauder

• Mujeres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Finanzas compran: • Cereales Special K

• Hombres de estrato 3 que tienen entre 45 y 54 años y que trabajan en Otros Servicios compran: • Cerveza Amstel Light • Champú Shampiojos • Cigarrillos American Gold ó Caribe ó Imperial ó L&M Rojo ó President • Ponqués de Paquete,Colsubsidio

• Hombres de estrato 4 y 5 que tienen entre 12 y 19 años y que trabajan en Finanzas compran: • Cerveza Quilmes

• Hombres de estrato 4 y 5 que tienen entre 25 y 34 años y que trabajan en Finanzas compran: • Cerveza Quilmes

• Mujeres de estrato 3 que tienen entre 35 y 44 años y que trabajan en Ventas compran: • Champú,Finesse • Esmalte de Uñas Helena Rubinstein • Gelatina Arcoiris • Jugos Envasados Listos Orense Premium • Maltas de Otras marcas • Productos Faciales Hidratantes Yardley • Productos para Limpieza Facial Atrix • Remedios para el Malestar Estomacal Imodium

• Personas de estratos 2 y 3 que tienen entre 20 y 24 años y que se dedican a Otros Servicios compran: • Champú Shampiojos

• Personas de estratos 2 y 3 que tienen entre 45 y 54 años y que se dedican a Otros Servicios compran: • Champú Shampiojos

• Personas de estrato 2 que tienen entre 12 y 19 años y que trabajan en Ventas compran: • Chicles de Otras marcas

• Hombres de estrato 4 que tienen entre 45 y 54 años y que trabajan en Otros Servicios compran: • Cigarrillos American Gold

• Personas de estrato 3 que tienen entre 20 y 24 años y que trabajan en Transporte compran: • Cigarrillos Free • Perfumes y Colonias Lancôme • Productos para Limpieza Facial Atrix

• Hombres de estrato 3 que tienen entre 20 y 24 años y que trabajan en Transporte compran: • Ron Havana Club

• Hombres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Mantenimiento compran: • Cigarrillos Montana Rojo • Remedios para el Dolor / Analgésicos Lumbal • Remedios para el Malestar Estomacal Colaxín

• Mujeres de estrato 3 que tienen entre 25 y 34 años y que trabajan en Otros Servicios compran: • Comida para Perros y Gatos Lucky Bite • Polvos y Base Facial Helena Rubinstein • Productos Faciales Hidratantes Lancôme • Rubor Helena Rubinstein

• Hombres de estrato 2 que tienen entre 35 y 44 años y que trabajan en Ventas compran: • Endulzantes Menocal • Perfumes y Colonias Estée Lauder

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

83

• Remedios para el Malestar Estomacal Citromel ó Colaxín • Mujeres de estrato 4 que tienen entre 20 y 24 años y que trabajan en Ventas compran:

• Esmalte de Uñas Estée Lauder • Hombres de estrato 2 que tienen entre 35 y 44 años y que trabajan en Servicios Generales compran:

• Esponjas, Esponjillas y Paños de Cocina Colsubsidio • Mujeres de estrato 2 que tienen entre 35 y 44 años y que trabajan en Ventas compran:

• Gelatina Arcoiris • Jabones de Tocador Líquidos Neutrogena • Jugos Envasados Listos Colibrí • Perfumes y Colonias Estée Lauder • Remedios para el Malestar Estomacal Colaxín

• Hombres de estrato 2 que tienen entre 25 y 34 años y que estudian en Ventas compran: • Jabones de Tocador Líquidos St. Ives

• Mujeres de estrato 3 que tienen entre 12 y 19 años y que se dedican a las Ventas compran: • Jugos Envasados Listos Orense Premium • Vitaminas, Calcio y Suplementos Nashki

• Mujeres de estrato 3 que tienen entre 35 y 44 años y que estudian y se dedican a las Ventas compran: • Jugos Envasados Listos Orense Premium

• Personas de estrato 3 que tienen entre 25 y 34 años y que trabajan en profesiones Juridicas compran: • Jugos Envasados Listos Santal Light

• Hombres de estrato 4 que tienen entre 25 y 34 años y que trabajan en Producción u Otros Servicios compran: • Maltas de Otras marcas

• Hombres de estrato 3 que tienen entre 35 y 44 años y que trabajan en Ventas compran: • Maltas de Otras marcas • Productos para Limpieza Facial Atrix • Remedios para el Malestar Estomacal Imodium

• Personas de estrato 2 y 3 que tienen entre 45 y 54 años y que se dedican al hogar ó trabajan en ServiciosGenerales compran: • Pañales Desechables Velty

• Mujeres de estrato 3 que tienen entre 20 y 24 años y que se dedican a las Ventas compran: • Pasabocas en Paquete Planters

• Mujeres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Ventas compran: • Perfumes y Colonias Estée Lauder • Productos para Protección Solar Coppertone

• Personas de estrato 5 que tienen entre 25 y 44 años y que trabajan en Ventas compran: • Perfumes y Colonias Estée Lauder

• Mujeres de estrato 3 que tienen entre 35 y 44 años y que trabajan en administrativa compran: • Productos para Limpieza Facial Helena Rubinstein • Rubor Revlon

• Mujeres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Mantenimiento compran: • Productos para Limpieza Facial Revlon

• Hombres de estrato 3 que tienen entre 45 y 54 años y que trabajan en Ventas compran: • Refrescos en Polvo Fitline

• Hombres de estrato 2 que tienen entre 45 y 54 años y que trabajan en Ventas compran: • Remedios para el Dolor / Analgésicos Cafiaspirina

• Personas de estrato 3 que tienen entre 35 y 44 años que están desempleadas y cuyo oficio son las Ventas compran: • Remedios para el Malestar Estomacal Imodium

• Personas de estratos 2 y 3 que tienen entre 25 y 34 años y que trabajan en Construccion compran: • Remedios para el Malestar Estomacal Kaopectate

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Mercadeo compran: • Remedios para el Malestar Estomacal,Sal Andrews

• Personas de estrato 2 que tienen entre 35 y 44 años y que trabajan en Educacion compran: • Remedios para la Gripa. Tos. Fiebre y Dolor de Garganta Cheracol

• Hombres de estrato 6 que tienen entre 25 y 34 años y que estudian carreras administrativas compran: • Ron Boyacá

• Mujeres de estrato 4 que tienen entre 35 y 44 años y que trabajan en Transporte compran: • Ron Sun Dry

• Mujeres de estrato 4 que tienen entre 25 y 34 años y que trabajan en Educacion compran: • Rubor de Otras marcas

• Mujeres de estratos 3 y 4 que tienen entre 25 y 34 años, que trabajan en Ventas compran: • Tampones O.B.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

84

• Hombres de estrato 2 que tienen entre 25 y 34 años que están desempleados y cuyo oficio son los Servicios Generales compran: • Tequila de Otras marcas

• Personas de estratos 3 y 4 que tienen entre 12 y 19 años y que se dedican a las Ventas compran: • Vitaminas. Calcio y Suplementos Nashki

• Hombres de estrato 2 que tienen entre 25 y 34 años y que trabajan en Transporte compran: • Vitaminas, Calcio y Suplementos Vitamina C La Santé

• Mujeres de estrato 4 que tienen entre 25 y 34 años y que trabajan en Salud compran: • Vodka de Otras marcas

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

85

Anexo 3: Productos utilizados

El siguiente es un listado de los productos utilizados en la simulación, obtenidos de las bases

de datos de IBOPE:

Producto Porcentajes

Tipo Nombre Marca Porcentaje del Total

Porcentaje por Producto

Porcentaje por Marca

Intervalo de Compra

(semanas)

Antioqueño 45,40% 51,54% 42,69% 1

Blanco 45,40% 51,54% 15,56% 1

Caucano 45,40% 51,54% 2,69% 1

Cocochévere 45,40% 51,54% 2,65% 1

Cristal 45,40% 51,54% 17,44% 1

Cristal Light 45,40% 51,54% 2,99% 1

Doble Anís 45,40% 51,54% 3,12% 1

Galeras 45,40% 51,54% 1,45% 1

Líder 45,40% 51,54% 2,09% 1

Llanero 45,40% 51,54% 4,53% 1

Néctar 45,40% 51,54% 29,27% 1

Néctar Azul 45,40% 51,54% 8,21% 1

Superior 45,40% 51,54% 1,62% 1

Tapa Roja 45,40% 51,54% 8,08% 1

Aguardiente

Otras 45,40% 51,54% 0,98% 1

Bacardí 37,00% 46,22% 17,72% 1

Blanco 37,00% 46,22% 4,97% 1

Boyacá 37,00% 46,22% 2,98% 1

Cortez 37,00% 46,22% 0,94% 1

Cuba Son 37,00% 46,22% 4,56% 1

Havana Club 37,00% 46,22% 0,70% 1

Joven de Caldas 37,00% 46,22% 5,32% 1

Medellín Añejo 37,00% 46,22% 30,76% 1

Santafé Añejo 37,00% 46,22% 16,78% 1

Santero 37,00% 46,22% 0,88% 1

Sun Dry 37,00% 46,22% 1,17% 1

Trapiche Premium 37,00% 46,22% 1,35% 1

Tres Esquinas 37,00% 46,22% 12,87% 1

Viejo de Caldas 37,00% 46,22% 52,28% 1

Ron

Otras 37,00% 46,22% 2,16% 1

3 Generaciones 6,40% 41,88% 17,91% 1

Centenario 6,40% 41,88% 15,67% 1

José Cuervo 6,40% 41,88% 43,28% 1

Don Julio 6,40% 41,88% 16,42% 1

Bebidas Alcoholicas

Tequila

Herradura 6,40% 41,88% 9,33% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

86

Sauza 6,40% 41,88% 23,88% 1

Otras 6,40% 41,88% 6,72% 1

Absolut 10,50% 37,05% 46,27% 1

Caprino 10,50% 37,05% 15,42% 1

Danzka 10,50% 37,05% 8,23% 1

Finlandia 10,50% 37,05% 25,19% 1

Koskenkorva 10,50% 37,05% 11,57% 1

Moskaya 10,50% 37,05% 9,51% 1

Smirnoff 10,50% 37,05% 17,22% 1

Viskaya 10,50% 37,05% 12,34% 1

Vodka

Otras 10,50% 37,05% 3,86% 1

Ballantines 26,40% 40,53% 9,91% 1

Black & White 26,40% 40,53% 11,59% 1

Buchanans 26,40% 40,53% 38,97% 1

Chivas Regal 26,40% 40,53% 24,58% 1

Grants 26,40% 40,53% 12,15% 1

J&B 26,40% 40,53% 2,71% 1

John Thomas 26,40% 40,53% 10,84% 1

Johnnie Walker Blue Label 26,40% 40,53% 5,05% 1

Jhonnie Walker Black Label 26,40% 40,53% 11,31% 1

Jhonnie Walker Red Label 26,40% 40,53% 8,79% 1

Old Parr 26,40% 40,53% 16,92% 1

Passport 26,40% 40,53% 5,89% 1

Something Special 26,40% 40,53% 5,42% 1

Whisky

Otras 26,40% 40,53% 7,57% 1

Artico Limón 7,65% 36,86% 19,86% 1

Tequimón 7,65% 36,86% 74,47% 1

Aperitivos

y Cocteles

Preparado

s

Otras 7,65% 36,86% 5,67% 1

Aguila 70,70% 72,84% 52,82% 1

Aguila Imperial 70,70% 72,84% 3,32% 1

Aguila Light 70,70% 72,84% 16,78% 1

Amstel Light 70,70% 72,84% 0,66% 1

Bahía 70,70% 72,84% 9,48% 1

Budweiser 70,70% 72,84% 3,09% 1

Club Colombia 70,70% 72,84% 13,32% 1

Cola & Pola 70,70% 72,84% 7,55% 1

Corona 70,70% 72,84% 3,90% 1

Costeña 70,70% 72,84% 31,26% 1

Costeñita 70,70% 72,84% 9,11% 1

Cristal Oro 70,70% 72,84% 2,70% 1

Heineken 70,70% 72,84% 6,50% 1

Leona 70,70% 72,84% 4,37% 1

Miller 70,70% 72,84% 1,50% 1

Pilsen 70,70% 72,84% 13,73% 1

Poker 70,70% 72,84% 21,75% 1

Cerveza

Polar 70,70% 72,84% 6,70% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

87

Quilmes 70,70% 72,84% 1,32% 1

Otras 70,70% 72,84% 0,66% 1

Capri 25,60% 83,98% 4,88% 1

Free 25,60% 83,98% 0,84% 1

Kent 25,60% 83,98% 7,35% 1

Marlboro Lights 25,60% 83,98% 8,65% 1

Otras (ligths) 25,60% 83,98% 4,84% 1

Belmont 25,60% 83,98% 21,81% 1

Boston 25,60% 83,98% 24,33% 1

Derby Azul 25,60% 83,98% 2,51% 1

L&M Azul 25,60% 83,98% 1,02% 1

Montana Azul 25,60% 83,98% 4,00% 1

Mustang Azul 25,60% 83,98% 18,60% 1

Premier Azul 25,60% 83,98% 2,88% 1

Otras (suaves) 25,60% 83,98% 0,93% 1

Delta 25,60% 83,98% 7,72% 1

Green 25,60% 83,98% 19,67% 1

Kool 25,60% 83,98% 18,98% 1

Marlboro Menthol 25,60% 83,98% 2,09% 1

More Menthol 25,60% 83,98% 1,53% 1

Mustang Verde 25,60% 83,98% 2,47% 1

Premier Verde 25,60% 83,98% 2,93% 1

Otras (mentolados) 25,60% 83,98% 0,98% 1

Belmont Menthol Lights 25,60% 83,98% 5,95% 1

Kool Lights 25,60% 83,98% 16,60% 1

Marlboro Menthol Lights 25,60% 83,98% 3,12% 1

Otras (mentolados light) 25,60% 83,98% 0,60% 1

American Gold 25,60% 83,98% 3,12% 1

Derby Rojo 25,60% 83,98% 5,21% 1

Imperial 25,60% 83,98% 1,67% 1

L&M Rojo 25,60% 83,98% 1,12% 1

Lucky Strike 25,60% 83,98% 2,14% 1

Marlboro Rojo 25,60% 83,98% 6,88% 1

Montana Rojo 25,60% 83,98% 1,58% 1

Mustang Rojo 25,60% 83,98% 13,91% 1

Premier Rojo 25,60% 83,98% 4,00% 1

Royal 25,60% 83,98% 3,53% 1

Otras (regulares) 25,60% 83,98% 0,84% 1

Caribe 25,60% 83,98% 3,16% 1

Piel Roja 25,60% 83,98% 3,07% 1

President 25,60% 83,98% 1,72% 1

Cigarrillos

Cigarrillos

Otras (negros) 25,60% 83,98% 1,21% 1

Bimbo 97,40% 51,95% 46,84% 1

Bimbo Integral 97,40% 51,95% 8,89% 1

Bontrigo 97,40% 51,95% 3,18% 1

Bebidas y

Alimentos

Pan Empacado

Cafam 97,40% 51,95% 3,42% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

88

Carulla 97,40% 51,95% 5,77% 1

Colsubsidio 97,40% 51,95% 1,68% 1

Comapan 97,40% 51,95% 16,98% 1

Deleyte 97,40% 51,95% 3,42% 1

Exito 97,40% 51,95% 5,51% 1

Guadalupe 97,40% 51,95% 9,23% 1

La Gitana 97,40% 51,95% 5,71% 1

Olímpica 97,40% 51,95% 9,39% 1

Ramo 97,40% 51,95% 11,72% 1

Santa Clara 97,40% 51,95% 8,58% 1

Suavipan 97,40% 51,95% 4,29% 1

Otras 97,40% 51,95% 17,04% 1

Andino 89,40% 88,81% 4,65% 1

Bogotano 89,40% 88,81% 8,65% 1

Boyacense 89,40% 88,81% 0,97% 1

Cafam 89,40% 88,81% 1,11% 1

Campesino 89,40% 88,81% 1,44% 1

Choco Express 89,40% 88,81% 10,62% 1

Choco Lyne 89,40% 88,81% 4,43% 1

Chocolate Nacional Instantáneo 89,40% 88,81% 7,62% 1

Choker 89,40% 88,81% 2,90% 1

Cocoa Colombina 89,40% 88,81% 1,91% 1

Cocoa Corona 89,40% 88,81% 5,33% 1

Cocoa La Especial 89,40% 88,81% 1,45% 1

Cocoa Sol 89,40% 88,81% 1,93% 1

Colsubsidio 89,40% 88,81% 0,72% 1

Corona 89,40% 88,81% 26,20% 1

Cruz 89,40% 88,81% 11,20% 1

Diana 89,40% 88,81% 8,16% 1

Exito 89,40% 88,81% 0,71% 1

Gironés 89,40% 88,81% 4,33% 1

Instacao 89,40% 88,81% 0,57% 1

La Especial 89,40% 88,81% 3,69% 1

Luker 89,40% 88,81% 22,67% 1

Quesada 89,40% 88,81% 7,90% 1

Sol 89,40% 88,81% 13,73% 1

Superior 89,40% 88,81% 0,72% 1

Tesalia 89,40% 88,81% 5,01% 1

Tolimax 89,40% 88,81% 1,07% 1

Tres Coronas 89,40% 88,81% 2,37% 1

Vitachocolate 89,40% 88,81% 2,44% 1

Chocolate

Otras 89,40% 88,81% 2,15% 1

Alpina 87,40% 92,56% 10,67% 4

Astra 87,40% 92,56% 0,67% 4

Cafam 87,40% 92,56% 0,88% 4

Mantequilla y

Margarina

Campi 87,40% 92,56% 16,32% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

89

Campi Light 87,40% 92,56% 4,99% 4

Canola Life 87,40% 92,56% 0,87% 4

Colanta 87,40% 92,56% 3,54% 4

Coolechera 87,40% 92,56% 4,04% 4

Da Gusto 87,40% 92,56% 5,86% 4

Exito 87,40% 92,56% 1,90% 4

La Buena 87,40% 92,56% 3,49% 4

La Cremosita 87,40% 92,56% 0,61% 4

La Fina 87,40% 92,56% 39,31% 4

La Fina Chiffón 87,40% 92,56% 5,65% 4

Lolita 87,40% 92,56% 1,04% 4

Mavesa 87,40% 92,56% 8,81% 4

Mavesa Ligera 87,40% 92,56% 0,88% 4

Natura 87,40% 92,56% 4,96% 4

Practis 87,40% 92,56% 2,95% 4

Premier 87,40% 92,56% 3,00% 4

Rama 87,40% 92,56% 35,97% 4

Rama Light 87,40% 92,56% 5,66% 4

Rama Líquida 87,40% 92,56% 1,12% 4

Riquísima 87,40% 92,56% 1,27% 4

Sabina 87,40% 92,56% 0,70% 4

Otras 87,40% 92,56% 1,50% 4

Alpina 88,70% 76,55% 36,82% 4

Cafam 88,70% 76,55% 2,11% 4

Carrefour 88,70% 76,55% 2,78% 4

Celema 88,70% 76,55% 2,56% 4

Codegán 88,70% 76,55% 3,59% 4

Colácteos 88,70% 76,55% 4,57% 4

Colanta 88,70% 76,55% 34,32% 4

Colquesos 88,70% 76,55% 3,33% 4

Colsubsidio 88,70% 76,55% 1,06% 4

Coolechera 88,70% 76,55% 5,67% 4

Del Vecchio 88,70% 76,55% 1,66% 4

Exito 88,70% 76,55% 2,34% 4

Finesse 88,70% 76,55% 2,43% 4

La Especial 88,70% 76,55% 1,41% 4

La Florida 88,70% 76,55% 1,19% 4

Lonchitas Nestlé 88,70% 76,55% 3,56% 4

Pasco 88,70% 76,55% 0,84% 4

Primavera 88,70% 76,55% 1,78% 4

Proleche 88,70% 76,55% 7,58% 4

Pureza 88,70% 76,55% 1,10% 4

Rica 88,70% 76,55% 2,70% 4

Queso

Otras 88,70% 76,55% 19,29% 4

Colanta 34,60% 80,06% 61,37% 4

Queso

Crema

Coolechera 34,60% 80,06% 7,65% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

90

Cremosino Alpina 34,60% 80,06% 14,04% 4

Finesse 34,60% 80,06% 5,60% 4

La Sierra 34,60% 80,06% 2,09% 4

Parmalat 34,60% 80,06% 12,92% 4

Pasco 34,60% 80,06% 2,64% 4

Philadelphia 34,60% 80,06% 1,91% 4

Proleche 34,60% 80,06% 14,40% 4

Otras 34,60% 80,06% 5,85% 4

Americana Suizo (salchicha cerdo) 85,70% 89,97% 14,40% 4

Vaquera Suizo (salchicha cerdo) 85,70% 89,97% 3,02% 4

Otras Suizo (salchicha cerdo) 85,70% 89,97% 8,37% 4

Cazadora Cunit (salchicha cerdo) 85,70% 89,97% 0,96% 4

Frankfurt Cunit (salchicha cerdo) 85,70% 89,97% 1,15% 4

Otras Cunit (salchicha cerdo) 85,70% 89,97% 3,75% 4

Llanera Rica (salchicha cerdo) 85,70% 89,97% 14,27% 4

Ricky Rica (salchicha cerdo) 85,70% 89,97% 8,26% 4

Otras Rica (salchicha cerdo) 85,70% 89,97% 8,04% 4

Mi Bueníssima Zenú (salchicha cerdo) 85,70% 89,97% 6,02% 4

Ranchera Zenú (salchicha cerdo) 85,70% 89,97% 35,93% 4

Otras Zenú (salchicha cerdo) 85,70% 89,97% 16,34% 4

Colsubsidio (salchicha cerdo) 85,70% 89,97% 0,92% 4

Dan (salchicha cerdo) 85,70% 89,97% 2,63% 4

Enriko (salchicha cerdo) 85,70% 89,97% 0,53% 4

Frankys (salchicha cerdo) 85,70% 89,97% 1,01% 4

Porchi (salchicha cerdo) 85,70% 89,97% 2,44% 4

Otras (salchicha cerdo) 85,70% 89,97% 3,55% 4

Aretama (salchicha pollo) 85,70% 89,97% 1,56% 4

Brost (salchicha pollo) 85,70% 89,97% 11,76% 4

Cunit (salchicha pollo) 85,70% 89,97% 3,35% 4

Delichicks (salchicha pollo) 85,70% 89,97% 2,54% 4

Friko (salchicha pollo) 85,70% 89,97% 2,72% 4

Koller (salchicha pollo) 85,70% 89,97% 0,99% 4

Mc Pollo (salchicha pollo) 85,70% 89,97% 8,37% 4

Pimpollo (salchicha pollo) 85,70% 89,97% 3,48% 4

Rica (salchicha pollo) 85,70% 89,97% 16,60% 4

Suizo (salchicha pollo) 85,70% 89,97% 9,64% 4

Otras (salchicha pollo) 85,70% 89,97% 2,18% 4

Brost (jamón) 85,70% 89,97% 6,86% 4

Colsubsidio (jamón) 85,70% 89,97% 0,69% 4

Cunit (jamón) 85,70% 89,97% 2,14% 4

Dan (jamón) 85,70% 89,97% 1,39% 4

Pietran Zenú (jamón) 85,70% 89,97% 10,96% 4

Porchi (jamón) 85,70% 89,97% 1,96% 4

Rica (jamón) 85,70% 89,97% 13,88% 4

Sanduche Zenú (jamón) 85,70% 89,97% 7,32% 4

Carnes Frias

Suizo (jamón) 85,70% 89,97% 11,12% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

91

Otras (jamón) 85,70% 89,97% 2,00% 4

Carnelly (mortadela cerdo) 85,70% 89,97% 1,44% 4

Colsubsidio (mortadela cerdo) 85,70% 89,97% 0,79% 4

Cunit (mortadela cerdo) 85,70% 89,97% 4,25% 4

Dan (mortadela cerdo) 85,70% 89,97% 1,93% 4

Enriko (mortadela cerdo) 85,70% 89,97% 1,04% 4

Porchi (mortadela cerdo) 85,70% 89,97% 1,61% 4

Rica (mortadela cerdo) 85,70% 89,97% 17,77% 4

Suizo (mortadela cerdo) 85,70% 89,97% 11,23% 4

Zenú (mortadela cerdo) 85,70% 89,97% 23,87% 4

Otras (mortadela cerdo) 85,70% 89,97% 2,57% 4

Aretama (mortadela pollo) 85,70% 89,97% 1,39% 4

Brost (mortadela pollo) 85,70% 89,97% 9,36% 4

Cunit (mortadela pollo) 85,70% 89,97% 4,01% 4

Delichicks (mortadela pollo) 85,70% 89,97% 2,68% 4

Friko (mortadela pollo) 85,70% 89,97% 2,46% 4

Koller (mortadela pollo) 85,70% 89,97% 0,52% 4

Mc Pollo (mortadela pollo) 85,70% 89,97% 5,65% 4

Pimpollo (mortadela pollo) 85,70% 89,97% 3,00% 4

Rica (mortadela pollo) 85,70% 89,97% 13,88% 4

Suizo (mortadela pollo) 85,70% 89,97% 9,84% 4

Otras (mortadela de pollo) 85,70% 89,97% 2,00% 4

Aretama (salchichón) 85,70% 89,97% 0,80% 4

Brost (salchichón) 85,70% 89,97% 8,61% 4

Cunit (salchichón) 85,70% 89,97% 4,44% 4

Dan (salchichón) 85,70% 89,97% 1,78% 4

Delichicks (salchichón) 85,70% 89,97% 2,14% 4

Pimpollo (salchichón) 85,70% 89,97% 2,74% 4

Rica (salchichón) 85,70% 89,97% 13,23% 4

Suizo (salchichón) 85,70% 89,97% 10,08% 4

Zenú (salchichón) 85,70% 89,97% 23,61% 4

Otras (salchichón) 85,70% 89,97% 3,48% 4

Bernes (pavo) 85,70% 89,97% 0,80% 4

Delipavo (pavo) 85,70% 89,97% 2,58% 4

Otras (pavo) 85,70% 89,97% 1,00% 4

Alfresco 24,50% 78,37% 8,44% 1

Cafam 24,50% 78,37% 4,95% 1

Carulla 24,50% 78,37% 9,74% 1

De Huerto 24,50% 78,37% 3,07% 1

Del Campo 24,50% 78,37% 8,49% 1

Del Monte 24,50% 78,37% 6,51% 1

Deleyte 24,50% 78,37% 5,94% 1

Doña Paula 24,50% 78,37% 4,64% 1

El Nogal 24,50% 78,37% 2,86% 1

Exito 24,50% 78,37% 8,18% 1

Verduras Enlatadas

Frugal 24,50% 78,37% 5,57% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

92

Gigante Verde 24,50% 78,37% 1,98% 1

Goya 24,50% 78,37% 2,24% 1

La Constancia 24,50% 78,37% 15,73% 1

La Coruña 24,50% 78,37% 3,02% 1

La Huerta 24,50% 78,37% 2,81% 1

Olímpica 24,50% 78,37% 9,79% 1

Pin 24,50% 78,37% 1,35% 1

Respín 24,50% 78,37% 6,15% 1

San Jorge 24,50% 78,37% 27,45% 1

Zenú 24,50% 78,37% 33,28% 1

Otras 24,50% 78,37% 2,97% 1

Carrefour 47,80% 75,73% 2,76% 1

Doña Pacha 47,80% 75,73% 1,85% 1

Durena 47,80% 75,73% 13,95% 1

Hogareña 47,80% 75,73% 22,21% 1

Knorr 47,80% 75,73% 14,20% 1

La Sopera 47,80% 75,73% 48,62% 1

Maggi 47,80% 75,73% 43,65% 1

Regina 47,80% 75,73% 1,80% 1

Sopón de Maggi 47,80% 75,73% 8,67% 1 Sopas y Cremas en Paquete

Otras 47,80% 75,73% 1,02% 1

Cafam 68,50% 93,87% 1,14% 4

Doña Gallina 68,50% 93,87% 35,77% 4

El Rey 68,50% 93,87% 5,21% 4

Exito 68,50% 93,87% 0,68% 4

Knorr 68,50% 93,87% 17,57% 4

Maggi 68,50% 93,87% 50,23% 4

Maggi Costilla 68,50% 93,87% 9,19% 4

Rico 68,50% 93,87% 6,84% 4

Ricostilla 68,50% 93,87% 41,99% 4

Caldos Concentrados

Otras 68,50% 93,87% 0,61% 4

Alejandra 98,90% 98,79% 4,99% 4

Blanquita 98,90% 98,79% 2,98% 4

Brillante 98,90% 98,79% 1,49% 4

Cafam 98,90% 98,79% 1,19% 4

Carrefour 98,90% 98,79% 2,12% 4

Caribe 98,90% 98,79% 9,44% 4

Carolina 98,90% 98,79% 4,53% 4

Carulla 98,90% 98,79% 1,54% 4

Casanare 98,90% 98,79% 1,80% 4

Chinito 98,90% 98,79% 0,68% 4

Colsubsidio 98,90% 98,79% 0,80% 4

Comunero 98,90% 98,79% 1,12% 4

Cristal del Tolima 98,90% 98,79% 0,87% 4

Del Llano 98,90% 98,79% 3,07% 4

Arroz

Deleyte 98,90% 98,79% 1,38% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

93

Diana del Tolima 98,90% 98,79% 27,23% 4

Doña Pepa 98,90% 98,79% 2,51% 4

Exito 98,90% 98,79% 1,98% 4

Federal 98,90% 98,79% 0,79% 4

Florhuila 98,90% 98,79% 22,72% 4

Florida 98,90% 98,79% 1,70% 4

Gelvez 98,90% 98,79% 2,31% 4

Leopardo 98,90% 98,79% 2,11% 4

Marfil 98,90% 98,79% 2,30% 4

Nácar 98,90% 98,79% 1,06% 4

Olímpica 98,90% 98,79% 3,48% 4

Perla 98,90% 98,79% 0,42% 4

Pinillar 98,90% 98,79% 2,84% 4

Radamés 98,90% 98,79% 0,86% 4

Roa 98,90% 98,79% 35,93% 4

San Cristóbal 98,90% 98,79% 1,44% 4

Supremo del Tolima 98,90% 98,79% 8,47% 4

Surtimax 98,90% 98,79% 1,29% 4

Tailandés 98,90% 98,79% 1,26% 4

Otras 98,90% 98,79% 4,52% 4

Agnesi 94,60% 96,93% 0,67% 4

Barilla 94,60% 96,93% 0,55% 4

Buitoni 94,60% 96,93% 0,72% 4

Carrefour 94,60% 96,93% 0,81% 4

Comarrico 94,60% 96,93% 4,41% 4

Conzazoni 94,60% 96,93% 2,56% 4

Corticella 94,60% 96,93% 0,57% 4

Da Carlo 94,60% 96,93% 0,93% 4

Doria 94,60% 96,93% 52,24% 4

Exito 94,60% 96,93% 1,43% 4

Gavassa 94,60% 96,93% 4,10% 4

Itala 94,60% 96,93% 0,94% 4

La Milanesa 94,60% 96,93% 2,58% 4

La Muñeca 94,60% 96,93% 50,71% 4

La Siciliana 94,60% 96,93% 0,47% 4

Lista 94,60% 96,93% 0,70% 4

Nuria 94,60% 96,93% 2,68% 4

Pastaio 94,60% 96,93% 0,64% 4

Pugliese 94,60% 96,93% 2,32% 4

Rioka 94,60% 96,93% 0,77% 4

Romagnola 94,60% 96,93% 0,86% 4

Ronco 94,60% 96,93% 1,05% 4

San Marcos 94,60% 96,93% 2,80% 4

San Remo 94,60% 96,93% 4,31% 4

Pastas

Otras 94,60% 96,93% 1,45% 4

Atu n

Enl

ata do

Alamar 84,10% 89,77% 9,95% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

94

Buen Gusto 84,10% 89,77% 2,94% 4

Cafam 84,10% 89,77% 1,43% 4

Carabela 84,10% 89,77% 2,40% 4

Carolina 84,10% 89,77% 8,95% 4

Carrefour 84,10% 89,77% 2,20% 4

Colsubsidio 84,10% 89,77% 0,93% 4

Deleyte 84,10% 89,77% 1,85% 4

Exito 84,10% 89,77% 2,95% 4

Isabel 84,10% 89,77% 15,50% 4

La Floresta 84,10% 89,77% 1,80% 4

Levamar 84,10% 89,77% 2,03% 4

Marcol 84,10% 89,77% 1,26% 4

Margarita 84,10% 89,77% 2,24% 4

Starkist 84,10% 89,77% 0,75% 4

Van Camps 84,10% 89,77% 61,85% 4

Vikingos 84,10% 89,77% 19,07% 4

Otras 84,10% 89,77% 3,01% 4

Alfresco 85,00% 91,41% 2,12% 4

Cafam 85,00% 91,41% 1,27% 4

Carrefour 85,00% 91,41% 1,52% 4

California 85,00% 91,41% 11,42% 4

Comapán 85,00% 91,41% 1,90% 4

Del Monte 85,00% 91,41% 1,02% 4

Deleyte 85,00% 91,41% 1,58% 4

Exito 85,00% 91,41% 2,29% 4

Fruco 85,00% 91,41% 71,94% 4

Frugal 85,00% 91,41% 3,42% 4

Heinz 85,00% 91,41% 5,91% 4

Hellmanns 85,00% 91,41% 3,09% 4

La Constancia 85,00% 91,41% 10,30% 4

La Torre del Oro 85,00% 91,41% 2,66% 4

Olímpica 85,00% 91,41% 2,18% 4

Respín 85,00% 91,41% 2,52% 4

San Jorge 85,00% 91,41% 10,77% 4

Salsa de Tomate

Otras 85,00% 91,41% 1,40% 4

Arisco 27,30% 86,81% 1,48% 4

Buitoni 27,30% 86,81% 2,74% 4

Comapán 27,30% 86,81% 2,62% 4

Del Monte 27,30% 86,81% 2,28% 4

Doria 27,30% 86,81% 15,74% 4

Exito 27,30% 86,81% 3,80% 4

Fruco 27,30% 86,81% 51,48% 4

Grand Italia 27,30% 86,81% 1,69% 4

Knorr 27,30% 86,81% 7,76% 4

La Constancia 27,30% 86,81% 13,42% 4

Salsa para Pastas

Maggi 27,30% 86,81% 19,20% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

95

Pomi Parmalat 27,30% 86,81% 2,19% 4

Ragú 27,30% 86,81% 4,05% 4

Rialto 27,30% 86,81% 1,14% 4

Otras 27,30% 86,81% 1,27% 4

Alfresco 82,50% 90,55% 1,19% 12

Cafam 82,50% 90,55% 0,80% 12

California 82,50% 90,55% 5,74% 12

Carrefour 82,50% 90,55% 1,78% 12

Comapán 82,50% 90,55% 2,21% 12

Deleyte 82,50% 90,55% 1,65% 12

Exito 82,50% 90,55% 2,10% 12

Fruco 82,50% 90,55% 69,34% 12

Frugal 82,50% 90,55% 4,27% 12

Heinz 82,50% 90,55% 4,94% 12

Hellmanns 82,50% 90,55% 3,90% 12

Kraft 82,50% 90,55% 2,42% 12

La Constancia 82,50% 90,55% 11,29% 12

La Torre de Oro 82,50% 90,55% 4,86% 12

Mavesa 82,50% 90,55% 6,76% 12

San Jorge 82,50% 90,55% 11,35% 12

Mayonesa

Otras 82,50% 90,55% 1,41% 12

Carrefour 15,30% 88,89% 4,49% 4

Colmans 15,30% 88,89% 5,15% 4

Comapán 15,30% 88,89% 4,19% 4

Fruco 15,30% 88,89% 54,04% 4

Frugal 15,30% 88,89% 5,66% 4

Heinz 15,30% 88,89% 8,24% 4

Hellmanns 15,30% 88,89% 4,78% 4

Kraft 15,30% 88,89% 3,75% 4

La Constancia 15,30% 88,89% 21,10% 4

Respín 15,30% 88,89% 5,81% 4

San Jorge 15,30% 88,89% 18,90% 4

Aderezos para Ensaladas

Otras 15,30% 88,89% 1,99% 4

Arcoiris 76,70% 87,74% 1,31% 4

Boggy 76,70% 87,74% 22,88% 4

Cafam 76,70% 87,74% 0,82% 4

Carrefour 76,70% 87,74% 1,16% 4

Clight 76,70% 87,74% 2,50% 4

Colanta 76,70% 87,74% 2,42% 4

Comapán 76,70% 87,74% 1,98% 4

Coolechera 76,70% 87,74% 2,05% 4

Diety 76,70% 87,74% 1,16% 4

El Pomar 76,70% 87,74% 0,95% 4

Exito 76,70% 87,74% 1,40% 4

Fruppy 76,70% 87,74% 1,10% 4

Gelatina

Frutiño 76,70% 87,74% 23,03% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

96

Gel Hada 76,70% 87,74% 30,16% 4

Light-Yá 76,70% 87,74% 2,18% 4

Parmalat 76,70% 87,74% 1,62% 4

Proleche 76,70% 87,74% 1,26% 4

Royal 76,70% 87,74% 58,54% 4

Royalito 76,70% 87,74% 5,27% 4

Saroma 76,70% 87,74% 3,91% 4

Otras 76,70% 87,74% 1,01% 4

Alegría 98,80% 96,26% 4,21% 12

Andaluz 98,80% 96,26% 2,53% 12

Búcaro 98,80% 96,26% 3,76% 12

Cafam 98,80% 96,26% 1,52% 12

Canola Life 98,80% 96,26% 1,13% 12

Capri 98,80% 96,26% 1,70% 12

Carbonell 98,80% 96,26% 0,89% 12

Carrefour 98,80% 96,26% 1,29% 12

Cocinero 98,80% 96,26% 0,82% 12

Colsubsidio 98,80% 96,26% 0,74% 12

Conquistador 98,80% 96,26% 0,56% 12

Del Llano 98,80% 96,26% 2,24% 12

Deleyte 98,80% 96,26% 1,59% 12

Donna 98,80% 96,26% 2,26% 12

Dorito 98,80% 96,26% 1,70% 12

Dos Coronas 98,80% 96,26% 0,96% 12

Exito 98,80% 96,26% 1,69% 12

Fagrave 98,80% 96,26% 0,58% 12

Freidor 98,80% 96,26% 0,59% 12

Girasoli 98,80% 96,26% 16,40% 12

Gourmet 98,80% 96,26% 14,72% 12

Ideal 98,80% 96,26% 0,58% 12

La Sevillana 98,80% 96,26% 4,54% 12

Mazola 98,80% 96,26% 1,91% 12

Mazorca de Oro 98,80% 96,26% 8,35% 12

Oleocali 98,80% 96,26% 14,09% 12

Oliosoya 98,80% 96,26% 22,71% 12

Premier 98,80% 96,26% 8,33% 12

Purísimo 98,80% 96,26% 5,70% 12

Puro Girasol 98,80% 96,26% 5,44% 12

Rendidor 98,80% 96,26% 0,89% 12

Riquísimo 98,80% 96,26% 11,67% 12

S&S 98,80% 96,26% 2,06% 12

Soy Sabor 98,80% 96,26% 3,06% 12

Supremo 98,80% 96,26% 1,90% 12

Topacio 98,80% 96,26% 2,79% 12

Vivi 98,80% 96,26% 7,92% 12

Aceite de Cocina

Zeta 98,80% 96,26% 4,42% 12

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

97

Otras 98,80% 96,26% 4,02% 12

Aguileña 79,50% 86,16% 6,09% 1

Campesina 79,50% 86,16% 4,18% 1

Corona 79,50% 86,16% 6,98% 1

El Invencible 79,50% 86,16% 0,99% 1

Haz de Oros 79,50% 86,16% 69,05% 1

La Comarca 79,50% 86,16% 1,99% 1

La Monjita 79,50% 86,16% 1,96% 1

Farallones 79,50% 86,16% 3,77% 1

Robin Hood 79,50% 86,16% 5,47% 1

Robinson 79,50% 86,16% 4,13% 1

Otras (harinas de trigo) 79,50% 86,16% 2,06% 1

Areparepa 79,50% 86,16% 5,02% 1

Areparina 79,50% 86,16% 14,89% 1

Arepasan 79,50% 86,16% 4,80% 1

Candor 79,50% 86,16% 3,05% 1

Corona (maíz) 79,50% 86,16% 1,93% 1

Doñarepa 79,50% 86,16% 17,37% 1

Harina Pan 79,50% 86,16% 11,77% 1

Masapán 79,50% 86,16% 8,74% 1

Promasa 79,50% 86,16% 19,71% 1

Ricamasa 79,50% 86,16% 5,81% 1

Ricarepa 79,50% 86,16% 3,91% 1

Ricarina 79,50% 86,16% 1,37% 1

Superarepa 79,50% 86,16% 3,20% 1

Harina de Trigo o Maiz

Otras (harinas de maíz) 79,50% 86,16% 0,93% 1

Algarra 96,00% 95,31% 17,81% 1

Alpina 96,00% 95,31% 13,88% 1

Alquería 96,00% 95,31% 14,64% 1

Bella Holandesa 96,00% 95,31% 0,47% 1

Cafam 96,00% 95,31% 0,91% 1

Carrefour 96,00% 95,31% 0,67% 1

Celema 96,00% 95,31% 2,52% 1

Ciledco 96,00% 95,31% 3,88% 1

Codegán 96,00% 95,31% 3,27% 1

Colanta (líquida) 96,00% 95,31% 27,10% 1

Colanta (en polvo) 96,00% 95,31% 11,69% 1

Colsubsidio 96,00% 95,31% 0,48% 1

Coolechera 96,00% 95,31% 7,73% 1

Deleyte 96,00% 95,31% 0,72% 1

El Pomar 96,00% 95,31% 2,97% 1

El Recreo 96,00% 95,31% 3,25% 1

El Rodeo 96,00% 95,31% 9,28% 1

Exito 96,00% 95,31% 0,80% 1

Finesse 96,00% 95,31% 0,85% 1

Leche

Freskaleche 96,00% 95,31% 2,13% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

98

Gain 96,00% 95,31% 0,32% 1

Klim 1+ 96,00% 95,31% 4,66% 1

Klim 3+ 96,00% 95,31% 2,13% 1

Klim 6+ 96,00% 95,31% 1,43% 1

Klim 1-2-3 96,00% 95,31% 2,52% 1

Klim Hi Calcium 96,00% 95,31% 1,32% 1

Klim Tradicional 96,00% 95,31% 4,73% 1

La Finca 96,00% 95,31% 1,29% 1

Lechesán 96,00% 95,31% 3,54% 1

Parmalat (líquida) 96,00% 95,31% 14,43% 1

Parmalat (en polvo) 96,00% 95,31% 4,14% 1

Primeros Pasos Parmalat 96,00% 95,31% 1,09% 1

Progress 96,00% 95,31% 0,52% 1

Proleche 96,00% 95,31% 9,54% 1

Proleche Infantil 96,00% 95,31% 0,79% 1

Puracé 96,00% 95,31% 5,37% 1

Puralac 96,00% 95,31% 0,97% 1

San Fernando 96,00% 95,31% 5,89% 1

Otras 96,00% 95,31% 5,22% 1

Choco Rap 37,90% 84,70% 11,40% 1

Chocolisto 37,90% 84,70% 56,07% 1

Frescavena 37,90% 84,70% 19,88% 1

Hersheys 37,90% 84,70% 2,24% 1

Milo 37,90% 84,70% 44,86% 1

Nesquik 37,90% 84,70% 22,77% 1

Sustagen 37,90% 84,70% 6,32% 1

Toddy 37,90% 84,70% 4,64% 1 Modificadores de Leche

Otras 37,90% 84,70% 1,78% 1

Aguila Roja 77,30% 94,83% 46,52% 4

Aguila Roja Descafeinado 77,30% 94,83% 3,00% 4

Almendra Tropical 77,30% 94,83% 2,13% 4

Bemoka 77,30% 94,83% 1,68% 4

Bemoka Descafeinado 77,30% 94,83% 0,59% 4

Colsubsidio 77,30% 94,83% 0,48% 4

Córdoba 77,30% 94,83% 0,53% 4

Diamante 77,30% 94,83% 1,27% 4

Galavis 77,30% 94,83% 1,71% 4

Gualito 77,30% 94,83% 0,48% 4

La Bastilla 77,30% 94,83% 16,37% 4

La Bastilla Descafeinado 77,30% 94,83% 1,17% 4

La Palma 77,30% 94,83% 0,95% 4

Lukafé 77,30% 94,83% 10,86% 4

Mariscal 77,30% 94,83% 1,24% 4

Morazurco 77,30% 94,83% 1,30% 4

New Colony 77,30% 94,83% 1,90% 4

Cafe Molido o Entero

Oma 77,30% 94,83% 1,90% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

99

Oma Descafeinado 77,30% 94,83% 0,63% 4

Sello Dorado 77,30% 94,83% 1,19% 4

Sello Rojo 77,30% 94,83% 35,47% 4

Sello Rojo Descafeinado 77,30% 94,83% 1,65% 4

Tostión 77,30% 94,83% 0,48% 4

Universal 77,30% 94,83% 4,19% 4

Otras 77,30% 94,83% 3,19% 4

Aroma 56,20% 86,48% 6,54% 4

Bastiyá 56,20% 86,48% 10,76% 4

Buendía 56,20% 86,48% 3,93% 4

Colcafé Clásico 56,20% 86,48% 20,12% 4

Otras presentaciones de Colcafé 56,20% 86,48% 3,91% 4

Dolca 56,20% 86,48% 10,14% 4

Nescafé Tradición 56,20% 86,48% 47,74% 4

Nescafé Café con Leche 56,20% 86,48% 12,57% 4

Otras presentaciones de Nescafé 56,20% 86,48% 6,77% 4

Cafe Instantaneo

Otras 56,20% 86,48% 1,15% 4

Algacel 23,70% 84,81% 1,94% 4

Cafam 23,70% 84,81% 2,69% 4

Exito 23,70% 84,81% 3,98% 4

Hindú 23,70% 84,81% 72,64% 4

JC 23,70% 84,81% 1,24% 4

Lipton 23,70% 84,81% 13,23% 4

Nestea 23,70% 84,81% 7,81% 4

Samoa 23,70% 84,81% 3,33% 4

Tscha 23,70% 84,81% 1,99% 4

Twinings 23,70% 84,81% 3,28% 4

Vitanatural 23,70% 84,81% 2,99% 4

Te

Otras 23,70% 84,81% 3,68% 4

Activade 63,60% 89,47% 2,74% 1

Cafam 63,60% 89,47% 0,83% 1

Clight 63,60% 89,47% 8,38% 1

Exito 63,60% 89,47% 0,77% 1

Fitline 63,60% 89,47% 0,56% 1

Flash 63,60% 89,47% 11,16% 1

Frutiño 63,60% 89,47% 60,11% 1

Light-Yá 63,60% 89,47% 8,21% 1

Livean 63,60% 89,47% 1,34% 1

Naran-Yá (y otros sabores) 63,60% 89,47% 17,03% 1

Nestea 63,60% 89,47% 1,27% 1

Royal 63,60% 89,47% 18,10% 1

Tang 63,60% 89,47% 15,47% 1

Twist 63,60% 89,47% 8,54% 1

Twist Frost 63,60% 89,47% 1,41% 1

Zuko 63,60% 89,47% 7,08% 1

Refrescos en Polvo

Zumm 63,60% 89,47% 8,03% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

100

Zumm Premium 63,60% 89,47% 1,02% 1

Otras 63,60% 89,47% 0,62% 1

7 Up 94,40% 87,92% 7,95% 1

Bretaña 94,40% 87,92% 5,80% 1

Castalia 94,40% 87,92% 2,93% 1

Coca Cola 94,40% 87,92% 68,43% 1

Colombiana 94,40% 87,92% 23,61% 1

Fanta Naranja 94,40% 87,92% 2,95% 1

Ginger Ale Canada Dry 94,40% 87,92% 2,60% 1

Hipinto 94,40% 87,92% 3,83% 1

Kola Postobón 94,40% 87,92% 6,83% 1

Kola Román 94,40% 87,92% 6,17% 1

Kola Sol 94,40% 87,92% 1,60% 1

Limonada Postobón 94,40% 87,92% 7,14% 1

Manzana Lift 94,40% 87,92% 9,04% 1

Manzana Postobón 94,40% 87,92% 36,51% 1

Naranja Postobón 94,40% 87,92% 13,25% 1

Pepsi 94,40% 87,92% 12,29% 1

Popular 94,40% 87,92% 1,94% 1

Premio 94,40% 87,92% 7,30% 1

Quatro 94,40% 87,92% 13,86% 1

Quatro Limón 94,40% 87,92% 5,05% 1

Soda Clausen 94,40% 87,92% 2,78% 1

Sprite 94,40% 87,92% 10,93% 1

Toronja Postobón 94,40% 87,92% 2,78% 1

Uva Postobón 94,40% 87,92% 12,53% 1

Otras (corrientes) 94,40% 87,92% 1,31% 1

Coca Cola Light 94,40% 87,92% 12,29% 1

Colombiana Dietética 94,40% 87,92% 2,51% 1

Manzana Light 94,40% 87,92% 4,98% 1

Pepsi Light 94,40% 87,92% 2,18% 1

Sprite Light 94,40% 87,92% 1,89% 1

Gaseosas

Otras (dietéticas) 94,40% 87,92% 0,37% 1

Choky Malta Leona 71,70% 71,83% 5,57% 1

Malta Cervunión 71,70% 71,83% 7,24% 1

Malta Leona 71,70% 71,83% 20,19% 1

Maltín Polar 71,70% 71,83% 3,94% 1

Pony Malta 71,70% 71,83% 85,63% 1

Maltas

Otras 71,70% 71,83% 0,39% 1

Big Star 22,10% 48,87% 12,41% 1

Bull Dog 22,10% 48,87% 9,35% 1

Ciclón 22,10% 48,87% 24,26% 1

Erektus 22,10% 48,87% 4,17% 1

Gay 22,10% 48,87% 11,76% 1

Jess 22,10% 48,87% 4,72% 1

Bebidas Energizantes

Maxxx Energy 22,10% 48,87% 27,87% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

101

Pitbull 22,10% 48,87% 6,48% 1

Red Bull 22,10% 48,87% 23,89% 1

UFO 22,10% 48,87% 3,61% 1

XTC 22,10% 48,87% 2,59% 1

Otra marca 22,10% 48,87% 7,96% 1

Activade 53,60% 57,65% 15,21% 1

Cafam 53,60% 57,65% 2,49% 1

Exito 53,60% 57,65% 4,92% 1

Gatorade 53,60% 57,65% 82,20% 1

Go! Zuco 53,60% 57,65% 3,88% 1

La Parcela 53,60% 57,65% 3,11% 1

Powerade 53,60% 57,65% 11,17% 1

Santal Active 53,60% 57,65% 1,78% 1

Squash 53,60% 57,65% 19,74% 1

Zapp 53,60% 57,65% 1,78% 1

Bebidas Hidratantes

Otras 53,60% 57,65% 1,17% 1

Ades 78,50% 80,13% 4,31% 1

Alpina 78,50% 80,13% 40,70% 1

Alpina bajos en Azúcar 78,50% 80,13% 7,01% 1

Alpina Light 78,50% 80,13% 5,06% 1

Alpina Premium 78,50% 80,13% 2,43% 1

Alpina Premium Light 78,50% 80,13% 1,86% 1

Cafam 78,50% 80,13% 2,40% 1

California 78,50% 80,13% 14,80% 1

Calipso 78,50% 80,13% 3,50% 1

Canary 78,50% 80,13% 3,80% 1

Capitán Frutonita 78,50% 80,13% 5,06% 1

Carioca 78,50% 80,13% 5,41% 1

Colibrí 78,50% 80,13% 2,03% 1

Coljugos 78,50% 80,13% 3,58% 1

Colsubsidio 78,50% 80,13% 1,02% 1

Country Hill 78,50% 80,13% 6,12% 1

Country Hill Light 78,50% 80,13% 1,70% 1

Exito 78,50% 80,13% 3,58% 1

Hit 78,50% 80,13% 48,01% 1

Hit Premium 78,50% 80,13% 1,91% 1

Holyday Punch 78,50% 80,13% 0,73% 1

La Parcela 78,50% 80,13% 2,10% 1

Leemon 78,50% 80,13% 6,53% 1

Leemon Light 78,50% 80,13% 1,80% 1

Néctar Alpina 78,50% 80,13% 8,78% 1

Orense 78,50% 80,13% 4,29% 1

Orense Premium 78,50% 80,13% 0,89% 1

Piti 78,50% 80,13% 2,78% 1

Pomelos 78,50% 80,13% 1,61% 1

Jugos Envasados Listos

Santal Citrus Punch 78,50% 80,13% 0,97% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

102

Santal Light 78,50% 80,13% 1,02% 1

Santal Refresco 78,50% 80,13% 1,07% 1

Sonfil 78,50% 80,13% 1,11% 1

Tampico 78,50% 80,13% 39,11% 1

Total 78,50% 80,13% 2,75% 1

Tutti Frutti 78,50% 80,13% 48,33% 1

Tutti Frutti Light 78,50% 80,13% 6,44% 1

Otras 78,50% 80,13% 0,86% 1

Alpina 75,20% 81,12% 15,02% 1

Brisa 75,20% 81,12% 68,03% 1

Cafam 75,20% 81,12% 1,85% 1

Carulla 75,20% 81,12% 1,72% 1

Club K 75,20% 81,12% 3,64% 1

Colsubsidio 75,20% 81,12% 1,82% 1

Cristal 75,20% 81,12% 35,74% 1

Deleyte 75,20% 81,12% 1,26% 1

Evian 75,20% 81,12% 0,57% 1

Exito 75,20% 81,12% 1,75% 1

Glacial 75,20% 81,12% 1,43% 1

La Parcela 75,20% 81,12% 3,90% 1

Manantial 75,20% 81,12% 24,92% 1

Perrier 75,20% 81,12% 0,93% 1

Premio 75,20% 81,12% 2,05% 1

Pura 75,20% 81,12% 9,84% 1

San Benedetto 75,20% 81,12% 0,84% 1

Santa Clara 75,20% 81,12% 21,80% 1

Agua Envasada

Otras 75,20% 81,12% 1,41% 1

3 Musketeers 78,90% 77,19% 5,30% 1

Baby Johnnys 78,90% 77,19% 3,69% 1

Choco Break 78,90% 77,19% 38,75% 1

Chocoloco 78,90% 77,19% 15,81% 1

Cholitos 78,90% 77,19% 6,34% 1

Colombina 78,90% 77,19% 30,21% 1

Cruji Jet 78,90% 77,19% 14,06% 1

Crunch 78,90% 77,19% 4,42% 1

Ferrero Noggy 78,90% 77,19% 7,80% 1

Ferrero Rocher 78,90% 77,19% 8,01% 1

Galak 78,90% 77,19% 2,50% 1

Garoto 78,90% 77,19% 5,57% 1

Gol 78,90% 77,19% 22,99% 1

Goleador 78,90% 77,19% 8,13% 1

Golpe 78,90% 77,19% 19,21% 1

Hersheys 78,90% 77,19% 2,92% 1

Italo 78,90% 77,19% 10,90% 1

Jet 78,90% 77,19% 52,38% 1

Chocolatinas

Jet Lyne 78,90% 77,19% 4,02% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

103

Jumbo Jet 78,90% 77,19% 23,97% 1

Kick 78,90% 77,19% 1,54% 1

Kinder 78,90% 77,19% 4,94% 1

Kinder Sorpresa 78,90% 77,19% 5,76% 1

Kit Kat 78,90% 77,19% 1,17% 1

M&Ms 78,90% 77,19% 7,06% 1

Mars 78,90% 77,19% 1,56% 1

Milky Way 78,90% 77,19% 7,90% 1

Milo Nuggets 78,90% 77,19% 3,65% 1

Música 78,90% 77,19% 7,45% 1

Muu 78,90% 77,19% 6,90% 1

Nestlé Classic 78,90% 77,19% 4,55% 1

Nicolo 78,90% 77,19% 3,68% 1

Nucita 78,90% 77,19% 20,03% 1

Smarties 78,90% 77,19% 2,45% 1

Snickers 78,90% 77,19% 8,51% 1

Sport 78,90% 77,19% 4,71% 1

Toblerone 78,90% 77,19% 1,35% 1

Topsi 78,90% 77,19% 5,98% 1

Triunfo 78,90% 77,19% 2,46% 1

Twix 78,90% 77,19% 2,23% 1

Zero 78,90% 77,19% 1,43% 1

Otras 78,90% 77,19% 1,23% 1

Barrilete 78,10% 83,23% 21,08% 1

Beso de Negra 78,10% 83,23% 6,57% 1

Blue Mint 78,10% 83,23% 10,28% 1

Bon Bon Bum 78,10% 83,23% 58,62% 1

Café Gourmet 78,10% 83,23% 5,92% 1

Caramelos Max 78,10% 83,23% 9,65% 1

Caramelos Noel 78,10% 83,23% 28,15% 1

Certs 78,10% 83,23% 8,57% 1

Charms 78,10% 83,23% 7,08% 1

Chocmelos 78,10% 83,23% 13,03% 1

Chupa Chups 78,10% 83,23% 11,58% 1

Chupi Plum 78,10% 83,23% 27,85% 1

Coffee Delight 78,10% 83,23% 16,46% 1

Coffee Zee 78,10% 83,23% 1,86% 1

Colombineta 78,10% 83,23% 11,06% 1

Crazy Dips 78,10% 83,23% 1,91% 1

Dulces Colombina 78,10% 83,23% 18,15% 1

Dulces Dragus 78,10% 83,23% 9,71% 1

Frunas Dragus 78,10% 83,23% 16,00% 1

Gomas Colombina 78,10% 83,23% 10,45% 1

Gomas Italo 78,10% 83,23% 6,83% 1

GomasTrolli 78,10% 83,23% 2,49% 1

Dulces/G

olosinas/Gomitas

Gomitas Fox 78,10% 83,23% 2,54% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

104

Halls 78,10% 83,23% 13,52% 1

Haribo 78,10% 83,23% 1,23% 1

Leche Condensada La Lechera (en lata) 78,10% 83,23% 19,54% 1

Leche Condensada La Lechera (muñequitos) 78,10% 83,23% 6,23% 1

Lokiño 78,10% 83,23% 7,34% 1

Masmelos Fox 78,10% 83,23% 4,86% 1

Masmelos Millows 78,10% 83,23% 5,75% 1

Menta Helada 78,10% 83,23% 36,00% 1

Menthos 78,10% 83,23% 2,28% 1

Mist 78,10% 83,23% 1,86% 1

Pin Pop Hiperfresa 78,10% 83,23% 5,23% 1

Piruleta 78,10% 83,23% 5,45% 1

Pirulito 78,10% 83,23% 16,62% 1

Polo 78,10% 83,23% 1,17% 1

Quipitos 78,10% 83,23% 7,12% 1

Snow 78,10% 83,23% 1,62% 1

Sparkies 78,10% 83,23% 18,00% 1

Sshup 78,10% 83,23% 2,37% 1

Supercoco 78,10% 83,23% 13,95% 1

Tic Tac 78,10% 83,23% 9,43% 1

Tipitín 78,10% 83,23% 2,29% 1

Vita C 78,10% 83,23% 6,92% 1

Yogueta 78,10% 83,23% 25,08% 1

Otras 78,10% 83,23% 0,92% 1

Adams 77,10% 82,23% 67,03% 1

Artic 77,10% 82,23% 2,63% 1

Big Time 77,10% 82,23% 1,61% 1

Bolibomba 77,10% 82,23% 4,72% 1

Bubbaloo 77,10% 82,23% 26,66% 1

Bubblicious 77,10% 82,23% 1,14% 1

Burts 77,10% 82,23% 1,50% 1

Charms 77,10% 82,23% 16,56% 1

Clorets 77,10% 82,23% 16,72% 1

Cry Baby 77,10% 82,23% 1,37% 1

Dentyne 77,10% 82,23% 4,81% 1

Extra 77,10% 82,23% 0,82% 1

Globo 77,10% 82,23% 9,02% 1

Ice 77,10% 82,23% 9,84% 1

Ice Canela 77,10% 82,23% 5,93% 1

Kataboom 77,10% 82,23% 1,32% 1

Maxi 77,10% 82,23% 3,72% 1

Miniatura 77,10% 82,23% 2,95% 1

Motitas 77,10% 82,23% 20,98% 1

Super-hiper-ácido 77,10% 82,23% 7,49% 1

Trident 77,10% 82,23% 28,23% 1

Chicles

Trident White 77,10% 82,23% 11,51% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

105

Tumix 77,10% 82,23% 29,97% 1

Wrigleys 77,10% 82,23% 1,15% 1

Zip Zap 77,10% 82,23% 1,80% 1

Otras 77,10% 82,23% 0,80% 1

Achiras Ramo 79,50% 79,37% 6,80% 1

Besitos Chefrito 79,50% 79,37% 4,88% 1

Besitos Margarita 79,50% 79,37% 10,86% 1

Besitos Super Ricas 79,50% 79,37% 6,67% 1

Besitos Yupi 79,50% 79,37% 9,29% 1

Boli Cheetos 79,50% 79,37% 9,51% 1

Cheese Tris 79,50% 79,37% 17,91% 1

Cheetos 79,50% 79,37% 16,32% 1

Chi Ricos 79,50% 79,37% 3,36% 1

Chicharrón Americano Margarita 79,50% 79,37% 19,02% 1

Chicharrón Super Ricas 79,50% 79,37% 12,00% 1

Chicharrones Cronch 79,50% 79,37% 7,69% 1

Choclitos 79,50% 79,37% 17,75% 1

Choco Poff 79,50% 79,37% 3,04% 1

Combos 79,50% 79,37% 3,09% 1

Crujitos Frito Lay 79,50% 79,37% 3,80% 1

De Todito 79,50% 79,37% 19,81% 1

Doritos 79,50% 79,37% 17,27% 1

El Golpe 79,50% 79,37% 22,35% 1

Gatolate 79,50% 79,37% 2,31% 1

Gringos 79,50% 79,37% 2,68% 1

Maizitos 79,50% 79,37% 14,06% 1

Maní La Especial 79,50% 79,37% 8,00% 1

Mani Moto 79,50% 79,37% 16,80% 1

Manicero 79,50% 79,37% 5,99% 1

Munchos Snax 79,50% 79,37% 1,06% 1

Palokitos 79,50% 79,37% 4,29% 1

Palomitas Yupi 79,50% 79,37% 5,55% 1

Papas Cronch 79,50% 79,37% 8,16% 1

Papas Super Ricas 79,50% 79,37% 21,24% 1

Papas Lays 79,50% 79,37% 2,27% 1

Papas Lizas 79,50% 79,37% 5,37% 1

Papas Margarita 79,50% 79,37% 44,85% 1

Papas Margarita Colombianas 79,50% 79,37% 21,55% 1

Papas Pringles 79,50% 79,37% 2,42% 1

Papas Rizadas 79,50% 79,37% 20,29% 1

Papas Ruffles 79,50% 79,37% 7,88% 1

Pasabocas Piquitos 79,50% 79,37% 2,16% 1

Planters 79,50% 79,37% 0,90% 1

Platanitos Cronch 79,50% 79,37% 10,19% 1

Poffets Crispetas 79,50% 79,37% 1,01% 1

Pasabocas en Paquete

Potines 79,50% 79,37% 3,41% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

106

Ritz Bits Sandwiches 79,50% 79,37% 1,57% 1

Rosquitas Yupi 79,50% 79,37% 6,50% 1

Rosquitas Margarita 79,50% 79,37% 6,77% 1

Tajaditas Super Ricas 79,50% 79,37% 5,36% 1

Tajamiel 79,50% 79,37% 5,02% 1

Tatos 79,50% 79,37% 5,07% 1

Tocinetas Super Ricas 79,50% 79,37% 7,58% 1

Todo Rico Super Ricas 79,50% 79,37% 7,59% 1

Tosta Ricos 79,50% 79,37% 1,89% 1

Tostacos 79,50% 79,37% 9,97% 1

Tosti Arepa Yupi 79,50% 79,37% 5,56% 1

Tozinetas Fred Yupi 79,50% 79,37% 4,83% 1

Traga Traga 79,50% 79,37% 4,23% 1

Trissitos 79,50% 79,37% 8,83% 1

Trocipollo 79,50% 79,37% 10,46% 1

Trocitos Super Ricas 79,50% 79,37% 3,31% 1

Yupi Queso 79,50% 79,37% 10,48% 1

Yupis 79,50% 79,37% 19,18% 1

Otras 79,50% 79,37% 1,87% 1

Cola de Tigre 83,10% 72,32% 4,14% 1

Cremoletta 83,10% 72,32% 16,64% 1

Drácula 83,10% 72,32% 10,92% 1

Paleta Casera 83,10% 72,32% 20,30% 1

Pasión 83,10% 72,32% 6,12% 1

Polet 83,10% 72,32% 17,14% 1

Tornado 83,10% 72,32% 4,99% 1

Turrón 83,10% 72,32% 8,49% 1

Otras (paletas de crema) 83,10% 72,32% 3,19% 1

Colorín 83,10% 72,32% 3,16% 1

Crayola 83,10% 72,32% 3,56% 1

Dupletta 83,10% 72,32% 2,66% 1

Fruti 83,10% 72,32% 5,89% 1

Paleta de Agua 83,10% 72,32% 25,62% 1

Paloloco 83,10% 72,32% 7,75% 1

Tronix 83,10% 72,32% 2,21% 1

Otras (paletas de agua) 83,10% 72,32% 1,78% 1

Bocato 83,10% 72,32% 19,80% 1

Chikocono 83,10% 72,32% 3,68% 1

Chocono 83,10% 72,32% 31,61% 1

Coquicono 83,10% 72,32% 2,66% 1

Croquito 83,10% 72,32% 3,86% 1

Pasas 83,10% 72,32% 15,81% 1

Otras (conos) 83,10% 72,32% 2,65% 1

Aloha 83,10% 72,32% 8,97% 1

Capricho 83,10% 72,32% 18,97% 1

Helados/Refrescos Congelados

Goli Sundae 83,10% 72,32% 3,76% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

107

Heladino 83,10% 72,32% 18,47% 1

Otras (vasos) 83,10% 72,32% 2,51% 1

Chikos 83,10% 72,32% 1,46% 1

Galleta Helado 83,10% 72,32% 14,79% 1

Platillo 83,10% 72,32% 4,59% 1

Sinfonía 83,10% 72,32% 1,76% 1

Otras (especialidades) 83,10% 72,32% 1,18% 1

Bon Ice 83,10% 72,32% 44,93% 1

Bon Ice Cremoso 83,10% 72,32% 14,73% 1

Superboli 83,10% 72,32% 9,80% 1

Superboli Cremy 83,10% 72,32% 4,21% 1

Bennys 83,10% 72,32% 1,55% 1

Crem Helado 83,10% 72,32% 30,62% 1

Crem Helado Light 83,10% 72,32% 2,43% 1

Éxito 83,10% 72,32% 1,86% 1

Häagen Dazs 83,10% 72,32% 1,25% 1

La Campiña 83,10% 72,32% 6,16% 1

La Fuente 83,10% 72,32% 15,37% 1

Mimos 83,10% 72,32% 9,63% 1

Parmalat 83,10% 72,32% 4,19% 1

Picos 83,10% 72,32% 2,31% 1

Popsy 83,10% 72,32% 5,16% 1

Robin Hood 83,10% 72,32% 10,93% 1

San Fermín 83,10% 72,32% 2,33% 1

San Jerónimo 83,10% 72,32% 3,33% 1

Ventolini 83,10% 72,32% 2,00% 1

Yogen Früz 83,10% 72,32% 1,78% 1

Otras (compañías) 83,10% 72,32% 2,90% 1

Bimbo con Gotas de Chocolate 68,90% 75,04% 16,03% 1

Bimboletes 68,90% 75,04% 4,97% 1

Cafam 68,90% 75,04% 2,01% 1

Choco Sorpresa Bimbo 68,90% 75,04% 4,78% 1

Chocoramo 68,90% 75,04% 55,13% 1

Chocoso 68,90% 75,04% 4,14% 1

Colsubsidio 68,90% 75,04% 1,30% 1

Éxito 68,90% 75,04% 2,30% 1

Gansito 68,90% 75,04% 20,89% 1

Keikito 68,90% 75,04% 0,85% 1

Lalo 68,90% 75,04% 4,02% 1

Manchitas 68,90% 75,04% 5,16% 1

Mankeke 68,90% 75,04% 1,32% 1

Mr. Brown 68,90% 75,04% 8,45% 1

Negrito 68,90% 75,04% 2,24% 1

Pingüino 68,90% 75,04% 10,37% 1

Pipiolo 68,90% 75,04% 6,44% 1

Ponques de Paquete

Ponky Bizcochitos 68,90% 75,04% 3,29% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

108

Ponky Pastel 68,90% 75,04% 5,28% 1

Ponky Ponkecitos 68,90% 75,04% 4,18% 1

Ponqué Bimbo Casero 68,90% 75,04% 10,56% 1

Ponqué Bimbo Chocolate 68,90% 75,04% 8,20% 1

Ponqué Bimbo Pasas 68,90% 75,04% 5,42% 1

Ponqué Comapan 68,90% 75,04% 6,96% 1

Ponqué Gala 68,90% 75,04% 34,24% 1

Ponquecito Bimbo de Naranja 68,90% 75,04% 6,21% 1

Ponqué Ramo 68,90% 75,04% 28,24% 1

Power Kids 68,90% 75,04% 0,79% 1

Rebanadas Bimbo 68,90% 75,04% 4,53% 1

Roles de Canela Bimbo 68,90% 75,04% 1,24% 1

Submarino 68,90% 75,04% 11,24% 1

Otras 68,90% 75,04% 1,72% 1

Algurt Algarra 86,00% 76,63% 4,93% 1

Algy 86,00% 76,63% 0,70% 1

Bon Yurt 86,00% 76,63% 31,56% 1

Kids Up Parmalat (yogur) 86,00% 76,63% 2,25% 1

Pomy 86,00% 76,63% 2,28% 1

Yogur Alpina 86,00% 76,63% 50,83% 1

Yogur Cafam 86,00% 76,63% 2,09% 1

Yogur Ciledco 86,00% 76,63% 3,29% 1

Yogur Colanta 86,00% 76,63% 12,28% 1

Yogur Colsubsidio 86,00% 76,63% 0,96% 1

Yogur con Cereal Parmalat 86,00% 76,63% 5,92% 1

Yogur con Cereal Proleche 86,00% 76,63% 2,40% 1

Yogur Coolechera 86,00% 76,63% 5,58% 1

Yogur Cremoso Yoplait 86,00% 76,63% 6,07% 1

Yogur Deslac 86,00% 76,63% 1,18% 1

Yogur Dieta Parmalat 86,00% 76,63% 2,63% 1

Yogur Dietético Proleche 86,00% 76,63% 1,21% 1

Yogur El Pomar 86,00% 76,63% 2,19% 1

Yogur Exito 86,00% 76,63% 1,85% 1

Yogur Finesse 86,00% 76,63% 6,22% 1

Yogur Finesse con Cereales 86,00% 76,63% 2,56% 1

Yogur Frescaleche 86,00% 76,63% 2,09% 1

Yogur Infantil Alpina 86,00% 76,63% 4,52% 1

Yogur Lechesán 86,00% 76,63% 1,31% 1

Yogur Normandía 86,00% 76,63% 0,96% 1

Yogur Parmalat 86,00% 76,63% 8,25% 1

Yogur Pasco 86,00% 76,63% 0,86% 1

Yogur Proleche 86,00% 76,63% 3,23% 1

Yogur Robin Hood 86,00% 76,63% 2,19% 1

Yogur Schapeli 86,00% 76,63% 0,56% 1

Yogur Superior 86,00% 76,63% 1,03% 1

Yogur/Kumis/B

ebidas Lácteas

Yogur Yoplait 86,00% 76,63% 10,68% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

109

Yogur Yoplait Económico 86,00% 76,63% 4,08% 1

Yoplait 1+1 86,00% 76,63% 2,25% 1

Yoplait Light 0% Grasa 86,00% 76,63% 2,72% 1

Otras (yogures) 86,00% 76,63% 2,37% 1

Kumis Algarra 86,00% 76,63% 3,81% 1

Kumis Alpina 86,00% 76,63% 32,78% 1

Kumis Colanta 86,00% 76,63% 6,74% 1

Kumis Colsubsidio 86,00% 76,63% 1,43% 1

Kumis Coolechera 86,00% 76,63% 2,06% 1

Kumis Deslac 86,00% 76,63% 1,08% 1

Kumis El Pomar 86,00% 76,63% 2,43% 1

Kumis Finesse 86,00% 76,63% 3,49% 1

Kumis Parmalat 86,00% 76,63% 6,95% 1

Kumis Proleche 86,00% 76,63% 2,22% 1

Kumis Robin Hood 86,00% 76,63% 2,52% 1

Kumis Superior 86,00% 76,63% 1,35% 1

Kumis Yoplait 86,00% 76,63% 8,42% 1

Otras (kumis) 86,00% 76,63% 1,78% 1

Applause 86,00% 76,63% 3,34% 1

Bat Gur 86,00% 76,63% 7,51% 1

Bebida Láctea Alpinito 86,00% 76,63% 11,75% 1

Bebida Láctea Parmalat 86,00% 76,63% 7,78% 1

Bebida Láctea Proleche 86,00% 76,63% 4,01% 1

Bebida Láctea Puracé 86,00% 76,63% 4,04% 1

Yam Yoplait 86,00% 76,63% 2,41% 1

Yogo Pop 86,00% 76,63% 3,23% 1

Yogo Yogo 86,00% 76,63% 35,36% 1

Yogo Yogo Premio 86,00% 76,63% 5,69% 1

Otras (bebidas lácteas) 86,00% 76,63% 1,81% 1

Alpín Alpina 86,00% 76,63% 11,75% 1

Colcafé 86,00% 76,63% 4,76% 1

Éxito (leche saborizada) 86,00% 76,63% 1,40% 1

Frescolate 86,00% 76,63% 1,62% 1

Hersheys 86,00% 76,63% 0,83% 1

Kids Up Parmalat (leche saborizada) 86,00% 76,63% 1,34% 1

Leche Saborizada Parmalat 86,00% 76,63% 6,46% 1

Leche Saborizada Proleche 86,00% 76,63% 4,66% 1

Malteada Crem Helado 86,00% 76,63% 5,24% 1

Milkiño 86,00% 76,63% 2,34% 1

Nesquik 86,00% 76,63% 9,85% 1

Shikiss 86,00% 76,63% 1,09% 1

Otras (leches saborizadas) 86,00% 76,63% 1,53% 1

Club Social 79,30% 79,07% 43,70% 1

Cream Cracker 79,30% 79,07% 1,69% 1

Doré 79,30% 79,07% 7,37% 1

Galletas no

Dulces

Ducales 79,30% 79,07% 40,51% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

110

Dux 79,30% 79,07% 9,87% 1

Hit 79,30% 79,07% 9,54% 1

Kraker Bran 79,30% 79,07% 5,09% 1

Nesfit 79,30% 79,07% 3,41% 1

Ricas 79,30% 79,07% 4,34% 1

Ritz 79,30% 79,07% 4,24% 1

Saltín Integral Noel 79,30% 79,07% 16,75% 1

Saltín Noel 79,30% 79,07% 55,66% 1

Saltinas Nestlé 79,30% 79,07% 10,02% 1

Saltinas Mantequilla 79,30% 79,07% 8,37% 1

Saltinas Tres Cereales 79,30% 79,07% 2,97% 1

Sodas Nestlé 79,30% 79,07% 2,89% 1

Sodas Noel 79,30% 79,07% 9,11% 1

Tosh Ajonjolí 79,30% 79,07% 5,93% 1

Otras 79,30% 79,07% 0,91% 1

Antojos 78,10% 73,37% 3,70% 1

Aveny Bran 78,10% 73,37% 2,39% 1

Barquillos Opera 78,10% 73,37% 6,13% 1

Barquillos Piazza 78,10% 73,37% 9,49% 1

Bridge 78,10% 73,37% 6,20% 1

Brinky 78,10% 73,37% 7,16% 1

Bromitas 78,10% 73,37% 3,73% 1

Can Can 78,10% 73,37% 44,68% 1

Can Can Comics 78,10% 73,37% 7,64% 1

Carrefour 78,10% 73,37% 1,34% 1

Chips Ahoy! 78,10% 73,37% 1,71% 1

Choco Wafer 78,10% 73,37% 15,10% 1

Colaciones Ramo 78,10% 73,37% 3,07% 1

Cookies Chocochips 78,10% 73,37% 2,36% 1

Deditos 78,10% 73,37% 4,47% 1

Festival 78,10% 73,37% 51,66% 1

Fig Newtons 78,10% 73,37% 1,29% 1

Figuritas 78,10% 73,37% 5,32% 1

Galletas Fiesta 78,10% 73,37% 5,69% 1

Galletas Tipo Leche Colombina 78,10% 73,37% 11,62% 1

Galletas Tipo Leche Noel 78,10% 73,37% 12,20% 1

Hanuta 78,10% 73,37% 2,44% 1

HonyBran 78,10% 73,37% 7,09% 1

Macarena 78,10% 73,37% 2,41% 1

Melodías 78,10% 73,37% 0,80% 1

Mini Chips 78,10% 73,37% 16,14% 1

Morenitas 78,10% 73,37% 2,88% 1

Oreo Crema 78,10% 73,37% 14,08% 1

Oreo Fudge 78,10% 73,37% 1,82% 1

Quimbaya 78,10% 73,37% 5,01% 1

Galletas Dulces

Recreo 78,10% 73,37% 19,55% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

111

Rellena Parmalat 78,10% 73,37% 2,53% 1

Rondallas 78,10% 73,37% 20,42% 1

Sultana 78,10% 73,37% 5,86% 1

Superwafer Nestlé 78,10% 73,37% 3,94% 1

Tosh Galleta Sandwich 78,10% 73,37% 1,57% 1

Tosh Miel 78,10% 73,37% 4,29% 1

Trakinas 78,10% 73,37% 1,13% 1

Trigueñas 78,10% 73,37% 7,05% 1

Wafer Cafam 78,10% 73,37% 2,48% 1

Wafer Colombina 78,10% 73,37% 10,24% 1

Wafer Exito 78,10% 73,37% 3,23% 1

Wafer Fantasía 78,10% 73,37% 3,04% 1

Wafer Jet 78,10% 73,37% 12,44% 1

Wafer Noel 78,10% 73,37% 15,97% 1

Wafer Nucita 78,10% 73,37% 7,33% 1

Wafer Parmalat 78,10% 73,37% 2,95% 1

Wafer Italo 78,10% 73,37% 6,60% 1

Otras 78,10% 73,37% 1,33% 1

Alpinette 49,20% 67,89% 19,49% 1

Alpinito 49,20% 67,89% 37,13% 1

Alpinito Noche 49,20% 67,89% 9,16% 1

Arequipe Alpina 49,20% 67,89% 39,22% 1

Arequipe Antaño 49,20% 67,89% 3,92% 1

Arequipe Celema 49,20% 67,89% 2,31% 1

Arequipe Codegán 49,20% 67,89% 2,43% 1

Arequipe Colanta 49,20% 67,89% 8,68% 1

Arequipe Coolechera 49,20% 67,89% 3,80% 1

Arequipe El Recreo 49,20% 67,89% 4,01% 1

Arequipe La Candelaria 49,20% 67,89% 2,19% 1

Arequipe Parmalat 49,20% 67,89% 7,96% 1

Arequipe Proleche 49,20% 67,89% 5,21% 1

Arequipe Puracé 49,20% 67,89% 2,01% 1

Arequipe Yoplait 49,20% 67,89% 4,88% 1

Bocaditos de Arequipe Colombina 49,20% 67,89% 6,14% 1

Bonflan 49,20% 67,89% 7,93% 1

Flan Yoplait 49,20% 67,89% 5,00% 1

Fruplait 49,20% 67,89% 1,47% 1

Frutas con Crema Yoplait 49,20% 67,89% 4,82% 1

Gelatina Boggy 49,20% 67,89% 31,14% 1

Gelatina Chiflis 49,20% 67,89% 2,60% 1

Gelatina Colanta 49,20% 67,89% 4,67% 1

Gelatina El Pomar 49,20% 67,89% 2,25% 1

Gelatina Parmalat 49,20% 67,89% 4,13% 1

Gelatina Proleche 49,20% 67,89% 2,93% 1

Gelatina Royalito 49,20% 67,89% 12,84% 1

Postres Envasados Listos

Gelatina Superior 49,20% 67,89% 2,93% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

112

Leche Condensada La Lechera (en lata) 49,20% 67,89% 30,24% 1

Leche Condensada La Lechera (muñequitos) 49,20% 67,89% 9,19% 1

Leche Condensada Parmalat 49,20% 67,89% 7,25% 1

Manjar del Valle 49,20% 67,89% 6,50% 1

Nucita 49,20% 67,89% 33,53% 1

Nutella 49,20% 67,89% 2,07% 1

Parmon 49,20% 67,89% 1,92% 1

Postre de Natas Santa Fé 49,20% 67,89% 3,65% 1

Postres Dietéticos Diety 49,20% 67,89% 1,38% 1

Postres Listos La Lechera 49,20% 67,89% 4,94% 1

Rospi 49,20% 67,89% 6,53% 1

Otras 49,20% 67,89% 1,74% 1

All Bran 58,00% 72,93% 11,21% 1

Cafam 58,00% 72,93% 1,58% 1

Carrefour 58,00% 72,93% 3,78% 1

Chocapic 58,00% 72,93% 13,05% 1

Choco Krispis 58,00% 72,93% 41,84% 1

Choco Krispis Arequipe 58,00% 72,93% 13,48% 1

Choco Zucaritas 58,00% 72,93% 21,94% 1

Colsubsidio 58,00% 72,93% 2,22% 1

Corn Flakes de Kelloggs 58,00% 72,93% 25,06% 1

Corn Flakes de Nestlé 58,00% 72,93% 7,73% 1

Corn Pops 58,00% 72,93% 1,49% 1

Exito 58,00% 72,93% 2,86% 1

Fiber One 58,00% 72,93% 1,51% 1

Fitness 58,00% 72,93% 3,33% 1

Fresi Krispis 58,00% 72,93% 2,25% 1

Froot Loops 58,00% 72,93% 4,66% 1

Gold 58,00% 72,93% 4,96% 1

Granny Granola 58,00% 72,93% 5,67% 1

Granola de Kelloggs 58,00% 72,93% 4,40% 1

Granola Sport 58,00% 72,93% 3,74% 1

Granolajet 58,00% 72,93% 2,08% 1

La Lechera Flakes 58,00% 72,93% 6,36% 1

Listo 58,00% 72,93% 2,25% 1

Lucky Charms 58,00% 72,93% 1,54% 1

Maizoro 58,00% 72,93% 2,74% 1

Miel Flakes 58,00% 72,93% 2,51% 1

Milo Cereal 58,00% 72,93% 8,06% 1

Müsli 58,00% 72,93% 3,26% 1

Nesquik 58,00% 72,93% 9,20% 1

Oat Bran 58,00% 72,93% 1,77% 1

Rice Krispis 58,00% 72,93% 1,02% 1

Special K 58,00% 72,93% 2,22% 1

Toasted Oatmeal 58,00% 72,93% 1,21% 1

Cereales

Trix 58,00% 72,93% 4,70% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

113

Zucaritas 58,00% 72,93% 36,64% 1

Zucaritas Arequipe 58,00% 72,93% 11,11% 1

Zucosos 58,00% 72,93% 11,49% 1

Otras 58,00% 72,93% 2,32% 1

Algarra 51,00% 65,29% 13,24% 1

Alpina 51,00% 65,29% 69,37% 1

Alpina con Canela 51,00% 65,29% 19,07% 1

Alquería 51,00% 65,29% 17,33% 1

Deslac 51,00% 65,29% 3,42% 1

Finesse 51,00% 65,29% 10,93% 1

Parmalat 51,00% 65,29% 15,53% 1

Proleche 51,00% 65,29% 9,55% 1

Yoplait 51,00% 65,29% 15,44% 1

Avenas Envasadas Listas

Otras 51,00% 65,29% 2,49% 1

Aquafresh 99,40% 97,48% 12,28% 4

Close Up 99,40% 97,48% 5,58% 4

Colgate Bicarbonato 99,40% 97,48% 6,46% 4

Colgate Blanqueadora 99,40% 97,48% 15,58% 4

Colgate Doble Frescura 99,40% 97,48% 8,36% 4

Colgate Herbal 99,40% 97,48% 6,09% 4

Colgate Menta 99,40% 97,48% 23,01% 4

Colgate Frescura Confiable 99,40% 97,48% 6,71% 4

Colgate Triple Acción 99,40% 97,48% 36,74% 4

Colgate Sensitive 99,40% 97,48% 2,23% 4

Colgate Total 99,40% 97,48% 21,16% 4

Colgate Total Blanqueadora 99,40% 97,48% 6,32% 4

Crest 99,40% 97,48% 1,98% 4

Fluocardent 99,40% 97,48% 5,13% 4

Iguazú 99,40% 97,48% 0,93% 4

Kolynos 99,40% 97,48% 11,56% 4

Mentadent P 99,40% 97,48% 1,19% 4

Oral B 99,40% 97,48% 1,88% 4

Prevent 99,40% 97,48% 0,61% 4

Sensodyne 99,40% 97,48% 1,40% 4

Crema Dental

Otras 99,40% 97,48% 1,14% 4

Aquafresh 61,40% 86,48% 13,92% 4

Astringosol 61,40% 86,48% 8,34% 4

Bactrodine 61,40% 86,48% 1,24% 4

Bucoseptol 61,40% 86,48% 0,98% 4

Colgate Plax 61,40% 86,48% 5,40% 4

Exito 61,40% 86,48% 1,22% 4

Isodine Bucofaríngeo 61,40% 86,48% 8,47% 4

Listerine 61,40% 86,48% 68,74% 4

Listermint 61,40% 86,48% 8,93% 4

Oral B 61,40% 86,48% 9,60% 4

Higiene Personal

Enjuague Bucal

Plakos 61,40% 86,48% 1,64% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

114

Reach 61,40% 86,48% 5,89% 4

Scope 61,40% 86,48% 1,11% 4

Otras 61,40% 86,48% 1,26% 4

Aquafresh 98,20% 100,00% 6,58% 12

Cafam 98,20% 100,00% 1,60% 12

Carrefour 98,20% 100,00% 0,75% 12

Close Up 98,20% 100,00% 4,38% 12

Colgate 98,20% 100,00% 68,53% 12

Colsubsidio 98,20% 100,00% 0,65% 12

Crest 98,20% 100,00% 1,41% 12

Exito 98,20% 100,00% 1,44% 12

Fluocardent 98,20% 100,00% 3,60% 12

Kolynos 98,20% 100,00% 9,50% 12

Mentadent P 98,20% 100,00% 1,16% 12

Oral B 98,20% 100,00% 18,13% 12

Plakos 98,20% 100,00% 0,80% 12

Pro 98,20% 100,00% 18,53% 12

Reach 98,20% 100,00% 11,20% 12

Sensodyne 98,20% 100,00% 1,20% 12

Cepillos de Dientes

Otras 98,20% 100,00% 1,80% 12

Aquafresh 63,00% 89,52% 9,79% 4

Blanquident 63,00% 89,52% 4,36% 4

Cafam 63,00% 89,52% 2,96% 4

Colgate 63,00% 89,52% 51,60% 4

Exito 63,00% 89,52% 4,10% 4

Fluocardent 63,00% 89,52% 4,70% 4

Kolynos 63,00% 89,52% 5,78% 4

Oral B 63,00% 89,52% 18,62% 4

Plakos 63,00% 89,52% 1,40% 4

Pro 63,00% 89,52% 7,25% 4

Reach 63,00% 89,52% 14,95% 4

Zaz 63,00% 89,52% 1,91% 4

Seda Dental

Otras 63,00% 89,52% 3,33% 4

Adoreé 93,10% 94,63% 2,07% 4

Alberto VO5 93,10% 94,63% 1,56% 4

Alert 93,10% 94,63% 10,44% 4

Aquamarine 93,10% 94,63% 0,41% 4

Avon 93,10% 94,63% 2,66% 4

Baby Soft 93,10% 94,63% 2,62% 4

Biolad Antipiojos 93,10% 94,63% 0,27% 4

Bonawell 93,10% 94,63% 0,78% 4

Capill France 93,10% 94,63% 1,94% 4

Cruz Azul 93,10% 94,63% 1,19% 4

Delister 93,10% 94,63% 0,47% 4

Denorex 93,10% 94,63% 6,98% 4

Champu

Drene 93,10% 94,63% 0,48% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

115

Ebel 93,10% 94,63% 7,70% 4

Elvive L Oréal 93,10% 94,63% 1,31% 4

Fiammé 93,10% 94,63% 0,61% 4

Finesse 93,10% 94,63% 0,36% 4

Glemo 93,10% 94,63% 2,38% 4

Head & Shoulders 93,10% 94,63% 17,82% 4

Heno de Pravia 93,10% 94,63% 0,44% 4

Herbal Essences 93,10% 94,63% 1,68% 4

Johnsons Baby 93,10% 94,63% 5,36% 4

Johnsons for Kids 93,10% 94,63% 1,20% 4

Kwell 93,10% 94,63% 0,39% 4

Muss 93,10% 94,63% 1,83% 4

Naturaleza y Vida 93,10% 94,63% 1,49% 4

Neutrogena Clean 93,10% 94,63% 0,61% 4

Palmolive Botanicals 93,10% 94,63% 3,95% 4

Palmolive Kids 93,10% 94,63% 1,16% 4

Palmolive Naturals 93,10% 94,63% 5,95% 4

Pantene Pro V 93,10% 94,63% 23,16% 4

Pert Plus 93,10% 94,63% 3,55% 4

Selsun 93,10% 94,63% 1,19% 4

Shampiojos 93,10% 94,63% 0,81% 4

Sedal 93,10% 94,63% 35,41% 4

Suave 93,10% 94,63% 4,45% 4

Triatop 93,10% 94,63% 0,37% 4

Vidal Sassoon 93,10% 94,63% 0,45% 4

Vital Ervas 93,10% 94,63% 1,04% 4

Vitane 93,10% 94,63% 1,35% 4

Wellapon 93,10% 94,63% 4,74% 4

Yanbal 93,10% 94,63% 4,19% 4

Otras 93,10% 94,63% 3,83% 4

Alberto VO5 39,10% 80,82% 4,62% 4

Kleer Net 39,10% 80,82% 3,96% 4

Kleer Lac 39,10% 80,82% 9,72% 4

Marcel France 39,10% 80,82% 23,80% 4

Natural Styling 39,10% 80,82% 6,71% 4

New Wave 39,10% 80,82% 4,30% 4

Pantene 39,10% 80,82% 19,84% 4

St. Ives Hair 39,10% 80,82% 1,08% 4

Studio Line 39,10% 80,82% 2,97% 4

Wellapon 39,10% 80,82% 9,27% 4

Wella Spray 39,10% 80,82% 4,40% 4

Yanbal 39,10% 80,82% 11,65% 4

Productos para Estilizar el Cabello

Otras 39,10% 80,82% 21,49% 4

Alberto VO5 51,70% 81,62% 3,18% 4

Avon 51,70% 81,62% 4,60% 4

Acondicion

adores

Capill France 51,70% 81,62% 3,70% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

116

Elvive L Oréal 51,70% 81,62% 2,27% 4

Glemo 51,70% 81,62% 2,46% 4

Head & Shoulders 51,70% 81,62% 8,55% 4

Herbal Essences 51,70% 81,62% 2,01% 4

Hierbazid 51,70% 81,62% 4,95% 4

Johnsons Baby 51,70% 81,62% 4,00% 4

Konzil 51,70% 81,62% 13,60% 4

Muss 51,70% 81,62% 2,77% 4

Naturaleza y Vida 51,70% 81,62% 1,47% 4

Neutrogena Clean 51,70% 81,62% 0,62% 4

Palmolive Botanicals 51,70% 81,62% 3,32% 4

Palmolive Naturals 51,70% 81,62% 6,09% 4

Pantene Pro V 51,70% 81,62% 23,70% 4

Pert Plus 51,70% 81,62% 3,01% 4

Suave 51,70% 81,62% 1,59% 4

Sedal 51,70% 81,62% 45,50% 4

Vital Ervas 51,70% 81,62% 0,95% 4

Vitane 51,70% 81,62% 1,56% 4

Wellapon 51,70% 81,62% 4,53% 4

Yanbal 51,70% 81,62% 4,36% 4

Otras 51,70% 81,62% 4,62% 4

Bigen 25,20% 82,54% 10,10% 24

Capill France 25,20% 82,54% 6,15% 24

Casting 25,20% 82,54% 2,02% 24

Colorance 25,20% 82,54% 3,17% 24

Color Perfect 25,20% 82,54% 3,65% 24

Igora 25,20% 82,54% 38,89% 24

Imédia Excellence 25,20% 82,54% 2,69% 24

Kolestón Wella 25,20% 82,54% 17,31% 24

Lumia 25,20% 82,54% 2,07% 24

Luminance 25,20% 82,54% 9,86% 24

Nutrisse 25,20% 82,54% 7,64% 24

Palette 25,20% 82,54% 10,19% 24

Real Color 25,20% 82,54% 6,30% 24

Revlon 25,20% 82,54% 1,35% 24

Soft Color Wella 25,20% 82,54% 4,09% 24

Tinturas para el Cabello

Otras 25,20% 82,54% 7,84% 24

8 x 4 93,10% 97,21% 2,70% 4

Adidas 93,10% 97,21% 2,12% 4

Alberto VO5 93,10% 97,21% 1,31% 4

April Violets 93,10% 97,21% 0,74% 4

Arden For Men 93,10% 97,21% 10,18% 4

Avon 93,10% 97,21% 6,91% 4

Axe 93,10% 97,21% 7,83% 4

Azzaro 93,10% 97,21% 1,80% 4

Desodorantes y Antitranspirantes

Balance 93,10% 97,21% 21,55% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

117

Balance Gel Power Caps 93,10% 97,21% 8,09% 4

Body Clear 93,10% 97,21% 3,09% 4

Bond Street 93,10% 97,21% 1,25% 4

Caresse 93,10% 97,21% 2,25% 4

Denim 93,10% 97,21% 0,34% 4

Ebel 93,10% 97,21% 7,23% 4

Elizabeth Arden 93,10% 97,21% 4,45% 4

Fa 93,10% 97,21% 2,98% 4

Gillette Series 93,10% 97,21% 3,85% 4

Gold For Men 93,10% 97,21% 1,36% 4

Hom 93,10% 97,21% 1,33% 4

Lady Speed Stick 93,10% 97,21% 13,81% 4

Mon Rêve 93,10% 97,21% 0,69% 4

Nivea 93,10% 97,21% 2,03% 4

Obao 93,10% 97,21% 3,67% 4

Rexona 93,10% 97,21% 16,13% 4

Secret 93,10% 97,21% 2,46% 4

She 93,10% 97,21% 0,71% 4

Speed Stick 93,10% 97,21% 11,71% 4

Sport 93,10% 97,21% 0,82% 4

Yanbal 93,10% 97,21% 3,39% 4

Yardley 93,10% 97,21% 1,15% 4

Yodora 93,10% 97,21% 8,40% 4

Otras 93,10% 97,21% 2,23% 4

Gillette Minora 73,40% 88,15% 22,57% 4

Schick Super Chromium 73,40% 88,15% 7,47% 4

Bic 73,40% 88,15% 4,64% 4

Gillette Prestobarba 73,40% 88,15% 44,82% 4

Gillette Satin Care 73,40% 88,15% 4,78% 4

Panda 73,40% 88,15% 1,10% 4

Schick Exacta 73,40% 88,15% 6,57% 4

Schick Ultra Barba 73,40% 88,15% 2,49% 4

Schick Xtreme 3 73,40% 88,15% 4,73% 4

Otras (desechables) 73,40% 88,15% 2,60% 4

Carrefour 73,40% 88,15% 1,56% 4

Gillette Mach 3 73,40% 88,15% 9,83% 4

Gillete Sensor 73,40% 88,15% 7,25% 4

Schick FX 73,40% 88,15% 1,59% 4

Schick Lady Protector 73,40% 88,15% 3,76% 4

Schick Protector 73,40% 88,15% 4,79% 4

Maquinas de Afeitar

Otras (sistemas) 73,40% 88,15% 1,25% 4

Adidas 23,30% 85,84% 6,10% 8

Avon 23,30% 85,84% 16,85% 8

Foamy 23,30% 85,84% 2,55% 8

Gillette Satin Care 23,30% 85,84% 19,70% 8

Crema/G

el/Espum

a de Afeitar

Gillette Series 23,30% 85,84% 30,80% 8

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

118

Gold 23,30% 85,84% 3,40% 8

Hom 23,30% 85,84% 3,15% 8

JGB 23,30% 85,84% 3,20% 8

Mc Donald 23,30% 85,84% 0,80% 8

Nivea for Men 23,30% 85,84% 4,70% 8

Noxzema 23,30% 85,84% 1,65% 8

Old Spice 23,30% 85,84% 2,75% 8

Schick Protector 23,30% 85,84% 4,70% 8

Virkos 23,30% 85,84% 1,30% 8

Yardley 23,30% 85,84% 4,80% 8

Otras 23,30% 85,84% 8,10% 8

Adidas 83,70% 90,68% 4,31% 24

Animale 83,70% 90,68% 2,24% 24

Avon 83,70% 90,68% 13,97% 24

Azzaro 83,70% 90,68% 3,69% 24

Benetton 83,70% 90,68% 2,03% 24

Body Care 83,70% 90,68% 0,67% 24

Body Mist 83,70% 90,68% 0,76% 24

Botanicals 83,70% 90,68% 0,75% 24

Boucheron 83,70% 90,68% 1,00% 24

Calvin Klein 83,70% 90,68% 6,17% 24

Carolina Herrera 83,70% 90,68% 8,68% 24

Cartier 83,70% 90,68% 1,73% 24

Christian Dior 83,70% 90,68% 1,91% 24

Clinique 83,70% 90,68% 0,65% 24

Dolce & Gabbana 83,70% 90,68% 1,24% 24

Ebel 83,70% 90,68% 43,61% 24

Elizabeth Arden 83,70% 90,68% 1,55% 24

Estée Lauder 83,70% 90,68% 0,34% 24

Giorgio Armani 83,70% 90,68% 1,46% 24

Giorgio Beverly Hills 83,70% 90,68% 1,11% 24

Givenchy 83,70% 90,68% 2,06% 24

Gucci 83,70% 90,68% 1,11% 24

Guess 83,70% 90,68% 0,54% 24

Halston 83,70% 90,68% 0,62% 24

Hugo Boss 83,70% 90,68% 5,05% 24

Issey Miyake 83,70% 90,68% 1,44% 24

Jean Paul Gaultier 83,70% 90,68% 1,32% 24

Kenzo 83,70% 90,68% 1,33% 24

Lancôme 83,70% 90,68% 0,36% 24

Oscar de la Renta 83,70% 90,68% 2,66% 24

Paco Rabanne 83,70% 90,68% 0,94% 24

Paloma Picasso 83,70% 90,68% 1,03% 24

Ralph Lauren 83,70% 90,68% 2,06% 24

Tommy Hilfiger 83,70% 90,68% 3,86% 24

Perfumes y Colonias

Versace 83,70% 90,68% 1,09% 24

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

119

Yanbal 83,70% 90,68% 16,21% 24

Yves Saint Laurent 83,70% 90,68% 0,67% 24

Otras 83,70% 90,68% 10,84% 24

Baby Soft 74,10% 94,74% 2,58% 12

Deo Pies 74,10% 94,74% 4,26% 12

Efficient 74,10% 94,74% 19,66% 12

Hansaplast 74,10% 94,74% 0,97% 12

Heno de Pravia 74,10% 94,74% 0,51% 12

Johnsons Baby 74,10% 94,74% 7,56% 12

Lady Mexsana 74,10% 94,74% 13,26% 12

Lander 74,10% 94,74% 1,55% 12

Mexsana Spray 74,10% 94,74% 4,37% 12

Mexsana Talco 74,10% 94,74% 48,01% 12

Natural Baby 74,10% 94,74% 0,67% 12

Ponds 74,10% 94,74% 2,42% 12

Secco 74,10% 94,74% 2,64% 12

Shower to Shower 74,10% 94,74% 0,90% 12

Sport 74,10% 94,74% 1,37% 12

Yanbal 74,10% 94,74% 5,28% 12

Yodora 74,10% 94,74% 12,35% 12

Talcos

Otras 74,10% 94,74% 4,53% 12

Content 1,80% 78,89% 19,72% 4

Depend Plenitud 1,80% 78,89% 8,45% 4

First Quality 1,80% 78,89% 14,08% 4

Pañalsec 1,80% 78,89% 22,54% 4

Tena 1,80% 78,89% 47,18% 4

Absorbentes para

Incontinencia Urinaria

Otras 1,80% 78,89% 9,15% 4

Acled 15,60% 79,49% 2,98% 4

Acnetick 10 15,60% 79,49% 4,35% 4

Avon 15,60% 79,49% 15,48% 4

Clean & Clear 15,60% 79,49% 23,31% 4

Clinique 15,60% 79,49% 3,47% 4

Ebel 15,60% 79,49% 18,47% 4

Neko 15,60% 79,49% 38,15% 4

Neutrogena 15,60% 79,49% 3,87% 4

Oxy 10 15,60% 79,49% 5,24% 4

Yanbal 15,60% 79,49% 10,48% 4 Productos para el Control del Acne

Otras 15,60% 79,49% 7,02% 4

Australian Gold 27,60% 74,64% 2,82% 4

Banana Boat 27,60% 74,64% 4,17% 4

Clinique 27,60% 74,64% 2,33% 4

Coppertone 27,60% 74,64% 4,08% 4

Hawaian Tropic 27,60% 74,64% 3,74% 4

Natalia París 27,60% 74,64% 3,59% 4

Nivea Sun 27,60% 74,64% 11,07% 4

Productos para Proteccion

Solar

Nudebronze 27,60% 74,64% 1,41% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

120

Sundown 27,60% 74,64% 34,22% 4

Tanga 27,60% 74,64% 20,24% 4

Yanbal 27,60% 74,64% 13,06% 4

Otras 27,60% 74,64% 12,82% 4

Atrix 44,00% 90,23% 0,83% 4

Avon 44,00% 90,23% 18,39% 4

Bonnie 44,00% 90,23% 3,85% 4

Clean & Clear 44,00% 90,23% 10,73% 4

Clinique 44,00% 90,23% 2,14% 4

Ebel 44,00% 90,23% 27,96% 4

Elizabeth Arden 44,00% 90,23% 2,80% 4

Eucerin 44,00% 90,23% 1,28% 4

Helena Rubinstein 44,00% 90,23% 0,88% 4

L Oréal 44,00% 90,23% 1,36% 4

Lancôme 44,00% 90,23% 1,41% 4

Neko 44,00% 90,23% 19,29% 4

Neutrogena 44,00% 90,23% 2,37% 4

Nivea Visage 44,00% 90,23% 6,02% 4

PH 5.5 44,00% 90,23% 1,13% 4

Ponds 44,00% 90,23% 28,46% 4

Revlon 44,00% 90,23% 0,73% 4

Sensitiva 44,00% 90,23% 1,34% 4

St. Ives 44,00% 90,23% 1,74% 4

Yanbal 44,00% 90,23% 11,34% 4

Yardley 44,00% 90,23% 1,21% 4

Productos para Limpieza Facial

Otras 44,00% 90,23% 6,40% 4

Aquamarine 30,10% 88,04% 2,83% 4

Avon 30,10% 88,04% 19,32% 4

Bonnie 30,10% 88,04% 3,66% 4

Clean & Clear 30,10% 88,04% 4,98% 4

Clinique 30,10% 88,04% 1,58% 4

Ebel 30,10% 88,04% 31,09% 4

Elizabeth Arden 30,10% 88,04% 1,89% 4

Eucerin 30,10% 88,04% 1,74% 4

Lancôme 30,10% 88,04% 1,62% 4

L Oréal 30,10% 88,04% 1,81% 4

Neutrogena 30,10% 88,04% 2,11% 4

Nivea Soft 30,10% 88,04% 3,36% 4

Nivea Visage 30,10% 88,04% 5,55% 4

PH 5.5 30,10% 88,04% 2,94% 4

Ponds 30,10% 88,04% 35,74% 4

Rosa Mosqueta 30,10% 88,04% 1,77% 4

St. Ives 30,10% 88,04% 1,62% 4

Vasenol 30,10% 88,04% 7,47% 4

Yanbal 30,10% 88,04% 12,91% 4

Productos Faciales Hidratantes

Yardley 30,10% 88,04% 0,94% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

121

Otras 30,10% 88,04% 3,89% 4

Acid Mantle 67,60% 92,46% 7,20% 4

Aquamarine 67,60% 92,46% 3,44% 4

Avon 67,60% 92,46% 16,16% 4

Bonnie 67,60% 92,46% 8,66% 4

Dove 67,60% 92,46% 4,27% 4

Ebel 67,60% 92,46% 26,24% 4

Hinds 67,60% 92,46% 1,60% 4

Jean Naté 67,60% 92,46% 0,78% 4

Johnsons Baby 67,60% 92,46% 8,10% 4

Johnsons Body Milk 67,60% 92,46% 3,84% 4

Lubriderm 67,60% 92,46% 19,20% 4

Neutrogena 67,60% 92,46% 1,70% 4

Nivea Creme 67,60% 92,46% 6,29% 4

Nivea Body Milk 67,60% 92,46% 3,36% 4

PH 5.5 67,60% 92,46% 0,70% 4

St. Ives 67,60% 92,46% 0,93% 4

Suavisol 67,60% 92,46% 1,71% 4

Vasenol 67,60% 92,46% 15,31% 4

Yanbal 67,60% 92,46% 11,20% 4

Yardley 67,60% 92,46% 1,47% 4

Cremas para Manos y Cuerpo

Otras 67,60% 92,46% 4,45% 4

Confiamor 27,20% 76,84% 5,02% 4

Durex 27,20% 76,84% 6,70% 4

Jontex 27,20% 76,84% 2,82% 4

Orquídea 27,20% 76,84% 6,79% 4

Panty Condón 27,20% 76,84% 0,96% 4

Piel 27,20% 76,84% 4,16% 4

Preventor 27,20% 76,84% 6,12% 4

Rosetex 27,20% 76,84% 4,35% 4

Royaltex 27,20% 76,84% 1,24% 4

Sanamed Duo 27,20% 76,84% 35,12% 4

Tahití 27,20% 76,84% 5,17% 4

Today 27,20% 76,84% 53,11% 4

Trojan 27,20% 76,84% 1,58% 4

Unique 27,20% 76,84% 1,82% 4

Condones

Otras 27,20% 76,84% 2,68% 4

Angel Face 31,90% 88,71% 30,00% 4

Avon 31,90% 88,71% 14,31% 4

Bardot 31,90% 88,71% 4,49% 4

Bonnie 31,90% 88,71% 2,44% 4

Dyclass 31,90% 88,71% 1,87% 4

Ebel 31,90% 88,71% 21,38% 4

Elizabeth Arden 31,90% 88,71% 1,70% 4

Helena Rubinstein 31,90% 88,71% 0,85% 4 Higiene Personal Femenina

Polvos y Base Facial

Jolie de Vogue 31,90% 88,71% 11,06% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

122

Max Factor 31,90% 88,71% 7,77% 4

Maybelline 31,90% 88,71% 1,20% 4

Mon Rêve 31,90% 88,71% 5,05% 4

Only You 31,90% 88,71% 1,38% 4

Revlon 31,90% 88,71% 3,00% 4

Smart 31,90% 88,71% 4,28% 4

Yanbal 31,90% 88,71% 9,68% 4

Yardley 31,90% 88,71% 0,78% 4

Otras 31,90% 88,71% 7,21% 4

Avon 15,70% 82,80% 21,77% 4

Bardot 15,70% 82,80% 7,38% 4

Dyclass 15,70% 82,80% 3,54% 4

Ebel 15,70% 82,80% 32,92% 4

Elizabeth Arden 15,70% 82,80% 4,00% 4

Helena Rubinstein 15,70% 82,80% 2,23% 4

Jolie de Vogue 15,70% 82,80% 15,69% 4

L Oréal 15,70% 82,80% 2,38% 4

Max Factor 15,70% 82,80% 9,23% 4

Maybelline 15,70% 82,80% 1,62% 4

Mon Rêve 15,70% 82,80% 4,92% 4

Only You 15,70% 82,80% 2,77% 4

Revlon 15,70% 82,80% 4,62% 4

Yanbal 15,70% 82,80% 14,15% 4

Yardley 15,70% 82,80% 1,31% 4

Rubor

Otras 15,70% 82,80% 3,38% 4

Ana María 44,20% 92,08% 1,70% 4

Avon 44,20% 92,08% 14,50% 4

Bardot 44,20% 92,08% 13,46% 4

Dyclass 44,20% 92,08% 3,51% 4

Ebel 44,20% 92,08% 22,58% 4

Elizabeth Arden 44,20% 92,08% 1,38% 4

Estée Lauder 44,20% 92,08% 0,81% 4

Ghem 44,20% 92,08% 26,04% 4

Helena Rubinstein 44,20% 92,08% 0,61% 4

Jolie de Vogue 44,20% 92,08% 10,22% 4

L Oréal 44,20% 92,08% 2,16% 4

Masglo 44,20% 92,08% 21,13% 4

Max Factor 44,20% 92,08% 3,88% 4

Maybelline 44,20% 92,08% 2,04% 4

Mon Rêve 44,20% 92,08% 3,39% 4

Only You 44,20% 92,08% 0,88% 4

Revlon 44,20% 92,08% 5,04% 4

Smart 44,20% 92,08% 2,31% 4

Yanbal 44,20% 92,08% 10,37% 4

Yardley 44,20% 92,08% 1,70% 4

Esm

alte de Uñas

Otras 44,20% 92,08% 5,31% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

123

Ana María 34,90% 89,68% 1,31% 4

Avon 34,90% 89,68% 17,00% 4

Bardot 34,90% 89,68% 4,76% 4

Dyclass 34,90% 89,68% 3,87% 4

Ebel 34,90% 89,68% 38,02% 4

Elizabeth Arden 34,90% 89,68% 2,11% 4

Helena Rubinstein 34,90% 89,68% 0,42% 4

Jolie de Vogue 34,90% 89,68% 11,31% 4

L Oréal 34,90% 89,68% 1,57% 4

Max Factor 34,90% 89,68% 19,49% 4

Maybelline 34,90% 89,68% 5,21% 4

Mon Rêve 34,90% 89,68% 3,61% 4

Only You 34,90% 89,68% 1,25% 4

Revlon 34,90% 89,68% 3,35% 4

Yanbal 34,90% 89,68% 13,87% 4

Yardley 34,90% 89,68% 1,31% 4

Pestañina

Otras 34,90% 89,68% 3,26% 4

Ana María 35,30% 90,37% 2,45% 12

Avon 35,30% 90,37% 22,88% 12

Bardot 35,30% 90,37% 7,46% 12

Dyclass 35,30% 90,37% 4,39% 12

Ebel 35,30% 90,37% 45,45% 12

Elizabeth Arden 35,30% 90,37% 2,35% 12

Helena Rubinstein 35,30% 90,37% 0,88% 12

Jolie de Vogue 35,30% 90,37% 16,65% 12

L Oréal 35,30% 90,37% 2,19% 12

Max Factor 35,30% 90,37% 12,82% 12

Maybelline 35,30% 90,37% 2,88% 12

Mon Rêve 35,30% 90,37% 4,26% 12

Only You 35,30% 90,37% 1,63% 12

Revlon 35,30% 90,37% 2,95% 12

Smart 35,30% 90,37% 1,63% 12

Yanbal 35,30% 90,37% 14,39% 12

Yardley 35,30% 90,37% 1,16% 12

Sombras/Delineador/Lápiz para cejas

Otras 35,30% 90,37% 5,08% 12

Ana María 43,90% 90,89% 2,08% 8

Avon 43,90% 90,89% 24,39% 8

Bardot 43,90% 90,89% 6,37% 8

Chapstick 43,90% 90,89% 5,31% 8

Dyclass 43,90% 90,89% 4,26% 8

Ebel 43,90% 90,89% 45,11% 8

Elizabeth Arden 43,90% 90,89% 2,03% 8

Helena Rubinstein 43,90% 90,89% 0,98% 8

Jolie de Vogue 43,90% 90,89% 13,86% 8

L Oréal 43,90% 90,89% 2,31% 8

Labial/Colorete/B

rillo

Max Factor 43,90% 90,89% 7,69% 8

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

124

Maybelline 43,90% 90,89% 1,90% 8

Mon Rêve 43,90% 90,89% 3,16% 8

Only You 43,90% 90,89% 1,70% 8

Revlon 43,90% 90,89% 3,73% 8

Smart 43,90% 90,89% 1,98% 8

Wet Lips 43,90% 90,89% 2,21% 8

Yanbal 43,90% 90,89% 16,42% 8

Yardley 43,90% 90,89% 1,05% 8

Otras 43,90% 90,89% 5,29% 8

Kotex 8,33% 70,95% 20,98% 4

O.B. 8,33% 70,95% 62,94% 4

Playtex 8,33% 70,95% 4,57% 4

Tampax 8,33% 70,95% 23,69% 4 Tampones

Otras 8,33% 70,95% 1,18% 4

Carrefour 45,80% 93,89% 1,16% 4

Ellas 45,80% 93,89% 3,86% 4

Kotex 45,80% 93,89% 32,09% 4

Nosotras 45,80% 93,89% 67,21% 4

Stayfree 45,80% 93,89% 14,65% 4

Toallas Higienicas

Otras 45,80% 93,89% 1,42% 4

Carefree 33,60% 95,83% 36,02% 4

Carrefour 33,60% 95,83% 1,18% 4

Kotex 33,60% 95,83% 23,88% 4

Nosotras 33,60% 95,83% 54,35% 4 Protectores

Diarios

Otras 33,60% 95,83% 0,96% 4

Adidas 16,10% 84,47% 12,21% 4

Agua Brava 16,10% 84,47% 4,34% 4

Avon 16,10% 84,47% 13,31% 4

Benetton 16,10% 84,47% 2,72% 4

Brut 16,10% 84,47% 3,75% 4

Denim 16,10% 84,47% 3,90% 4

Ebel 16,10% 84,47% 27,21% 4

Gillette Series 16,10% 84,47% 17,43% 4

Gold 16,10% 84,47% 3,24% 4

Nivea for Men 16,10% 84,47% 5,96% 4

Old Spice 16,10% 84,47% 3,60% 4

Patrichs 16,10% 84,47% 1,99% 4

Yardley 16,10% 84,47% 4,04% 4

Yanbal 16,10% 84,47% 13,31% 4

Loción/Colonia para después de afeitarse

Otras 16,10% 84,47% 8,16% 4

Braun 0,83% 100,00% 21,69% 48

Norelco 0,83% 100,00% 7,23% 48

Panasonic 0,83% 100,00% 24,10% 48

Philips 0,83% 100,00% 30,12% 48

Remington 0,83% 100,00% 6,02% 48

Higiene Personal Masculina

Maquinas de Afeitar

Electricas

Otras 0,83% 100,00% 20,48% 48

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

125

Avon 95,40% 98,22% 5,17% 4

Body Soft 95,40% 98,22% 0,83% 4

Brisa 95,40% 98,22% 2,64% 4

Cafam 95,40% 98,22% 1,01% 4

Camay 95,40% 98,22% 8,39% 4

Caresse 95,40% 98,22% 0,59% 4

Colsubsidio 95,40% 98,22% 0,50% 4

Cristalino 95,40% 98,22% 13,66% 4

Deseo 95,40% 98,22% 1,05% 4

Dial 95,40% 98,22% 0,67% 4

Dorado 95,40% 98,22% 11,74% 4

Dove 95,40% 98,22% 9,11% 4

Fa 95,40% 98,22% 2,32% 4

Iguazú 95,40% 98,22% 1,11% 4

Johnsons Antibacterial 95,40% 98,22% 2,84% 4

Johnsons Baby 95,40% 98,22% 8,27% 4

Johnsons Body Milk 95,40% 98,22% 2,54% 4

Heno de Pravia 95,40% 98,22% 1,05% 4

Juno 95,40% 98,22% 3,17% 4

Lak 95,40% 98,22% 1,88% 4

Le Sancy 95,40% 98,22% 6,95% 4

Lemon 95,40% 98,22% 3,05% 4

Lux 95,40% 98,22% 14,73% 4

Manantial 95,40% 98,22% 2,64% 4

Mexsana 95,40% 98,22% 2,82% 4

Neko 95,40% 98,22% 9,14% 4

Neutrogena 95,40% 98,22% 0,52% 4

Nivea 95,40% 98,22% 1,16% 4

Palmolive Botanicals 95,40% 98,22% 7,03% 4

Palmolive Kids 95,40% 98,22% 1,41% 4

Palmolive Naturals 95,40% 98,22% 13,02% 4

Palmolive Vitamins 95,40% 98,22% 3,12% 4

Pétalos 95,40% 98,22% 1,74% 4

Ponds 95,40% 98,22% 1,17% 4

Protex 95,40% 98,22% 26,15% 4

Rexona 95,40% 98,22% 19,00% 4

Savon 95,40% 98,22% 1,40% 4

Sensus 95,40% 98,22% 1,90% 4

Spree 95,40% 98,22% 3,77% 4

Zest 95,40% 98,22% 0,44% 4

Jabones de Tocador en Barra

Otras 95,40% 98,22% 2,01% 4

Avon 23,50% 87,23% 12,73% 4

Baby Soft 23,50% 87,23% 5,61% 4

Bacterión 23,50% 87,23% 3,12% 4

Blumy 23,50% 87,23% 2,44% 4

Uso en el Hogar

Jabones de

Tocador Liquidos

Cristalino 23,50% 87,23% 17,85% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

126

Dove 23,50% 87,23% 12,54% 4

Fiammé 23,50% 87,23% 4,59% 4

Johnsons 23,50% 87,23% 14,05% 4

Lux 23,50% 87,23% 12,93% 4

Neutrogena 23,50% 87,23% 2,20% 4

Nivea 23,50% 87,23% 3,90% 4

Palmolive 23,50% 87,23% 18,88% 4

Ponds 23,50% 87,23% 4,83% 4

Protex 23,50% 87,23% 19,02% 4

St. Ives 23,50% 87,23% 1,17% 4

Otras 23,50% 87,23% 8,49% 4

Ajax Blanqueador 91,30% 94,74% 35,61% 4

Barechina 91,30% 94,74% 0,91% 4

Blancox 91,30% 94,74% 28,32% 4

Blanquísimo 91,30% 94,74% 2,51% 4

Cafam 91,30% 94,74% 0,88% 4

Carrefour 91,30% 94,74% 0,77% 4

Carulla 91,30% 94,74% 0,59% 4

Clorito 91,30% 94,74% 1,48% 4

Clorox 91,30% 94,74% 43,24% 4

Don Cloro 91,30% 94,74% 1,04% 4

Hipoclor 91,30% 94,74% 1,91% 4

Iguazú 91,30% 94,74% 0,87% 4

Indio 91,30% 94,74% 2,67% 4

La Joya 91,30% 94,74% 2,50% 4

LBD 91,30% 94,74% 1,12% 4

Límpido 91,30% 94,74% 17,69% 4

Patojito 91,30% 94,74% 4,69% 4

Blanqueadores/Cloro

Otras 91,30% 94,74% 1,86% 4

Carrefour 45,60% 86,40% 2,87% 4

Downy 45,60% 86,40% 1,52% 4

Exito 45,60% 86,40% 2,26% 4

Favor 45,60% 86,40% 1,42% 4

Felpy 45,60% 86,40% 4,26% 4

Mimosín 45,60% 86,40% 9,85% 4

Suavitel Soflán 45,60% 86,40% 76,65% 4

Woolite 45,60% 86,40% 8,27% 4

Suavizantes de Ropa

Otras 45,60% 86,40% 2,61% 4

Azul-K 98,20% 98,88% 6,13% 4

Barrigón Varela 98,20% 98,88% 9,39% 4

Blanco Azul 98,20% 98,88% 4,11% 4

Brisa 98,20% 98,88% 3,51% 4

Coco Varela 98,20% 98,88% 11,23% 4

Dersa 98,20% 98,88% 10,40% 4

Dex 98,20% 98,88% 0,89% 4

Detergentes y Jabones para

la Ropa

Elefante 98,20% 98,88% 7,97% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

127

Fab 98,20% 98,88% 21,32% 4

Fama 98,20% 98,88% 5,43% 4

Jines 98,20% 98,88% 0,73% 4

La Jirafa 98,20% 98,88% 2,34% 4

Nácar 98,20% 98,88% 0,50% 4

Oro 98,20% 98,88% 2,85% 4

Puro 98,20% 98,88% 15,76% 4

Reno 98,20% 98,88% 0,89% 4

Rey 98,20% 98,88% 32,44% 4

Super Riel 98,20% 98,88% 5,54% 4

Supremo 98,20% 98,88% 6,32% 4

Unico 98,20% 98,88% 3,49% 4

Vel Rosita 98,20% 98,88% 11,23% 4

Woolite 98,20% 98,88% 1,38% 4

Otras (jabones en barra) 98,20% 98,88% 2,04% 4

Ace 98,20% 98,88% 2,28% 4

Ariel 98,20% 98,88% 33,88% 4

As - Dersa 98,20% 98,88% 10,12% 4

Cafam 98,20% 98,88% 0,85% 4

Bold 98,20% 98,88% 3,65% 4

Fab Antibacterial 98,20% 98,88% 5,11% 4

Fab Total 98,20% 98,88% 29,04% 4

Gold 98,20% 98,88% 1,30% 4

Iguazú 98,20% 98,88% 1,15% 4

Lavomatic 98,20% 98,88% 5,49% 4

Patojito 98,20% 98,88% 0,69% 4

Rindex 98,20% 98,88% 15,14% 4

Tenax 98,20% 98,88% 0,88% 4

Top Milenio 98,20% 98,88% 5,10% 4

Otras (detergentes en polvo) 98,20% 98,88% 2,20% 4

Ariel (líquido) 98,20% 98,88% 3,93% 4

Coco Varela (líquido) 98,20% 98,88% 1,28% 4

Fab (líquido) 98,20% 98,88% 5,10% 4

Tal 98,20% 98,88% 0,70% 4

Vel Rosita (líquido) 98,20% 98,88% 4,79% 4

Woolite (líquido) 98,20% 98,88% 1,39% 4

Otras (detergentes líquidos) 98,20% 98,88% 0,83% 4

Ala 96,30% 97,30% 0,72% 4

Arraz 96,30% 97,30% 2,03% 4

Axión Crema 96,30% 97,30% 65,31% 4

Axión Líquido 96,30% 97,30% 4,38% 4

Béisbol 96,30% 97,30% 5,35% 4

Cafam 96,30% 97,30% 0,94% 4

Cristal 96,30% 97,30% 6,56% 4

Easy-Off 96,30% 97,30% 1,82% 4 Jabones para lavar Platos

Exito 96,30% 97,30% 1,34% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

128

Fassi 96,30% 97,30% 3,55% 4

Fresh 96,30% 97,30% 0,83% 4

Lava 96,30% 97,30% 8,06% 4

Los Cedros 96,30% 97,30% 0,90% 4

Los Pinos 96,30% 97,30% 0,79% 4

MEC 96,30% 97,30% 0,75% 4

Platox 96,30% 97,30% 3,15% 4

Tras 96,30% 97,30% 8,10% 4

Zaz 96,30% 97,30% 1,60% 4

Otras 96,30% 97,30% 4,34% 4

Atila 91,20% 96,05% 9,18% 4

Bon Bril 91,20% 96,05% 68,72% 4

Britex 91,20% 96,05% 1,91% 4

Cafam 91,20% 96,05% 1,07% 4

Colsubsidio 91,20% 96,05% 0,57% 4

Dora 91,20% 96,05% 0,73% 4

Eterna 91,20% 96,05% 2,57% 4

Exito 91,20% 96,05% 1,83% 4

Fregona 91,20% 96,05% 1,24% 4

Furia 91,20% 96,05% 2,25% 4

Piurex 91,20% 96,05% 1,15% 4

Sabra 91,20% 96,05% 31,74% 4

Scotch Brite 91,20% 96,05% 11,53% 4

Top 91,20% 96,05% 3,93% 4

Yes 91,20% 96,05% 1,18% 4

Zip 91,20% 96,05% 1,51% 4

Esponjas. Esponjillas y paños de Cocina

Otras 91,20% 96,05% 1,19% 4

Bonaire 46,30% 87,26% 28,96% 4

Bonaroma 46,30% 87,26% 7,38% 4

Finolor Béisbol 46,30% 87,26% 8,02% 4

Freshell 46,30% 87,26% 3,14% 4

Fruti Aroma 46,30% 87,26% 8,94% 4

Glade 46,30% 87,26% 19,33% 4

Haze 46,30% 87,26% 1,83% 4

La Catleya 46,30% 87,26% 11,19% 4

La Joya 46,30% 87,26% 13,89% 4

Lysol 46,30% 87,26% 2,25% 4

Neutralizer 46,30% 87,26% 1,63% 4

Oasis 46,30% 87,26% 2,33% 4

Sensaciones 46,30% 87,26% 4,80% 4

Tergo 46,30% 87,26% 1,58% 4

Wizard 46,30% 87,26% 5,42% 4

Ambientadores

Otras 46,30% 87,26% 7,35% 4

Cottonelle 98,50% 98,17% 0,82% 4

Familia 98,50% 98,17% 54,29% 4

Papel

Higienico

Joya 98,50% 98,17% 9,13% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

129

Kleenex 98,50% 98,17% 4,97% 4

Lilolá 98,50% 98,17% 1,16% 4

Mío 98,50% 98,17% 2,84% 4

Nube 98,50% 98,17% 1,71% 4

Popular 98,50% 98,17% 8,26% 4

Regio 98,50% 98,17% 2,70% 4

Rosal 98,50% 98,17% 6,64% 4

Scott 98,50% 98,17% 23,47% 4

Sedita 98,50% 98,17% 1,69% 4

Suave 98,50% 98,17% 4,37% 4

Super Suplex 98,50% 98,17% 15,62% 4

Otras 98,50% 98,17% 1,98% 4

Cafam 62,20% 94,53% 2,23% 4

Exito 62,20% 94,53% 1,82% 4

Familia 62,20% 94,53% 69,39% 4

Favorita 62,20% 94,53% 7,28% 4

Finex 62,20% 94,53% 1,46% 4

Hogar 62,20% 94,53% 5,87% 4

Iris 62,20% 94,53% 1,19% 4

Kleenex 62,20% 94,53% 5,02% 4

Popular 62,20% 94,53% 3,30% 4

Practisec 62,20% 94,53% 1,77% 4

Scott 62,20% 94,53% 14,22% 4

Suplex 62,20% 94,53% 8,21% 4

Sutil 62,20% 94,53% 1,21% 4

Servilletas

Otras 62,20% 94,53% 1,02% 4

Familia 32,00% 89,38% 48,95% 4

Kleenex 32,00% 89,38% 47,90% 4

Pétalo 32,00% 89,38% 10,73% 4

Scott 32,00% 89,38% 10,14% 4

Suave 32,00% 89,38% 6,08% 4

Pañuelos Faciales

Desechables

Otras 32,00% 89,38% 1,40% 4

Destello 20,50% 88,78% 9,07% 24

Karpex 20,50% 88,78% 4,23% 24

La Joya 20,50% 88,78% 50,82% 24

Madeira Búfalo 20,50% 88,78% 17,42% 24

Poliflor 20,50% 88,78% 14,07% 24

Pride 20,50% 88,78% 9,51% 24 Cera para Muebles

Otras 20,50% 88,78% 8,13% 24

Apolo 42,40% 93,16% 1,90% 4

Béisbol 42,40% 93,16% 34,18% 4

Búfalo 42,40% 93,16% 9,75% 4

Cobra 42,40% 93,16% 2,05% 4

Efro 42,40% 93,16% 6,33% 4

Emulsol 42,40% 93,16% 2,10% 4

Cera para Pisos

Escarlata 42,40% 93,16% 19,37% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

130

La Joya 42,40% 93,16% 12,84% 4

LBD 42,40% 93,16% 5,09% 4

Los Cedros 42,40% 93,16% 3,59% 4

Los Pinos 42,40% 93,16% 9,77% 4

Mansión 42,40% 93,16% 21,87% 4

Otras 42,40% 93,16% 3,01% 4

1-A 68,90% 96,52% 6,59% 4

Ajax Antibacterial 68,90% 96,52% 29,02% 4

Ajax Fiesta de Flores 68,90% 96,52% 18,20% 4

Alpino 68,90% 96,52% 2,68% 4

Bayclean 68,90% 96,52% 1,32% 4

Béisbol 68,90% 96,52% 6,14% 4

Bon Bril 68,90% 96,52% 8,53% 4

Bon Bril Multiusos 68,90% 96,52% 3,14% 4

Bonaroma 68,90% 96,52% 1,14% 4

Completo 68,90% 96,52% 2,00% 4

Creso 68,90% 96,52% 4,35% 4

Easy-Off (multiusos) 68,90% 96,52% 4,30% 4

Fabuloso 68,90% 96,52% 34,89% 4

Fraganti 68,90% 96,52% 2,35% 4

Iguazú 68,90% 96,52% 1,44% 4

La Joya 68,90% 96,52% 4,68% 4

LBD 68,90% 96,52% 2,95% 4

Patojito 68,90% 96,52% 2,65% 4

Pine-Sol 68,90% 96,52% 4,45% 4

Sanpic 68,90% 96,52% 22,71% 4

Destac 68,90% 96,52% 2,06% 4

Harpic 68,90% 96,52% 10,95% 4

Pato Purific 68,90% 96,52% 11,47% 4

Tergo 68,90% 96,52% 1,23% 4

Colsubsidio (para vidrios) 68,90% 96,52% 1,14% 4

Easy-Off (para vidrios) 68,90% 96,52% 15,34% 4

Limpiadores

Zip 68,90% 96,52% 10,80% 4

Familia Advance 35,50% 93,52% 17,59% 4

Familia Ultra 35,50% 93,52% 25,48% 4

Limpiogar 35,50% 93,52% 12,53% 4

Pétalo 35,50% 93,52% 9,67% 4

Practisec 35,50% 93,52% 14,73% 4

Scott Cocina 35,50% 93,52% 34,94% 4

Scott Duramax 35,50% 93,52% 7,98% 4

Toallas de Papel para Cocina

Otras 35,50% 93,52% 1,69% 4

Baygon 47,80% 82,64% 56,71% 4

Coopers 47,80% 82,64% 4,46% 4

Cupex 47,80% 82,64% 8,68% 4

Detil 47,80% 82,64% 3,75% 4 Insecticidas

Katori 47,80% 82,64% 3,65% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

131

Plagatox 47,80% 82,64% 2,35% 4

Raid 47,80% 82,64% 44,30% 4

Rodasol 47,80% 82,64% 5,39% 4

Otras 47,80% 82,64% 1,32% 4

Alpina Baby 20,50% 88,78% 9,29% 1

Enfamil 20,50% 88,78% 2,25% 1

Isomil 20,50% 88,78% 2,09% 1

Klim 20,50% 88,78% 63,19% 1

Nan 20,50% 88,78% 14,34% 1

Nestógeno 20,50% 88,78% 9,78% 1

Promil 20,50% 88,78% 4,84% 1

S-26 20,50% 88,78% 10,55% 1

Similac Advance 20,50% 88,78% 3,13% 1

Form

ulas Infantiles

Otras 20,50% 88,78% 4,07% 1

Agú Ebel 32,00% 92,81% 29,29% 4

Arru-rrú 32,00% 92,81% 7,88% 4

Baby Soft 32,00% 92,81% 13,97% 4

Johnsons Baby 32,00% 92,81% 48,48% 4

Johnsons Kids 32,00% 92,81% 8,55% 4

Muss Baby 32,00% 92,81% 2,86% 4

Palmolive Kids 32,00% 92,81% 4,98% 4 Champu para Bebes

Otras 32,00% 92,81% 3,50% 4

Baby Care 27,70% 90,61% 6,06% 4

Dove Baby 27,70% 90,61% 10,60% 4

Johnsons Baby 27,70% 90,61% 74,10% 4

Nivea 27,70% 90,61% 3,51% 4

Palmolive Kids 27,70% 90,61% 6,81% 4

Suave 27,70% 90,61% 5,14% 4 Jabon para Bebes

Otras 27,70% 90,61% 5,10% 4

Baby Quaker 21,60% 91,20% 21,62% 1

Cereales Maizena 21,60% 91,20% 17,51% 1

Cereales Nestlé 21,60% 91,20% 33,15% 1

Don Pacho 21,60% 91,20% 10,61% 1

Gerber (cereal) 21,60% 91,20% 15,63% 1

Harina de Plátano 21,60% 91,20% 13,86% 1

Maizena Baby 21,60% 91,20% 10,61% 1

Vita Plátano 21,60% 91,20% 12,64% 1

Otras (cereales) 21,60% 91,20% 2,49% 1

Alpina Baby 21,60% 91,20% 18,98% 1

Exito 21,60% 91,20% 2,69% 1

Fruco 21,60% 91,20% 18,93% 1

Gerber (compota) 21,60% 91,20% 26,09% 1

Heinz 21,60% 91,20% 12,13% 1

Respín 21,60% 91,20% 1,93% 1

San Jorge 21,60% 91,20% 13,55% 1

Para Bebés

Comida para Bebes

Otras (compotas) 21,60% 91,20% 0,91% 1

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

132

Baby Dreams 22,70% 81,94% 1,83% 1

Huggies Supreme 22,70% 81,94% 2,85% 1

Johnsons Baby 22,70% 81,94% 4,35% 1

Kimbies Ultratim 22,70% 81,94% 12,26% 1

Pampers 22,70% 81,94% 2,47% 1

Pequeñín Premium 22,70% 81,94% 15,22% 1

Pequeñín Premium Fases 22,70% 81,94% 7,85% 1

Pequeñín Ultra Absorbente 22,70% 81,94% 11,56% 1

Pequeñín Ultratrim 22,70% 81,94% 10,22% 1

Sequitos 22,70% 81,94% 14,30% 1

Velty 22,70% 81,94% 3,28% 1

Winny Barreras 22,70% 81,94% 5,22% 1

Winny Extrasec 22,70% 81,94% 10,43% 1

Winny Ultratrim 22,70% 81,94% 26,13% 1

Winny Ultratrim Gold 22,70% 81,94% 12,31% 1

Pañales Desechables

Otras 22,70% 81,94% 3,12% 1

Brasier/sostén 82,60% 100,00% 43,70% 48

Calzoncillos/boxers 82,60% 100,00% 40,68% 48

Camisas/blusas 82,60% 100,00% 55,57% 48

Camisetas 82,60% 100,00% 51,09% 48

Cinturones 82,60% 100,00% 17,68% 48

Corbatas 82,60% 100,00% 5,10% 48

Faldas 82,60% 100,00% 12,83% 48

Medias 82,60% 100,00% 50,24% 48

Medias veladas 82,60% 100,00% 15,74% 48

Pantalones 82,60% 100,00% 56,30% 48

Pantys/calzones 82,60% 100,00% 30,99% 48

Pijamas 82,60% 100,00% 21,07% 48

Ropa para hacer ejercicio 82,60% 100,00% 15,13% 48

Vestido de baño 82,60% 100,00% 11,53% 48

Prendas y Accesorios

Otras 82,60% 100,00% 2,68% 48

Adidas 63,50% 100,00% 24,09% 48

Aeroflex 63,50% 100,00% 10,13% 48

Azaleia 63,50% 100,00% 3,40% 48

Brahma 63,50% 100,00% 5,26% 48

Bubble Gummers 63,50% 100,00% 4,47% 48

Caprino 63,50% 100,00% 0,90% 48

Converse 63,50% 100,00% 4,17% 48

Fila 63,50% 100,00% 8,22% 48

Gambinelli 63,50% 100,00% 0,77% 48

Grulla 63,50% 100,00% 1,78% 48

Hevea 63,50% 100,00% 1,86% 48

Jovical 63,50% 100,00% 0,72% 48

Kelme 63,50% 100,00% 1,98% 48

LA Gear 63,50% 100,00% 1,28% 48

Articulos Personales

Calzado

New Balance 63,50% 100,00% 2,82% 48

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

133

Nike 63,50% 100,00% 17,17% 48

Puma 63,50% 100,00% 6,30% 48

Reebok 63,50% 100,00% 14,94% 48

Rockland 63,50% 100,00% 1,24% 48

Skechers 63,50% 100,00% 4,90% 48

Timberland 63,50% 100,00% 1,87% 48

Verlon 63,50% 100,00% 8,22% 48

Otras 63,50% 100,00% 19,37% 48

Cuadernos 71,00% 100,00% 79,30% 12

Esfero corriente 71,00% 100,00% 66,90% 12

Colores 71,00% 100,00% 43,66% 12

Lápices 71,00% 100,00% 65,77% 12

Resaltador 71,00% 100,00% 27,61% 12

Marcador 71,00% 100,00% 40,70% 12

Corrector 71,00% 100,00% 31,27% 12

Pegante en barra 71,00% 100,00% 27,04% 12

Pegante líquido 71,00% 100,00% 33,52% 12

Adhesivo instantáneo 71,00% 100,00% 9,76% 12

Utiles Escolares y de Oficina

Papeles finos 71,00% 100,00% 22,54% 12

Carros/camiones de juguete 35,40% 100,00% 27,77% 48

Bicicletas/triciclos/patinetas 35,40% 100,00% 25,23% 48

Carros a control remoto 35,40% 100,00% 12,29% 48

Electrodomésticos de juguete 35,40% 100,00% 5,42% 48

Juegos de mesa 35,40% 100,00% 16,44% 48

Juegos de pistas de carreras 35,40% 100,00% 7,26% 48

Juegos para armar 35,40% 100,00% 22,71% 48

Juguetes educativos 35,40% 100,00% 18,90% 48

Juguetes para niños en edad preescolar 35,40% 100,00% 14,46% 48

Juguetes/muñecos electrónicos 35,40% 100,00% 6,78% 48

Maquillaje/joyas para niñas 35,40% 100,00% 12,32% 48

Muñecas de colección 35,40% 100,00% 15,54% 48

Muñecos de acción 35,40% 100,00% 8,08% 48

Muñecos de bebés 35,40% 100,00% 17,94% 48

Muñecos de felpa 35,40% 100,00% 12,23% 48

Pelotas/balones 35,40% 100,00% 30,51% 48

Pistolas de juguete 35,40% 100,00% 3,98% 48

Robots 35,40% 100,00% 6,02% 48

Rompecabezas 35,40% 100,00% 20,82% 48

Utensilios de cocina/vajillas de juguete 35,40% 100,00% 14,01% 48

Juegos y Juguetes

Otros 35,40% 100,00% 4,72% 48

Actifed 78,50% 67,52% 1,34% 4

Adorem 78,50% 67,52% 18,49% 4

Afrín 78,50% 67,52% 2,13% 4

Aspirina Caliente 78,50% 67,52% 13,30% 4

Atac 78,50% 67,52% 2,09% 4

Remedios y Salud

Remedios para la

Gripa. Tos. Fiebre y

Dolor de Garganta

Bactrodine 78,50% 67,52% 1,64% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

134

Bisolvon 78,50% 67,52% 13,51% 4

Bronquisol 78,50% 67,52% 4,26% 4

Cheracol 78,50% 67,52% 1,15% 4

Clarityne 78,50% 67,52% 0,75% 4

Contac C 78,50% 67,52% 3,23% 4

Descongel 78,50% 67,52% 8,13% 4

Desenfriol 78,50% 67,52% 6,34% 4

Desenfriolito 78,50% 67,52% 6,25% 4

Dimetapp 78,50% 67,52% 4,89% 4

Docefal 78,50% 67,52% 2,42% 4

Docefalito 78,50% 67,52% 1,58% 4

Dolex Gripa 78,50% 67,52% 40,94% 4

Dristán Día 78,50% 67,52% 12,26% 4

Dristán Noche 78,50% 67,52% 16,96% 4

Dristán Triple Acción 78,50% 67,52% 17,02% 4

Dristán Ultra 78,50% 67,52% 14,17% 4

Dristancito 78,50% 67,52% 5,25% 4

Febrifen 78,50% 67,52% 2,19% 4

Formitrol 78,50% 67,52% 1,66% 4

Gripofen 78,50% 67,52% 2,23% 4

Gripol 78,50% 67,52% 0,77% 4

Isodine Bucofaríngeo 78,50% 67,52% 5,32% 4

Jarabe Vick 78,50% 67,52% 4,30% 4

Mebucaína 78,50% 67,52% 4,92% 4

Mucosina 78,50% 67,52% 2,64% 4

Noraver 78,50% 67,52% 5,57% 4

Noxpirín 78,50% 67,52% 13,66% 4

Pax Día 78,50% 67,52% 6,75% 4

Pax Noche 78,50% 67,52% 9,77% 4

Pax Max 78,50% 67,52% 2,49% 4

Pax Tos 78,50% 67,52% 2,75% 4

Robitussin 78,50% 67,52% 8,68% 4

Sinutab 78,50% 67,52% 5,60% 4

Vick Vaporub 78,50% 67,52% 14,94% 4

Vicks 78,50% 67,52% 9,53% 4

Otras 78,50% 67,52% 4,47% 4

Acdol 73,20% 77,60% 2,31% 4

Acetaminofen Genfar 73,20% 77,60% 16,23% 4

Acetaminofen MK 73,20% 77,60% 13,70% 4

Advil 73,20% 77,60% 37,85% 4

Advil Children 73,20% 77,60% 1,95% 4

Advil Fast Gel 73,20% 77,60% 2,10% 4

Asa MK 73,20% 77,60% 2,02% 4

Aspirina 73,20% 77,60% 27,64% 4

Aspirina Direkt 73,20% 77,60% 1,71% 4

Remedios para el Dolor/Analgésicos

Buscapina 73,20% 77,60% 14,47% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

135

Cafiaspirina 73,20% 77,60% 1,04% 4

Calmidol 73,20% 77,60% 13,13% 4

Calmidol Compuesto 73,20% 77,60% 5,02% 4

Colmen 73,20% 77,60% 1,30% 4

Dispirina 73,20% 77,60% 1,18% 4

Dol 73,20% 77,60% 3,05% 4

Dolex 73,20% 77,60% 38,73% 4

Dolofen 73,20% 77,60% 1,95% 4

Dolofen Forte 73,20% 77,60% 0,74% 4

Femen 73,20% 77,60% 1,13% 4

Focus 73,20% 77,60% 1,09% 4

Ibuprofeno Genfar 73,20% 77,60% 19,37% 4

Ibuprofeno MK 73,20% 77,60% 14,98% 4

Lumbal 73,20% 77,60% 1,02% 4

Mejoral 73,20% 77,60% 3,22% 4

Motrin 73,20% 77,60% 3,36% 4

Neosaldina 73,20% 77,60% 2,73% 4

Postan 73,20% 77,60% 8,08% 4

Sevedol 73,20% 77,60% 4,93% 4

Tylenol 73,20% 77,60% 1,25% 4

Otras 73,20% 77,60% 2,01% 4

Alka Seltzer 50,60% 64,82% 60,67% 4

Alka Seltzer Digest 50,60% 64,82% 10,21% 4

Citromel 50,60% 64,82% 1,89% 4

Colaxín 50,60% 64,82% 1,04% 4

Digel 50,60% 64,82% 1,62% 4

Ditopax 50,60% 64,82% 6,92% 4

Finigax 50,60% 64,82% 1,31% 4

Imodium 50,60% 64,82% 1,34% 4

Kaopectate 50,60% 64,82% 0,79% 4

Maalox 50,60% 64,82% 2,77% 4

Magnesia MK 50,60% 64,82% 3,38% 4

Magnesia Phillips 50,60% 64,82% 6,43% 4

Momentum 50,60% 64,82% 0,73% 4

Mylanta 50,60% 64,82% 19,24% 4

Pepsamar 50,60% 64,82% 5,03% 4

Sal Andrews 50,60% 64,82% 1,46% 4

Sal de Frutas Lúa 50,60% 64,82% 37,80% 4

Sennax 50,60% 64,82% 2,35% 4

Tums 50,60% 64,82% 3,90% 4

Remedios para el malestar estomacal

Otras 50,60% 64,82% 3,29% 4

Aldy 73,50% 91,84% 0,92% 4

Cabaña 73,50% 91,84% 4,19% 4

Castilla 73,50% 91,84% 5,75% 4

Deleyte 73,50% 91,84% 1,67% 4 Endulzantes

Doña Pura 73,50% 91,84% 4,30% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

136

Incauca 73,50% 91,84% 44,59% 4

Incauca Light 73,50% 91,84% 4,12% 4

Manuelita 73,50% 91,84% 37,48% 4

Manuelita Morena 73,50% 91,84% 14,34% 4

María Luisa 73,50% 91,84% 0,83% 4

Menocaína 73,50% 91,84% 0,19% 4

Menocal 73,50% 91,84% 1,11% 4

Morena Light 73,50% 91,84% 3,08% 4

Nutrasweet 73,50% 91,84% 1,02% 4

Providencia 73,50% 91,84% 3,56% 4

Riocauca 73,50% 91,84% 5,14% 4

Riocauca Morena 73,50% 91,84% 4,33% 4

Riopaila 73,50% 91,84% 7,91% 4

Riopaila Morena 73,50% 91,84% 3,85% 4

Sabro 73,50% 91,84% 2,55% 4

Splenda 73,50% 91,84% 0,31% 4

Sucaryl 73,50% 91,84% 1,30% 4

Otras 73,50% 91,84% 5,61% 4

Ben-Gay 25,90% 65,25% 13,91% 4

Caladril 25,90% 65,25% 26,51% 4

Canestén 25,90% 65,25% 21,24% 4

Dolorán 25,90% 65,25% 12,37% 4

Feldene 25,90% 65,25% 7,63% 4

Infrarub 25,90% 65,25% 2,84% 4

Parche León 25,90% 65,25% 11,42% 4

Pomada Verde 25,90% 65,25% 18,05% 4

Ungüento León 25,90% 65,25% 4,73% 4

Voltaren 25,90% 65,25% 14,67% 4

Yodosalil 25,90% 65,25% 19,23% 4

Ungüentos. Cremas y Parches Medicinales

Otras 25,90% 65,25% 8,28% 4

Berocca 45,10% 74,72% 1,48% 4

Biocalcium 45,10% 74,72% 2,76% 4

Calcibón 45,10% 74,72% 10,62% 4

Calcimed 45,10% 74,72% 1,31% 4

Calcio Plus MK 45,10% 74,72% 5,22% 4

Calduros 45,10% 74,72% 1,48% 4

Caltrate 45,10% 74,72% 10,98% 4

Cebión 45,10% 74,72% 27,69% 4

Centrum 45,10% 74,72% 12,61% 4

Centrum Jr. 45,10% 74,72% 3,00% 4

Centrum Silver 45,10% 74,72% 3,06% 4

Elíxir de Hierro JGB 45,10% 74,72% 2,55% 4

Emulsión de Scott 45,10% 74,72% 10,74% 4

Emulvit 45,10% 74,72% 2,46% 4

Enercal 45,10% 74,72% 1,87% 4

Vitaminas. Calcio y Suplementos

Ensure 45,10% 74,72% 5,43% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

137

Femibión 45,10% 74,72% 1,60% 4

Ginseng 45,10% 74,72% 2,40% 4

Kola Granulada JGB 45,10% 74,72% 24,72% 4

Lemovit 45,10% 74,72% 1,10% 4

Nashki 45,10% 74,72% 1,04% 4

Okey 45,10% 74,72% 1,63% 4

Osteocalcio 45,10% 74,72% 1,25% 4

Pharmaton 45,10% 74,72% 1,10% 4

Posture 45,10% 74,72% 1,16% 4

Redoxón 45,10% 74,72% 11,34% 4

Sundown 45,10% 74,72% 1,25% 4

Vita Calcio 45,10% 74,72% 5,85% 4

Vita Set 45,10% 74,72% 1,10% 4

Vitacebrina 45,10% 74,72% 7,03% 4

Vitafull 45,10% 74,72% 2,34% 4

Vitamina C Genfar 45,10% 74,72% 6,20% 4

Vitamina C MK 45,10% 74,72% 16,80% 4

Vitamina C La Santé 45,10% 74,72% 1,78% 4

Vita KH3 45,10% 74,72% 1,07% 4

Z-Bec 45,10% 74,72% 5,64% 4

Otras 45,10% 74,72% 11,42% 4

Alergias 36,20% 100,00% 30,66% 1

Artritis 36,20% 100,00% 6,74% 1

Asma 36,20% 100,00% 9,09% 1

Cáncer 36,20% 100,00% 2,40% 1

Colesterol 36,20% 100,00% 14,92% 1

Condiciones del corazón 36,20% 100,00% 6,05% 1

Diabetes 36,20% 100,00% 6,30% 1

Disfunción eréctil 36,20% 100,00% 0,41% 1

Gastroenteritis 36,20% 100,00% 6,91% 1

Infecciones 36,20% 100,00% 19,20% 1

Insomnio 36,20% 100,00% 5,30% 1

Migrañas 36,20% 100,00% 21,74% 1

Pérdida de cabello 36,20% 100,00% 4,23% 1

Tensión alta 36,20% 100,00% 18,48% 1

Variación en el estado de ánimo 36,20% 100,00% 7,82% 1

Medicinas con Prescripcion Medica

Otras 36,20% 100,00% 13,51% 1

Canamor 29,60% 88,51% 1,91% 4

Dog Chow (bolsa) 29,60% 88,51% 25,53% 4

Doggi 29,60% 88,51% 1,95% 4

Fiel 29,60% 88,51% 1,91% 4

Friskies Alpo 29,60% 88,51% 2,25% 4

Kanina 29,60% 88,51% 10,61% 4

Ladrina 29,60% 88,51% 17,02% 4

Lucky Bite 29,60% 88,51% 2,10% 4

Mascotas

Comida Perros y Gatos

Nutrecan 29,60% 88,51% 12,40% 4

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

138

Nutriss 29,60% 88,51% 5,69% 4

Pedigree (bolsa) 29,60% 88,51% 9,66% 4

Perrarina 29,60% 88,51% 1,37% 4

Proplan 29,60% 88,51% 1,87% 4

Purina Puppy Chow 29,60% 88,51% 16,83% 4

Ringo 29,60% 88,51% 7,02% 4

Sabueso 29,60% 88,51% 3,28% 4

Otras (en bolsa) 29,60% 88,51% 4,77% 4

Dog Chow (enlatada) 29,60% 88,51% 5,69% 4

Friskies Alpo (enlatada) 29,60% 88,51% 2,79% 4

Pedigree (enlatada) 29,60% 88,51% 6,68% 4

Otras (enlatadas) 29,60% 88,51% 0,92% 4

Casetes 58,10% 85,54% 24,35% 12

Casetes vírgenes 58,10% 85,54% 15,23% 12

CD musical 58,10% 85,54% 74,45% 12

CD Rom 58,10% 85,54% 9,36% 12

CD vírgen 58,10% 85,54% 16,84% 12

Libros 58,10% 85,54% 32,80% 12 Entretenimiento

Libros. Discos. Casetes y

CDs

Mini discs 58,10% 85,54% 2,86% 12

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

139

Anexo 4: El Modelo Experimental – Documentación

A continuación se presenta la documentación de la aplicación, en su versión 1.0 y mediante

el uso de las páginas JAVADOC automáticamente creadas por el lenguaje JAVA.

Interfaz

Class VentanaClientes public class VentanaClientes extends javax.swing.JFrame Title: Generador de Clientes G.S.C. Description: Generador de registros de clientes para el promedio de las Grandes Superficies Colombianas Copyright: Copyright (c) 2006 Company: Diego Francisco Martínez Quiñones Version: 1.0 Author: Diego Francisco Martínez Quiñones

Constructor Detail VentanaClientes public VentanaClientes() VentanaClientes: Constructor de la clase

Method Detail main public static void main(java.lang.String[] args) main es la función principal que ejecuta el sistema Parameters: args - String[] es el arreglo con los argumentos de entrada. Utilizada únicamente para línea de comandos.

jbInit private void jbInit() jbInit es una clase responsable de realizar los primeros procesamientos de la ventana que se va a crear Throws: Exception - si falla cualquier punto de la creación de la ventana.

botonGuardarEn_mouseClicked public void botonGuardarEn_mouseClicked(java.awt.event.MouseEvent e) botonGuardarEn_mouseClicked: método para manejar el evento de click en el ratón Parameters: e - MouseEvent evento del ratón.

PorcentajeReal_propertyChange public void PorcentajeReal_propertyChange(java.beans.PropertyChangeEvent evt) PorcentajeReal_propertyChange: método para conocer que hubo un evento de cambio en el porcentaje de datos reales. Parameters: evt - PropertyChangeEvent Evento de cambio en las propiedades.

PorcentajeReal_itemStateChanged

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

140

public void PorcentajeReal_itemStateChanged(java.awt.event.ItemEvent e) PorcentajeReal_propertyChange: método para conocer que hubo un evento de cambio en el porcentaje de datos reales. Parameters: e - ItemEvent Evento de cambio en el estado.

botonIniciar_mouseClicked public void botonIniciar_mouseClicked(java.awt.event.MouseEvent e) botonIniciar_mouseClicked: método que define el evento de dar inicio a la aplicación Parameters: e - MouseEvent con el evento de dar click en el botón de inicio.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

141

Generador

Class Controlador public class Controlador Title: Generador de Clientes G.S.C. Description: Generador de registros de clientes para el promedio de las Grandes Superficies Colombianas Copyright: Copyright (c) 2006 Company: Diego Francisco Martínez Quiñones Version: 1.0 Author: Diego Francisco Martínez Quiñones

Constructor Detail Controlador public Controlador(int numRegistros, int porcentajeAleatorio, java.lang.String pathArchivo, javax.swing.JFrame fmPpal) Controlador es el constructor de la clase y responsable de inicializar el proceso de funcionamiento de esta aplicación. Es el paso intermedio entre la interfaz y el modelo del mundo. Parameters: numRegistros - int con el número de registros que se van a crear porcentajeAleatorio - int con el (entero) que representa el porcentaje de valores aleatorios que se van a crear pathArchivo - String con el path completo al archivo que se va a crear. fmPpal - JFrame con la estructura de la ventana principal de esta aplicación.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

142

Generador

Class Generador public class Generador Title: Generador de Clientes G.S.C. Description: Generador de registros de clientes para el promedio de las Grandes Superficies Colombianas Copyright: Copyright (c) 2006 Company: Diego Francisco Martínez Quiñones Version: 1.0 Author: Diego Francisco Martínez Quiñones

Constructor Detail Generador public Generador(int aNumRegistros, int aPorcentajeAleatorio, javax.swing.ProgressMonitor aPm) Generador es el constructor principal de la clase y se encarga de iniciar todas las variables correctamente. Parameters: aNumRegistros - int con el numero total de registros que se van a pasar aPorcentajeAleatorio - int con el porcentaje (entero) de registros aleatorios que se van a generar aPm - ProgressMonitor Monitor que muestra la barra de progreso. Se debe pasar para que pueda ser utilizada por el modelo.

Method Detail generarDatos public boolean generarDatos(java.lang.String pathArchivo) generarDatos es la función principal, que se encarga de iniciar los procedimientos de generación de datos existentes en esta clase. Parameters: pathArchivo - String con el path completo del archivo que se va a utilizar Returns: boolean true si se pueden generar los datos, false en caso contrario.

crearClientes private void crearClientes() crearClientes es una función creada para generar la tabla de clientes y también los datos internos, utilizando los datos estadísticos de IBOPE contenidos tanto en esta clase como en la base de datos.

automatizadorClientes private java.lang.String automatizadorClientes() automatizadorClientes es una función que permite crear los datos de un cliente mediante el uso de estadísticas conocidas. Returns: String con los datos del cliente creado.

creadorNombre private java.lang.String creadorNombre(java.lang.String sexo, int tipo) creadorNombre es la clase responsable de crear nombres aleatoriamente, con base en el sexo y el tipo de nombre Parameters: sexo - String 'M' o 'F', correspondientes a los sexos. tipo - int 1 si es un nombre, o cualquier otro si es un apellido. Returns: String

creadorTablaRegistros private void creadorTablaRegistros(java.lang.String nomTabla)

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

143

creadorTablaRegistros es la función responsable de crear las dos tablas principales de esta aplicación, que corresponden a la de registros de clientes y la de registros para reglas de asociación Parameters: nomTabla - String con el nombre de la tabla que se va a crear.

trimCompleto private java.lang.String trimCompleto(java.lang.String aCadena, java.lang.String aCaracteres) trimCompleto es una función responsable de hacer de los datos con tipos de caracteres extraños, palabras sin tildes, signos u otros caracteres necesarios. Parameters: aCadena - String cadena que se va a modificar aCaracteres - String cadena con los caracteres que son inaceptables. Returns: String con la cadena modificada.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

144

Generador

Class GeneradorThread public class GeneradorThread extends java.lang.Thread Title: Generador de Clientes G.S.C. Description: Generador de registros de clientes para el promedio de las Grandes Superficies Colombianas Copyright: Copyright (c) 2006 Company: Diego Francisco Martínez Quiñones Version: 1.0 Author: Diego Francisco Martínez Quiñones

Constructor Detail GeneradorThread public GeneradorThread(java.lang.String aArchivo, int aNumRegistros, int aPorcentajeAleatorio, javax.swing.JFrame FramePpal) GeneradorThread es el constructor de esta clase. No existe constructor sin parámetros. Parameters: aArchivo - String con el nombre del archivo en que se va a guardar aNumRegistros - int con el número de registros que se van a procesar aPorcentajeAleatorio - int con el porcentaje de registros aleatorios que se van a utilizar FramePpal - JFrame con la pantalla principal para poder hacer manejo de la misma.

Method Detail run public void run() run es la implementación del método run de threads (hilos)

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

145

Generador

Class CreadorCSV public class CreadorCSV Title: Generador de Clientes G.S.C. Description: Generador de registros de clientes para el promedio de las Grandes Superficies Colombianas Copyright: Copyright (c) 2006 Company: Diego Francisco Martínez Quiñones Version: 1.0 Author: Diego Francisco Martínez Quiñones

Constructor Detail CreadorCSV public CreadorCSV(java.lang.String pathArchivo, javax.swing.ProgressMonitor aPm) CreadorCSV es el constructor de la clase Parameters: pathArchivo - String con el path completo al archivo que se va a guardar aPm - ProgressMonitor con el manejador de la barra de estado, para ser usada con el manejo de esta clase.

Method Detail abrirArchivo public void abrirArchivo() abrirArchivo es el método responsable de abrir el archivo en disco. Throws: FileNotFoundException - cuando el archivo no existe o no puede ser abierto o creado.

cerrarArchivo public void cerrarArchivo() cerrarArchivo es el método encargado de cerrar y soltar el archivo. Throws: FileNotFoundException - cuando el archivo no existe o no puede ser abierto o creado.

crearCSV public boolean crearCSV(int numRegistros) crearCSV es la función principal de esta clase, que genera el archivo separado por comas. Parameters: numRegistros - int es el número de registros que fueron creados y van a ser ingresados en el archivo. Returns: boolean true si se pudo realizar la creación del archivo, false de lo contrario.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

146

Generador

Class MersenneTwister public class MersenneTwister extends java.util.Random implements java.io.Serializable NOTA IMPORTANTE - DISCLAIMER Se Debe aclarar enfaticamente que esta clase NO fue diseñada o creada por Diego Francisco Martínez Quiñones. Por el contrario, fue tomada en su totalidad de documentos publicados por la Universidad de Maryland, Facultad de Ciencias de la Computación, creada por Sean Luke originalmente. Esta clase TIENE ESPECIFICAMENTE UNA LICENCIA DIFERENTE AL RESTO DE LA APLICACIÓN, siendo ésta BSD de libre uso. Se cumple con la misma al dejar claramente expuesta esta salvedad y las condiciones de licencia descritas seguidamente. La información completa, en inglés, se encuentra a continuación: MersenneTwister and MersenneTwisterFast Version 9, based on version MT199937(99/10/29) of the Mersenne Twister algorithm found at The Mersenne Twister Home Page, with the initialization improved using the new 2002/1/26 initialization algorithm By Sean Luke, October 2004. MersenneTwister is a drop-in subclass replacement for java.util.Random. It is properly synchronized and can be used in a multithreaded environment. On modern VMs such as HotSpot, it is approximately 1/3 slower than java.util.Random. MersenneTwisterFast is not a subclass of java.util.Random. It has the same public methods as Random does, however, and it is algorithmically identical to MersenneTwister. MersenneTwisterFast has hard-code inlined all of its methods directly, and made all of them final (well, the ones of consequence anyway). Further, these methods are not synchronized, so the same MersenneTwisterFast instance cannot be shared by multiple threads. But all this helps MersenneTwisterFast achieve well over twice the speed of MersenneTwister. java.util.Random is about 1/3 slower than MersenneTwisterFast. About the Mersenne Twister This is a Java version of the C-program for MT19937: Integer version. The MT19937 algorithm was created by Makoto Matsumoto and Takuji Nishimura, who ask: "When you use this, send an email to: [email protected] with an appropriate reference to your work". Indicate that this is a translation of their algorithm into Java. Reference. Makato Matsumoto and Takuji Nishimura, "Mersenne Twister: A 623-Dimensionally Equidistributed Uniform Pseudo-Random Number Generator", ACM Transactions on Modeling and Computer Simulation, Vol. 8, No. 1, January 1998, pp 3--30. About this Version Changes Since V8: setSeed(int) was only using the first 28 bits of the seed; it should have been 32 bits. For small-number seeds the behavior is identical. Changes Since V7: A documentation error in MersenneTwisterFast (but not MersenneTwister) stated that nextDouble selects uniformly from the full-open interval [0,1]. It does not. nextDouble's contract is identical across MersenneTwisterFast, MersenneTwister, and java.util.Random, namely, selection in the half-open interval [0,1). That is, 1.0 should not be returned. A similar contract exists in nextFloat. Changes Since V6: License has changed from LGPL to BSD. New timing information to compare against java.util.Random. Recent versions of HotSpot have helped Random increase in speed to the point where it is faster than MersenneTwister but slower than MersenneTwisterFast (which should be the case, as it's a less complex algorithm but is synchronized). Changes Since V5: New empty constructor made to work the same as java.util.Random -- namely, it seeds based on the current time in milliseconds. Changes Since V4: New initialization algorithms. See (see <>http://www.math.keio.ac.jp/matumoto/MT2002/emt19937ar.html) The MersenneTwister code is based on standard MT19937 C/C++ code by Takuji Nishimura, with suggestions from Topher Cooper and Marc Rieffel, July 1997. The code was originally translated into Java by Michael Lecuyer, January 1999, and the original code is Copyright (c) 1999 by Michael Lecuyer. Java notes

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

147

This implementation implements the bug fixes made in Java 1.2's version of Random, which means it can be used with earlier versions of Java. See the JDK 1.2 java.util.Random documentation for further documentation on the random-number generation contracts made. Additionally, there's an undocumented bug in the JDK java.util.Random.nextBytes() method, which this code fixes. Just like java.util.Random, this generator accepts a long seed but doesn't use all of it. java.util.Random uses 48 bits. The Mersenne Twister instead uses 32 bits (int size). So it's best if your seed does not exceed the int range. MersenneTwister can be used reliably on JDK version 1.1.5 or above. Earlier Java versions have serious bugs in java.util.Random; only MersenneTwisterFast (and not MersenneTwister nor java.util.Random) should be used with them. License Copyright (c) 2003 by Sean Luke. Portions copyright (c) 1993 by Michael Lecuyer. All rights reserved. Redistribution and use in source and binary forms, with or without modification, are permitted provided that the following conditions are met: Redistributions of source code must retain the above copyright notice, this list of conditions and the following disclaimer. Redistributions in binary form must reproduce the above copyright notice, this list of conditions and the following disclaimer in the documentation and/or other materials provided with the distribution. Neither the name of the copyright owners, their employers, nor the names of its contributors may be used to endorse or promote products derived from this software without specific prior written permission. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE. Version: 8

Constructor Detail MersenneTwister public MersenneTwister() Constructor using the default seed.

MersenneTwister public MersenneTwister(long seed) Constructor using a given seed. Though you pass this seed in as a long, it's best to make sure it's actually an integer.

MersenneTwister public MersenneTwister(int[] array) Constructor using an array.

Method Detail setSeed public synchronized void setSeed(long seed) Initalize the pseudo random number generator. Don't pass in a long that's bigger than an int (Mersenne Twister only uses the first 32 bits for its seed).

setSeed public synchronized void setSeed(int[] array) An alternative, more complete, method of seeding the pseudo random number generator. array must be an array of 624 ints, and they can be any value as long as they're not *all* zero.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

148

next protected synchronized int next(int bits) Returns an integer with bits bits filled with a random number.

nextBoolean public boolean nextBoolean() This method is missing from jdk 1.0.x and below. JDK 1.1 includes this for us, but what the heck.

nextBoolean public boolean nextBoolean(float probability) This generates a coin flip with a probability probability of returning true, else returning false. probability must be between 0.0 and 1.0, inclusive. Not as precise a random real event as nextBoolean(double), but twice as fast. To explicitly use this, remember you may need to cast to float first.

nextBoolean public boolean nextBoolean(double probability) This generates a coin flip with a probability probability of returning true, else returning false. probability must be between 0.0 and 1.0, inclusive.

nextInt public int nextInt(int n) This method is missing from JDK 1.1 and below. JDK 1.2 includes this for us, but what the heck.

nextLong public long nextLong(long n) This method is for completness' sake. Returns a long drawn uniformly from 0 to n-1. Suffice it to say, n must be > 0, or an IllegalArgumentException is raised.

nextDouble public double nextDouble() A bug fix for versions of JDK 1.1 and below. JDK 1.2 fixes this for us, but what the heck.

nextFloat public float nextFloat() A bug fix for versions of JDK 1.1 and below. JDK 1.2 fixes this for us, but what the heck.

nextBytes public void nextBytes(byte[] bytes) A bug fix for all versions of the JDK. The JDK appears to use all four bytes in an integer as independent byte values! Totally wrong. I've submitted a bug report.

nextChar public char nextChar() For completeness' sake, though it's not in java.util.Random.

nextShort public short nextShort() For completeness' sake, though it's not in java.util.Random.

nextByte public byte nextByte() For completeness' sake, though it's not in java.util.Random.

nextGaussian public synchronized double nextGaussian() A bug fix for all JDK code including 1.2. nextGaussian can theoretically ask for the log of 0 and divide it by 0! See Java bug http://developer.java.sun.com/developer/bugParade/bugs/4254501.html

main public static void main(java.lang.String[] args) Tests the code.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

149

Generador Class BDMain public class BDMain Title: Generador de Clientes G.S.C. Esta clase fue creada para LNA Nerwork Analyzer, Proyecto de grado para Ingeniería de Sistemas y Computación de la Universidad de Los Andes. Está protegida bajo licencia GPS y hace parte de este proyecto sin problemas de derechos de autor. Description: Generador de registros de clientes para el promedio de las Grandes Superficies Colombianas Copyright: Copyright (c) 2006 Company: Diego Francisco Martínez Quiñones Version: 1.0 Author: Diego Francisco Martínez Quiñones

Field Detail main protected static Generador.BDMain main Static atribute provided for creating this object ONLY ONCE.

Constructor Detail BDMain private BDMain() Main Constructor Throws: NullPointerException - if no possible reading of source data base ClassNotFoundException - if the archive driver.dln is not found (see further instructions in readme.txt for this issue IOException - if it is not possible to read the archive driver.dln SQLException - if there is a bad sql construction

Method Detail BDMainCreator public static Generador.BDMain BDMainCreator() This method is responsible of creating an instance of this object, in order to provide one single time (singleton) this instance. Returns: BDMain an instance of this object. Throws: NullPointerException - if no possible reading of source data base. ClassNotFoundException - if the archive driver.dln is not found (see further instructions in readme.txt for this issue). IOException - if it is not possible to read the archive driver.dln. SQLException - if there is a bad sql construction

crearPreparedStatement public int crearPreparedStatement(java.lang.String aCadena) Creates a new prepared statement for querying the database. Parameters: aCadena - String that contains the sql query as a String type Returns: integer with the prepared statement position in the array Throws: SQLException - if there is a bad sql construction

setInt public void setInt(int aPreparedStatementPos, int aParametro,

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

150

int aValor) Sets an integer (int) for a field in a prepared statement. Parameters: aPreparedStatementPos - int that contains the number describing the position of the required prepared statement. aParametro - int that contains the number of parameter to be changed in the prepared statement. aValor - int that contains the new int value for the prepared statement parameter. Throws: SQLException - if there is a bad sql construction.

setString public void setString(int aPreparedStatementPos, int aParametro, java.lang.String aValor) Sets a String for a field in a prepared statement. Parameters: aPreparedStatementPos - int that contains the number describing the position of the required prepared statement. aParametro - int that contains the number of parameter to be changed in the prepared statement. aValor - String that contains the new String value for the prepared statement parameter. Throws: SQLException - if there is a bad sql construction.

setDate public void setDate(int aPreparedStatementPos, int aParametro, java.sql.Date aValor) Sets a java.sql.Date type for a field in a prepared statement. Parameters: aPreparedStatementPos - int that contains the number describing the position of the required prepared statement. aParametro - int that contains the number of parameter to be changed in the prepared statement. aValor - java.sql.Date type that contains the new Date value for the prepared statement parameter. Throws: SQLException - if there is a bad sql construction.

nextRow public boolean nextRow(int aStatementNum) Given a result set, this method returns the next position of it. Parameters: aStatementNum - in thtat contains the corresponding set of results from the result set array. Returns: boolean with the acceptance or rejection of the operation. Throws: SQLException - if there is a bad sql construction.

getInt public int getInt(int aStatementNum, int aPosicion) This method returns the content of a field queryed as an integer (int). Parameters: aStatementNum - int that contains the corresponding set of results from the result set array. aPosicion - int that contains the position in the query of the required int. Returns: int with the result. Throws: SQLException - if there is a bad sql construction.

getFloat public float getFloat(int aStatementNum, int aPosicion) This method returns the content of a field queryed as a float. Parameters: aStatementNum - int that contains the corresponding set of results from the result set array.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

151

aPosicion - int that contains the position in the query of the required int. Returns: float with the result. Throws: SQLException - if there is a bad sql construction.

getString public java.lang.String getString(int aStatementNum, int aPosicion) This method returns the content of a field queryed as a String. Parameters: aStatementNum - int that contains the corresponding set of results from the result set array. aPosicion - int that contains the position in the query of the required int. Returns: String with the result. Throws: SQLException - if there is a bad sql construction.

getDate public java.sql.Date getDate(int aStatementNum, int aPosicion) This method returns the content of a field queryed as a java.sql.Date type. Parameters: aStatementNum - int that contains the corresponding set of results from the result set array. aPosicion - int that contains the position in the query of the required int. Returns: java.sql.Date with the result. Throws: SQLException - if there is a bad sql construction

executeQueryStatement public int executeQueryStatement(java.lang.String aCadena) This method is designed for querying the database expecting a result from the query. Parameters: aCadena - String that contains the sql query. Returns: int with the position of the new set of results. Throws: SQLException - if there is a bad sql construction.

executeUpdateStatement public int executeUpdateStatement(java.lang.String aCadena) This method is designed for querying the database when NOT expecting a result from the query. Parameters: aCadena - String that contains the sql query. Returns: int with the data base default response for update statements. Throws: SQLException - if there is a bad sql construction.

executeQueryPrepared public int executeQueryPrepared(int aPreparedStatementPos) This method executes a query made through a prepared statement, when expecting a result from the query. Parameters: aPreparedStatementPos - int that contains the number describing the position of the required prepared statement. Returns: integer with the position of the set of results in the array. Throws: SQLException - if there is a bad sql construction.

executeUpdatePrepared

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

152

public int executeUpdatePrepared(int aPreparedStatementPos) This method executes a query made through a prepared statement, when NOT expecting a result from the query. Parameters: aPreparedStatementPos - int that contains the number describing the position of the required prepared statement. Returns: int with the data base default response for update statements. Throws: SQLException - if there is a bad sql construction.

openAll private void openAll() This method is designed for opening a connection with the database. Throws: ClassNotFoundException - if the driver isn't able to open the database. SQLException - if there is a problem connecting with the database.

setAutoCommitOff public void setAutoCommitOff() Method designed for disabling the autocommit option. Throws: SQLException - if there is a bad sql construction.

setAutoCommitOn public void setAutoCommitOn() Method designed for enabling the autocommit option. Throws: SQLException - if there is a bad sql construction

commit public void commit() Method designed for committing the data in the database. Throws: SQLException - if there is a bad sql construction.

rollback public void rollback() Method designed for trying a rollback in the database. Throws: SQLException - if there is a bad sql construction.

closeAll private void closeAll() Method designed for closing all connections opened to the database. Throws: SQLException - if there is a bad sql construction.

getConexion public java.sql.Connection getConexion() Method designed for returning the Connection corresponding to the available opened connection to the database. Returns: Connection which represents the Connection type that manages the database connections.

getStatement public java.sql.Statement getStatement() Method designed for returning the Statement responsible of dealing with the sql query statements. Returns: Statement which represents the Statement type that deals with the sql query statements.

getArrPreparedStatements public java.util.Vector getArrPreparedStatements() Method designed for returning the vector containing all the prepared statements available for querying the database. Returns:

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

153

Vector with the array of prepared statements.

getArrStatements public java.sql.Statement[] getArrStatements() Method designed for returning the vector containing all the Statements available from past queries to the database. Returns: Vector with the array of result sets.

getTipoBase public java.lang.String getTipoBase() Method designed for returning the database type (ex. Oracle, MySQL, etc.). Returns: String with the type of data base used (ex. Oracle, MySQL, etc.).

getClase public java.lang.String getClase() Method designed for returning the name of the database class container. Returns: String with driver path and name of class in the library

getDriver public java.lang.String getDriver() Method designed for returning the driver responsible of opening connections to the database. Returns: String with driver for the different data base types.

getUser public java.lang.String getUser() Method designed for retrieving the username of the database. Returns: String with username used for connecting to the data base.

getPassword public java.lang.String getPassword() Method designed for retrieving the password of the database. Returns: String with password used for connecting to the data base.

setConexion public void setConexion(java.sql.Connection aConexion) Method designed for setting a new connection type to the database. Parameters: aConexion - Connection type that contains the new Connection for the database.

setStatement public void setStatement(java.sql.Statement aStatement) Method designed for setting a new Statement for querying the database. Parameters: aStatement - Statement type contains the statement to manage the results. Throws: SQLException - if there is a bad sql construction.

setArrPreparedStatements public void setArrPreparedStatements(java.util.Vector aArrPreparedStatements) Method designed for setting a new Vector with prepared statements. Parameters: aArrPreparedStatements - Vector with the vector of prepared statements.

setTipoBase public void setTipoBase(java.lang.String aTipoBase) Method designed for setting a new data base type name. Parameters: aTipoBase - String contains the type of database to work with.

El Comportamiento de los Clientes en las Grandes Superficies Colombianas Diego Francisco Martínez Quiñones – Código 199821062 Facultad de Administración – Universidad de Los Andes

154

setClase public void setClase(java.lang.String aClase) Method designed for setting the corresponding class for opening a connection with the database. Parameters: aClase - String with the class name for opening the given database.

setDriver public void setDriver(java.lang.String aDriver) Method designed for setting a new driver for the database. Parameters: aDriver - String containing the driver information for connecting to the database.

setUser public void setUser(java.lang.String aUser) Method designed for setting a new database user. Parameters: aUser - String containing the user for opening the database connection.

setPassword public void setPassword(java.lang.String aPassword) Method designed for setting a new database password. Parameters: aPassword - String with the password that will allow to open the database connection.

eliminarStatement public void eliminarStatement(int aStatementNum) Method created for destroying a statement when it is not used any more. Parameters: aStatementNum - int with the number of position of the statement to destroy. Throws: SQLException - if the SQL construction is not correct, or if there is a bad or invalid command for the database NullPointerException - if the SQL construction exceeds the number of array statements available, or tries to access a wrong array position.