Diplomado modulo Data Mining - PowerPoint PPT Presentation

Loading...

PPT – Diplomado modulo Data Mining PowerPoint presentation | free to download - id: 7bd587-MDViZ



Loading


The Adobe Flash plugin is needed to view this content

Get the plugin now

View by Category
About This Presentation
Title:

Diplomado modulo Data Mining

Description:

Diplomado – PowerPoint PPT presentation

Number of Views:9
Avg rating:3.0/5.0
Slides: 49
Provided by: JosL168
Learn more at: http://www.colegiodariosalas.cl
Category:

less

Write a Comment
User Comments (0)
Transcript and Presenter's Notes

Title: Diplomado modulo Data Mining


1
Diplomado "Gestión de Negocios con Data Warehouse
y Data Mining". Clase 1 Introducción José
Antonio Lipari A.
2
Qué es Data Mining? Data Mining es el proceso
de exploración y análisis de grandes volúmenes de
datos, por medios automáticos, con el fin de
descubrir patrones y reglas. MDM Berry
Linoff
3
Qué es Data Mining? Es el proceso de extracción
de conocimiento útil y comprensible, previamente
desconocido desde grandes cantidades de datos
almacenados en distintos formatos. Witten
Frank
4
Grandes Cantidades de Datos
Extracción de conocimiento
Data Mining
Novedoso
Utilizable
5
Idea básica y potenciales de data mining
  • Empresas y organizaciones han almacenado mucha
    información para fines operacionales
  • Se sabe que hay mucho conocimiento valioso en la
    información acumulada
  • El conocimiento está escondido en los datos
  • Data mining encuentra y hace útil el conocimiento
    escondido en los datos

6
Motivaciones para Almacenar Datos
  • Razones iniciales
  • En telecomunicación
  • Facturación de llamadas
  • Potenciales usos
  • En telecomunicación
  • Detección de fraude
  • En supermercados
  • Gestión del inventario
  • En supermercados
  • Asociación de ventas
  • En bancos
  • Manejo de cuentas
  • En bancos
  • Segmentación de clientes
  • En producción
  • Control de procesos
  • En producción
  • Mantención preventivo

7
Aplicaciones de Data Mining
  • Customer Relationship Management (CRM)
  • Segmentación de clientes
  • Predicción de compra
  • Retención de clientes
  • Predicción de fuga
  • Detección de Fraude
  • Tarjetas de crédito
  • Uso de teléfonos (celulares)
  • Predicción de series de tiempo
  • Ventas en supermercados

8
Relevancia de Data Mining
9
Data Mining Versus Estadísticas
Estadísticas
Data Mining
Fuerte fundamento Matemático
Orientación a lo práctico
Herramientas nuevas
Herramientas Clásicas
Grandes volúmenes de datos
Volumen de datos Bajo (muestreo)
Entendible por cualquiera
Entendible sólo por estadísticos
10
Interacción con múltiples Disciplinas
Analogía con minería de extracción de minerales
11
Visualización Gráficos 3D Escalamiento
multidimensional
12
Estadísticas Regresiones lineales Métodos
Bayesianos
13
Optimización Programación lineal Programación no
lineal Algoritmos genéticos
14
Aprendizaje automático Redes neuronales
15
Computación paralela Procesamiento distribuido
16
Otros Creatividad Arte Lógica
17
  • Un Ejemplo Real
  • Data Mining en Entel PCS

18
Contexto Mercado de Telefonía Móvil
Distribución de operadores de telefonía móvil en
Chile
  • Mercado maduro
  • Esfuerzos por diferenciarse
  • Fuerte guerra de precio entre operadores

19
Contexto Mercado de Telefonía Móvil
Entel PCS tiene aproximadamente 3,5 millones de
clientes distribuidos en los mercados de
Suscripción y Prepago
20
Contexto Mercado de Telefonía Móvil
  • "Nosotros como empresa, tenemos sólo 2 opciones
    para tener una real ventaja competitiva
  • La habilidad de aprender más sobre nuestros
    clientes y más rápido que nuestros competidores
  • 2. La habilidad de transformar este aprendizaje
    en acciones para nuestros clientes, más rápido
    que nuestros competidores"
  • Jack Welch, CEO General Electric

21
  • Estrategia Gestión del Churn
  • (fuga de clientes)

22
Estrategia Gestión del Churn
Por qué Retener a los clientes?
Visión de Producto
Clientes leales son mas rentables puesto que
compran mas en el tiempo ya que están
satisfechos Costos de transacción disminuyen en
el tiempo, puesto que se vuelve rutina Clientes
leales tienden a recomendar a otros clientes
23
Estrategia Gestión del Churn
  • Objetivos
  • Reducir el Churn de clientes en todos los
    mercados
  • Foco en clientes de alto valor
  • Desarrollo de gestiones predictivas

24
Estrategia Gestión del Churn
25
  • Data Mining y Modelos
  • Predictivos de Churn

26
Oportunidad de gestión predictiva?
Entel PCS guarda información de los clientes que
se han fugado de la compañía
DATA MINING
CÓMO?
Entel PCS dispone de gran cantidad de información
sobre sus actuales clientes
27
DM y modelos Predictivos de Churn
DATA MINING
Información
Mejores decisiones de Negocio
28
DM y modelos Predictivos de Churn
Modelos de predicción de Churn
El objetivo de los modelos predictivos es
identificar un subgrupo (target) dentro de un
grupo mayor, donde los miembros del target son
aquellos con mayor propensión al Churn. Un modelo
realiza un buen trabajo si la tasa de Churn en el
subgrupo target es mayor que el promedio de la
base. Lift es una medida de la capacidad
predictiva del modelo.
29
DM y modelos Predictivos de Churn
Base TOTAL 7/49 churners 14
30
DM y modelos Predictivos de Churn
ÁRBOL DE DECISIÓN
31
DM y modelos Predictivos de Churn
Medida de bondad del modelo y decisiones de
gestión, Lift de Modelo
Base Total 14 Churn
LIFT 55/14 LIFT3,9 Representa el número de
veces que aumentó la proporción de churners en la
base
32
Pilares del uso comercial de Data Mining (Según
experiencia Entel PCS)
33
Pilares del uso comercial de Data Mining
Árboles
Regresión
Redes N.
34
Pilares del uso comercial de Data Mining
35
Pilares del uso comercial de Data Mining
Calidad en los Datos
36
Pilares del uso comercial de Data Mining
Principales Orígenes de Datos
Datos
37
Pilares del uso comercial de Data Mining
Cuántos Datos son Suficiente?
  • En este caso, generalmente mas es mejor
  • La primera fase es cuantos datos hay
    disponibles
  • Muchas veces datos disponibles gt Datos
    Necesarios
  • Por lo tanto se debe agrupar
  • Población Objetivo
  • Límites de las Herramientas memoria, rapidez,
  • Es importante considerar la existencia de
    suficientes eventos de interés.

Datos
Gestión
Técnicas DM
38
Pilares del uso comercial de Data Mining
39
Pilares del uso comercial de Data Mining
Construcción Modelo
40
Pilares del uso comercial de Data Mining
Elección del horizonte temporal adecuado
Mes Skip Tiempo para ordenar, transformar y
procesar los datos. Tiempo para correr los
modelos. Tiempo para la gestión antes de la
decisión de churn
Datos
Técnicas DM
41
Pilares del uso comercial de Data Mining
Experiencias Modelación
  • Modelos Predictivos Ayudan a
  • Tomar decisiones de negocio más informadas.
  • Disminuir Incertidumbre
  • Optimizar uso de recursos
  • Perosi el Modelo no es correcto
  • Decisiones informadas peores a no informadas
  • DM en general ha tenido sentido en el
    contexto de identificar un subgrupo pequeño
    dentro de un grupo muy grande.
  • Si se va a gestionar la base completa, no tiene
    sentido un modelo.
  • Cuánto es un buen lift?
  • Depende de cada caso, del objetivo y de la
    calidad de los datos.
  • Una buena pregunta es Cuál es el mínimo lift
    requerido para que el proyecto sea rentable?

Datos
42
Pilares del uso comercial de Data Mining
Experiencias Modelación
  • Considerar todos los costos costos de las
    gestiones y costos de errores de predicción (caso
    Churn Involuntario)
  • Si no hay historia no hay modelos predictivos.
    No se puede predecir sin tener datos históricos.
    Recordar que DM busca patrones en el pasado que
    permitan identificar un comportamiento futuro.
  • El proceso de construcción de los modelos genera
    conocimiento relevante a la compañía.
  • Sin embargo, las relaciones predictivas
    encontradas no necesariamente son la causa de un
    comportamiento, sí una descripción del mismo.
  • P.ej. baja en tráfico no causa el churn.

Datos
Gestión
Técnicas DM
43
Pilares del uso comercial de Data Mining
Experiencias Modelación
  • DM no encuentra soluciones sin la guía y
    experiencia de la gente de negocios.
  • Es importante tener claro los objetivos de
    negocio antes de abordar un proyecto en DM.
  • El proceso de limpieza de datos, es relevante
    (más del 50 del tiempo del proyecto).
  • DM tiende a encontrar los datos con errores
    (missing).
  • El éxito del modelo depende más del proceso de
    modelación que de la técnica de DM.

Datos
44
Pilares del uso comercial de Data Mining
Experiencias Modelación
  • Algunos modelos predictivos han mantenido su
    capacidad predictiva, mostrándose más estables en
    el tiempo de lo esperado.
  • Las gestiones propuestas han permitido reducir
    el churn.
  • Las gestiones están siendo continuamente
    mejoradas para optimizar la oferta.

45
Pilares del uso comercial de Data Mining
46
Pilares del uso comercial de Data Mining
Experiencias Gestión
  • Primero agotar las gestiones reactivas de mayor
    eficiencia y resultado de corto plazo.
  • Los modelos predictivos son solamente una parte
    de una gestión predictiva
  • Los modelos por muy buenos que sean no resuelven
    el problema, solamente el Quiénes? Si no hay
    gestión no hay disminución del churn
  • Dentro del proceso de modelamiento se debe
    considerar las alternativas de gestión
  • Se requiere coordinación y compromiso en la
    entrega oportuna de datos, generación de las
    bases y despliegue de las gestiones. De otro modo
    los clientes target comienzan a churnear antes de
    ser gestionados

47
Pilares del uso comercial de Data Mining
Experiencias Gestión
  • Al gestionar preocuparse de mantener grupos de
    control para medir la capacidad de los modelos y
    gestiones. Analizar los resultados es fundamental
    y no siempre es sencillo.
  • En lo posible implantar un sistema que
    automatice la generación y análisis de las
    campañas. Hacerlo manualmente se torna
    ineficiente.
  • El Datamart generado es una herramienta
    complementaria, que puede ser muy útil para
    analizar la información existente y mejorar la
    gestión.
  • Data Mining apoya la generación de información
    que permita resolver los problemas desde la raíz.

Datos
Gstión
48
FIN
About PowerShow.com