11 Segmentación

Algoritomo CHAID para la ralización de segmentaciones. Aunque no es una réplica del que tenía Bw7, sí que es una réplica del que tiene SPSS, lo cual nos garantiza trazabilidad en los cálculos. Chaid en SPSS no está en el módulo básico de trabajo.

source('functions.R')
data <- read_sav('chaid.sav')
bw8chaid(
  df = data,
  # variable dependiente
  dep_var = "Suscripcion", # Variable dependiente
  # indep_vars, variables independientes; numéricas o categoría (las codificadas 
  # las tratará como categorías sean categoría, ordinal o numérica)
  indep_vars = c("Edad", "Ingresos", "Genero", "Region", "Dispositivo", "Visitas_Mes", "Satisfaccion"), 
  id_var = "ID", # identificador del registro, obligatorio, validar valores únicos
  weight_var = "PESO", # variable numérica,
  # ordinal_vars de las variables independientes elegidas, cuáles quiere el usuario que agrupen de forma 
  # consecutiva sus categorías (suele pasar en las ordinales, por eso su nombre)
  ordinal_vars = c("Satisfaccion"), 
  multiway = TRUE, # TRUE / FALSE, si se soportan particiones múltiples (más de 2 grupos o no)
  min_bucket = 10, # valor que indica el minimo contenido de la partición, por debajo de ese valor se para, no considera la partición
  min_split = 20, # valor de nodo que permite partir, por debajo de este valor, parada
  max_depth = 6, # máxima profundidad de nodos
  alpha = 0.05, # nivel de significación (0.1, 0.05 -default-, 0.01)
  export_json = TRUE, # se produce exportación de nodo final de pertenencia 
  json_path = "chaid_nodos.json", #nombre / ruta del JSON creado
  publish = TRUE # publicación siempre TRUE
)

Segmentación (árboles de decisión)

Variable dependiente: Suscripcion | Tipo: Regresión (Continua)

Ponderación: PESO (redondeada a entero)

Resumen de nodos terminales

Árbol de segmentos