IBM SPSS Statistics

IBM SPSS Statistics es una familia integrada de productos de software que permite recorrer todo el proceso analítico, desde la gestión y preparación de datos, análisis estadístico (descriptivos e inferenciales), reportes e implementación de los resultados obtenidos.

Ofrece un amplio rango de técnicas robustas y especializadas para realizar análisis estadísticos logrando mejores resultados en proyectos de investigación, aumentando el rendimiento en procesos de análisis de encuestas e incluso, mejorando la toma de decisiones para su negocio.

Cuenta con una interfaz muy amigable para el usuario, ayudas para entender técnicas estadísticas y asistentes para la selección y ejecución de cada procedimiento.

Permite trabajar con gran variedad de datos, lenguajes de programación externos y sistemas operativos. Cuenta con un ambiente cliente-servidor para potenciar su uso de grandes volúmenes de datos.

También, puede integrar rutinas de R desde SPSS o SPSS dentro de las rutinas de R.

Con este software podrá gestionar, analizar y acceder a cualquier tipo de datos, para realizar el análisis estadístico, tomar decisiones inteligentes y obtener mejores resultados. IBM SPSS Statistics pone a su alcance herramientas analíticas que le ayudarán a explotar fácilmente el poder de sus datos.

IBM SPSS Statistics Versión actual: 25

IBM SPSS Statistics 25 continúa incrementando el acceso a técnicas analíticas avanzadas a través de herramientas mejoradas, integración, resultados y simplicidad de uso.

 

Lo más destacado:

    • Estadísticas Bayesianas, un método alternativo de inferencia estadística.
    • Mayor integración con Microsoft Office.

 

Esta versión incluye además las siguientes mejoras:

  • Novedades en técnicas estadísticas avanzadas.
  • Modelado Geoespacial.
  • Mejoras en gráficos: vista previa, estilo y variable de filtro.
  • Editor de sintaxis con más herramientas de edición y escritura.
  • Ventajas de productividad adicionales: fusión mejorada, barras de herramientas simplificadas y personalizables.
  • Mejoras incrementales en el administrador de licencias.

IBM SPSS Statistics Base

El análisis de datos juega un rol vital al ayudar a las organizaciones a alcanzar sus objetivos. Con técnicas especializadas para mejorar el desempeño, Statistics Base permite obtener resultados precisos rápidamente e incrementar la productividad y la eficiencia. Proporciona herramientas para llevar a cabo el proceso analítico completo de la mejor forma.

Cuenta con procedimientos que facilitan el proceso de construcción de las bases a trabajar, ya que permite la importación de datos desde distintas fuentes, desarrollar de forma manual y automática la preparación de datos a partir del conocimiento de negocio, y tomar decisiones a partir de los resultados obtenidos mediante análisis de estadística descriptiva e inferencial.

Con su amigable interfaz gráfica flexible, que permite un amplio acceso a los datos, se obtienen resultados de manera rápida, eficiente y amigable, que se pueden exportar a diversas plataformas: Office, PDF, HTML y texto plano, para posteriormente distribuir los análisis dentro de la organización. Además, se pueden visualizar en varios dispositivos inteligentes de manera simultánea, lo que facilita la toma de decisiones en cualquier momento, en cualquier lugar.

Cada nueva versión busca incrementar las capacidades analíticas del software, y darle mayores facilidades al usuario para el procesamiento de información.

IBM SPSS Custom Tables

Custom Tables puede ser utilizado como una herramienta analítica para entender mejor sus datos y crear tablas que presenten sus resultados más efectivamente.

Genera reportes de alto nivel analítico de manera rápida, flexible e intuitiva, descubriendo información oculta y relevante dentro de los datos.  Con el módulo Custom Tables se puede estandarizar y visualizar de forma simple la interacción entre variables de diversos tipos, con lo cual se hace más fácil la generación de resúmenes de datos en diferentes estilos para distintas audiencias.

Puede, por ejemplo, añadir pruebas estadísticas descriptivas e inferenciales y posteriormente personalizar las tablas para que la audiencia pueda entender fácilmente la información reportada. Finalmente puede automatizar la generación de los reportes y distribuirlos dentro de la organización.

 

Vista previa de las tablas a medida que las construye

Custom Tables permite visualizar las tablas durante el proceso de creación, su interfaz intuitiva y gráfica se actualiza en tiempo real, con las capacidades de “drag and drop” y el panel de pre visualización, se puede controlar el aspecto de las tablas para construirlas de forma precisa y depurada en menor tiempo.

 

Personaliza tus tablas

Muestra la información de la forma que desea administrando el cuadro de diálogo de categorías en el módulo Custom Tables.

Hace las tablas más precisas de acuerdo a las necesidades, mediante la agrupación o exclusión de categorías. Puede mostrar o excluir categorías sin frecuencias para obtener resultados más claros y concisos. Crea totales y subtotales sin cambiar el archivo de datos, además, se pueden ordenar las categorías para obtener tablas más claras e informativas.

 

Profundiza en los análisis

Detecta áreas problemáticas concluyendo sobre resultados de pruebas de estadística inferencial, proporciona informes que permitan ahondar en la información y tomar decisiones más adecuadas. Utilizando las pruebas de inferencia estadística incluidas en Custom Tables, será posible comparar medias o proporciones para grupos demográficos, segmentos de clientes u otras variables categóricas. También puede tomar a los periodos de tiempo como una variable y así identificar tendencias o cambios en los datos.

 

Controla el resultado de tu tabla

Muchas características en Custom Tables ayudan a crear tablas con el aspecto deseado y en menos tiempo, se puede:

  • Añadir títulos y textos.
  • Usar expresiones de la tabla en títulos.
  • Usar la característica de IBM SPSS Statistics Base “Aspectos de Tabla™” y scripts para automatizar la tarea de dar formato a las tablas.

 

Comparte resultados más fácilmente con otros

Una vez obtenidos los resultados se necesita hacerlos disponibles para quienes los requieren. Custom Tables permite crear resultados como tablas pivote interactivas, esto mejora el flujo de trabajo ya que no deberá reconfigurar las tablas, incluso los que no poseen Statistics podrán generar los informes que requieran a partir de los resultados entregados, con la vista interactiva que genera el informe web de las nuevas versiones.

También exporta las tablas a Microsoft® Word, Excel® o PowerPoint®, en donde podrán ser modificados en el programa de destino y exportar a HTML entre otros formatos.

 

Ahorra tiempo y esfuerzo automatizando informes frecuentes

Custom tables es ideal para cualquier usuario que crea y actualiza informes de forma repetitiva, incluyendo a quienes trabajan en encuestas, investigación de mercados, ciencias sociales, análisis de bases de datos, marketing o investigación institucional.

Los informes que se crean regularmente con la misma estructura, se pueden automatizar para ser ejecutados en modo producción con Custom Tables. Cuando se crea una tabla, se registra cada acción como sintaxis de Custom Tables, esta sintaxis puede ser extraída y ejecutada. Con la sintaxis y automatización, el informe estará listo sin procesos tediosos y en una fracción de tiempo menor, así las tareas de actualización serán agiles, confiables y consistentes.

IBM SPSS Advanced Statistics

Frente a escenarios complejos, en donde las relaciones existentes entre los datos superan los análisis exploratorios y de correlaciones simples, es necesario aplicar técnicas y metodologías más robustas. Fundamenta la toma de decisión y comprende mejor los fenómenos que afectan a la organización utilizando análisis estadístico avanzado.

El módulo de Avanced Statistics provee de diferentes técnicas estadísticas para abordar los problemas de negocio, tales como la predicción de un evento con una probabilidad asociada (fuga, compra, fraude, etc.) o estudiar el tiempo transcurrido hasta un evento deseado, también permite segmentar el mercado.

Advanced Statistics cuenta con un potente conjunto de técnicas analíticas sofisticadas univariantes y multivariantes con aplicaciones en investigación médica, para analizar las tasas de supervivencia de pacientes, en manufactura y en la industria farmacéutica para la evaluación de procesos de producción, y para realizar informes sobre resultados de pruebas entre otros.

 

Modelos predictivos más precisos mientras se trabaja con una estructura de datos anidada

El procedimiento GLM incluido en este módulo, permite describir la relación entre una variable dependiente y un conjunto de variables independientes. El procedimiento de los modelos lineales mixtos mejora los modelos utilizados en el proceso GLM, pudiendo así analizar datos que muestran correlación y variabilidad no constante.

La flexibilidad del procedimiento permite formular una gran variedad de modelos, incluyendo modelos ANOVA de efectos fijos, diseño de modelos de efectos aleatorios, modelos de crecimiento lineal, análisis de medidas repetidas, análisis de medidas repetidas con una covariable dependiente del tiempo, entre otros. Entre los modelos se encuentran la regresión lineal, ANCOVA, MANOVA y MANCOVA.

GLM incluye también cuatro tipos de sumas de cuadrados, comparaciones por pares de medias marginales esperadas, tratamiento complejo de valores perdidos y la posibilidad de guardar las matrices diseñadas y los archivos de efectos.

 

Aplica modelos más sofisticados

Advanced Statistics se aplica cuando los datos no se ajusten a las hipótesis necesarias para técnicas más simples. Cuenta con análisis loglineal y loglineal jerárquico para modelar tablas de multientrada de datos de frecuencia. El análisis general loglineal facilita el análisis de las frecuencias de las observaciones que se subdividen en cada categoría de una tabulación cruzada o tabla de contingencia. Muestra una gran variedad de estadísticos y gráficos, y es posible guardar valores residuales y predictivos en un fichero de datos de trabajo.

 

Analiza datos históricos y la duración

Puede analizar el tiempo de vida o concepto de duración inmerso en los datos para comprender eventos como el fallo de un componente, muerte o supervivencia. Advanced Statistics incluye la regresión de Kaplan-Meier y la regresión de Cox, procesos robustos para desarrollar análisis de supervivencia. Se puede utilizar las estimaciones de Kaplan-Meier para calibrar el tiempo en que va a ocurrir un evento, y la regresión de Cox para llevar a cabo una regresión del modelo de riesgos proporcionales con el tiempo de respuesta o duración de la respuesta como variable dependiente. Estos procedimientos proporcionan un conjunto de técnicas flexibles y completas para el trabajo con datos censurados.

IBM SPSS Regression

Identifica y cuantifica fácilmente las relaciones existentes entre las variables de interés y aquellas que se consideren como predictoras. Determina modelos más precisos de riesgo, comerciales o de segmentación que permitirán adelantarse a las acciones del cliente o del mercado en general.

 

Clasifica los datos en grupos de forma sencilla

Utiliza la regresión logística binaria para pronosticar variables dicotómicas, como por ejemplo comprar o no comprar, votar o no votar. Este procedimiento ofrece numerosos métodos por pasos para seleccionar las variables explicativas que mejor pronostican la variable objetivo.

Se pueden pronosticar además variables objetivo con más de dos categorías, con la Regresión Logística Multinomial (MLR) no existe restricción sobre la variable objetivo para que sea solamente Sí/No, se puede modelar por ejemplo, qué factores predicen si un cliente comprará el producto A, B o C.

 

Controla tu modelo

Consigue un mayor control sobre tu modelo y la expresión del mismo con los procedimientos de regresión no lineal con restricciones y sin restricciones. Estos procedimientos proporcionan dos métodos para estimar los parámetros de los modelos no lineales, el algoritmo de Levenberg-Marquardt que analiza los modelos sin restricciones y el algoritmo de programación secuencial cuadrática que permite especificar restricciones en las estimaciones de parámetros, proporcionar su propia función de pérdida y obtener estimaciones de errores típicos.

 

Emplea procedimientos alternativos para el pronóstico                                

Cuando los datos no cumplen con los requisitos estadísticos del método de mínimos cuadrados ordinario, genera mejores estimaciones con el método de Mínimos Cuadrados Ponderados (WLS) o Mínimos Cuadrados en dos fases (2SLS).

 

Encuentra el mejor modelo

Utiliza los modelos probit y logit para analizar situaciones en las que se dispone de una respuesta dicotómica que se piensa puede estar influenciada por los niveles de algunas variables independientes. Estos modelos son particularmente adecuados para datos experimentales.

IBM SPSS Data Preparation

Data Preparation proporciona una herramienta de preparación de datos poderosa y flexible, la cual permitirá generar análisis en menor tiempo y busca incrementar la precisión de los pronósticos.  Ahorra tiempo en tareas que se pueden replicar y automatizar a voluntad, incorporando técnicas sofisticadas para manipulación, imputación y transformación de datos.

El módulo Data Preparation identifica fácilmente casos, variables y valores sospechosos o no válidos, analiza patrones de datos perdidos, resume distribuciones y trabaja con mayor precisión con algoritmos diseñados para atributos nominales.

 

Realiza comprobaciones de datos

Típicamente la validación de datos ha sido un proceso manual. Es posible generar un análisis de frecuencia de los datos, marcar lo que debe ser corregido y controlar que los identificadores de casos sean únicos, lo cual lleva mucho tiempo. Además, cada analista de la organización podría usar un método ligeramente diferente para realizar este proceso, con lo cual mantener la consistencia de un proyecto a otro puede resultar un reto.

Para no realizar los controles de datos manualmente utiliza el procedimiento de Validación de datos. Este procedimiento permite aplicar reglas para realizar comprobaciones de datos basadas en el nivel de medida de cada variable (categórica o continua) de forma automática. Con este conocimiento se puede determinar la validez de los datos y eliminar o corregir los casos sospechosos antes del análisis.

 

Encuentra rápidamente atípicos

Evita presentar resultados erróneos afectados por la existencia de valores extremos utilizando el procedimiento de Detección de Anomalías (Identificar Casos Atípicos). Este procedimiento busca casos inusuales basándose en las desviaciones de estos con respecto a casos similares, identificando las variables que explican tales desviaciones para cada caso.  Una vez que se han identificado los casos inusuales, pueden revisarlos y determinar si deben ser incluidos en el análisis.

 

Preparación previa del proceso de datos para la construcción del modelo

Con el fin de utilizar los algoritmos que están diseñados para atributos nominales, como Naïve Bayes o modelos logit entre otros, es necesario llevar sus variables de escala a rangos antes de la construcción del modelo, también para garantizar una correcta interpretación de resultados.

Con este procedimiento se puede seleccionar entre tres métodos de creación de rangos:

  • No supervisado: crea rangos con igual número de casos.
  • Supervisado: toma en cuenta la variable optimizadora para determinar los puntos de corte.
  • Enfoque Híbrido: combina los enfoques “Supervisado” y “No Supervisado”. Este método es especialmente útil si tiene una gran cantidad de valores distintos.

IBM SPSS Missing Values

Completa los datos para construir mejores modelos

Cuando se ignora o excluye valores perdidos incurre en el riesgo de encontrar resultados inválidos o irrelevantes. Emplea Missing Values para imputar los valores perdidos y extraer conclusiones válidas, este módulo es una herramienta fundamental para quienes se preocupan por la validez de los datos.

Examina fácilmente las bases desde diversos ángulos con informes de diagnóstico para descubrir patrones de datos omitidos, estudia los estadísticos de resumen e imputa los valores omitidos mediante algoritmos estadísticos.

Por ejemplo, se puede mejorar las preguntas en una encuesta que ha identificado como posiblemente confusas basándose en patrones de valores perdidos observados. Puede incluso determinar si los valores perdidos de una variable se relacionan con los valores perdidos de otra variable, es decir, puede descubrir si los encuestados que se saltan una pregunta sobre su salario se saltarán posiblemente también la pregunta sobre el nivel de educación. Utilice esta información para mejorar la calidad de sus encuestas en el futuro.

 

Determina si los datos omitidos presentan algún patrón de forma rápida y sencilla

Diagnostica rápidamente la existencia de un problema grave de datos perdidos empleando el informe sobre patrones de datos que proporciona una visión general de cada caso, y muestra el conjunto de variables que forman el patrón.

Este informe ayuda a determinar el alcance de los datos omitidos, proporcionando una instantánea de cada tipo de valor omitido, así como los valores extremos de cada caso. Utiliza pruebas estadísticas para averiguar si existen diferencias significativas entre quienes responden y quienes no lo hacen, para ayudar a decidir si los datos omitidos pueden causar problemas en el análisis.

 

Utiliza la imputación múltiple para reemplazar valores perdidos

En Missing Values, un nuevo procedimiento de imputación múltiple ayudará a comprender los patrones de datos perdidos en el conjunto de datos y permitirá reemplazarlos con estimaciones plausibles. Este módulo ofrece una imputación completa y automática que elige el método de imputación más adecuado basándose en las características de sus datos, también permite personalizar el modelo de imputación.

Durante su ejecución, se generan diversos conjuntos de datos completos (típicamente de tres a cinco), cada uno con un conjunto diferente de valores de reemplazo. Posteriormente, se puede personalizar la modelización de los conjuntos de datos individuales utilizando técnicas habituales como la regresión lineal, para producir una estimación paramétrica para cada conjunto de datos y de allí obtener las estimaciones finales, esto supone calcular las estadísticas inferenciales que consideran la variación dentro y entre las imputaciones.

 

Encuentra más resultados estadísticamente significativos

Sustituye los valores perdidos por estimaciones y aumenta la oportunidad de obtener resultados estadísticos significativos. Llega a conclusiones más válidas eliminando sesgos ocultos de los datos al reemplazar los valores omitidos por estimaciones, de modo que todos los grupos, hasta los de menor número de respuestas, estén representados en el análisis.

IBM SPSS Categories

Analiza grandes volúmenes de datos y de variables extrayendo solo aquellos factores relevantes a través de la reducción de dimensiones, creación de mapas perceptuales y asignación de pesos a las variables involucradas.

Con Categories se entiende qué características relacionan estrechamente a los consumidores con su producto o marca, determina la percepción que tienen los clientes de los productos en comparación con otros productos o de la competencia. Puede interpretar visualmente datos y ver cómo las filas y las columnas se relacionan en tablas grandes de frecuencias, puntuaciones o rangos.

 

Pronostica con variables categóricas objetivo y explicativas

Con Categories se puede aplicar una regresión cuando la variable objetivo y las variables predictoras son numéricas, ordinales o nominales. La capacidad de este módulo de realizar una regresión múltiple con escalamiento óptimo facilita la aplicación de una regresión con estos tipos de variables. Esto permitirá:

  • Trabajar y entender datos ordinales y nominales en procedimientos similares a la regresión convencional, componentes principales y correlación canónica.
  • Controlar la variabilidad de los coeficientes de la regresión categórica con las opciones Regresión Ridge, Lazo y Red elástica.

 

Convierte sus variables cualitativas en variables cuantitativas

Los procedimientos avanzados de escalamiento óptimo de Categories para cuantificar variables numéricas, nominales u ordinales, permiten acceder a un nuevo conjunto de operaciones estadísticas para realizar análisis sobre variables con niveles de medida mixtos, especialmente datos categóricos.

 

Descubre relaciones subyacentes gráficamente

  • Usa diagramas de doble y triple entrada para representar la relación entre los objetos (casos), categorías, y variables (conjuntos) en análisis de correlación.
  • Representa similitudes entre uno o dos grupos de objetos como distancias en mapas perceptuales.

Cualquiera que sea el tipo de categorías que se estudia, segmentos de mercado, diagnósticos médicos, etc., los procedimientos de escalamiento óptimo no se restringen a tablas de doble entrada, sitúa las relaciones entre las variables en un sistema de referencia más amplio. Se puede ver un mapa de los datos, no solo un informe estadístico.

Es posible realizar análisis de correspondencia simple y múltiple para evaluar numéricamente las similitudes entre dos o más variables nominales en los datos.

 

Procedimientos disponibles

Los siguientes procedimientos están disponibles para añadir significado a los análisis de datos:

  • Regresión categórica.
  • Análisis de correspondencias.
  • Escalamiento optimo:
    • Análisis de correspondencias múltiple.
    • Análisis de componentes principales categórico.
    • Correlación categórica no lineal.
  • Análisis de Escala (desplegamiento y escalamiento multidimensional).

IBM SPSS Decision Trees

Realiza modelos efectivos para determinar el comportamiento de los clientes de manera sencilla, intuitiva y fácil de interpretar.  Descubre en minutos complejas relaciones entre variables, sin necesidad de utilizar complejas técnicas estadísticas.

El módulo Decision Trees permitirá determinar los límites precisos de los intervalos en los niveles de cada variable que afecte la toma de decisiones de los clientes, permitiendo identificar los umbrales o combinación de ellos a partir de los cuales el mercado reacciona para perfilar la base de clientes y basar su estrategia comercial en criterios diferenciados y accionables.

La representación visual de los árboles permite explicarlos más claramente ante audiencias no técnicas, explorar sus resultados y determinar visualmente cómo trabaja el modelo. También ayudan a encontrar subgrupos específicos, dado que los árboles de clasificación dividen los datos en ramas y nodos, se puede ver fácilmente cómo se dividen y dónde terminan los grupos.

 

Decision Trees en una variedad de aplicaciones

  • Data Base Marketing (marketing en bases de datos):
    – Elije la variable de respuesta para segmentar a los clientes (por ejemplo, los que responden o no en una prueba de mailing; perfiles de clientes según su nivel alto, medio y bajo de rentabilidad; o clientes que han continuado usando su servicio contra los que no).
    – Crea perfiles de grupos basados en atributos con información demográfica y respuestas previas.
    – Personaliza las promociones enfocándolas a subgrupos específicos para disminuir costes e incrementar el retorno en la inversión (ROI).
  • Investigación de mercados:

– Determina los niveles de satisfacción de los empleados o los clientes con las respuestas a preguntas de una encuesta.

– Determina cuéles son los factores que afectan a la satisfacción o elección de un producto.

  • Calificación del riesgo crediticio:
    – Determina los grupos de riesgo (alto, medio o bajo).
    – Perfila grupos de riesgo basados en la información de los clientes, por ejemplo, actividad en sus cuentas.
    – Ofrece la línea de crédito más apropiada para cada persona basándose en la información de las solicitudes.

 

Algoritmos de árboles de decisión

Decision Trees incluye cuatro algoritmos que permiten probar diferentes procedimientos para el crecimiento de árboles y determinar el mejor ajuste para los datos, construyen segmentos y perfiles en función de una variable resultado:

  • CHAID, algoritmo estadístico ágil y multivariado que explora datos rápida y eficientemente.
  • Exhaustive CHAID, modificación de CHAID que examina todas las posibles particiones de cada variable predictora.
  • Arboles de Clasificación y Regresión (C&RT), algoritmo de apertura binaria que produce subconjuntos homogéneos precisos.
  • QUEST, algoritmo estadístico insesgado que selecciona variables y construye árboles precisos de forma rápida y eficiente.

 

Mejora los análisis

Decision Trees se utiliza con la interfaz de Statistics Base, por lo cual, puede crear fácilmente árboles de clasificación y utilizar sus resultados para segmentar y agrupar casos directamente en los datos. Además, podrá generar reglas de selección o clasificación/predicción expresadas como sintaxis de IBM SPSS, o lenguaje SQL, desplegar estas reglas en el visor y guardarlas en un archivo externo para su uso posterior. Si desea utilizar los resultados para calificar nuevos datos, se puede escribir la información de modelo de los árboles directamente en los datos o en formato XML.

 

IBM SPSS Complex Samples

Aborda de manera precisa y simple problemas de alta complejidad estadística. Determina los valores de sus parámetros poblacionales (ingreso, edad, nivel de compras, etc.) tomando en cuenta el diseño estadístico de su muestreo.

Complex Samples proporciona todo lo necesario para realizar el trabajo con muestras complejas, ya que presenta un asistente de muestreo intuitivo que va guiando paso a paso en el proceso de diseño y elección de la muestra.  Se pueden realizar desde análisis estadísticos básicos como una tabla de frecuencias, hasta aplicar un modelo lineal general, regresión ordinal o logística para datos muestrales trabajados como poblacionales. Desde la etapa de planificación y muestreo hasta la etapa de análisis, Complex Samples permite obtener resultados precisos y fiables.

 

Alcanza resultados más fiables

Complex Samples permite desarrollar muestreo Estratificado, por conglomerados y polietápico. Puede evaluar el impacto de cada uno de estos diseños, y se pueden obtener resultados más precisos.

En la mayoría de los paquetes estadísticos, los datos se consideran como procedentes de un muestreo aleatorio simple, generalmente este muestreo no es efectivo en términos de coste para encuestas a gran escala por lo que se aplican otras metodologías. Analizando los datos muestrales con estadísticos convencionales y suponiendo este tipo de muestreo, existe un alto riesgo de obtener e interpretar resultados incorrectos básicamente por los errores estándar de los parámetros estimados. Complex Samples permite conseguir inferencias válidas a partir de muestras complejas porque incorpora el diseño muestral al análisis de encuestas, facilitando la comprensión de resultados.

 

Trabaja de forma sencilla y eficiente

A través de una interfaz intuitiva se pueden analizar los datos e interpretar los resultados. Cuando finaliza se puede publicar los resultados y la metodología de muestreo utilizada. El plan de muestreo que se construye con la herramienta registra las decisiones tomadas durante la elaboración del plan, este se puede almacenar y reutilizar, lo cual ahorra tiempo y aporta consistencia al proceso, ya sea para replicar los resultados o para continuar con un proyecto en desarrollo.

 

Complex Samples permite:

  • Lograr estimaciones puntuales correctas para estadísticos como totales, medias y razones.
  • Obtener los errores estándar correctos de esos estadísticos.
  • Generar intervalos de confianza y contrastes de hipótesis.
  • Predecir variables objetivo numéricas, ordinales y categóricas.
  • Predecir el tiempo en que ocurrirá un acontecimiento.

IBM SPSS Forecasting

Toma decisiones óptimas teniendo en cuenta el comportamiento histórico del mercado y las recurrencias o patrones que identifica. Realiza precisos pronósticos de los niveles de venta, evaluando predicciones sin necesidad de conocimientos avanzados de estadística o de series de tiempo, tomando en cuenta la demanda de mercado y las capacidades de la organización.

Los pronósticos ayudan a desarrollar y gestionar los planes que afectan a un gran número de áreas operativas, por lo que tienen un mayor impacto en los beneficios. Permiten a las organizaciones anticiparse a cambios estacionales, controlar el personal, el inventario y otros costes, en general gestionar de forma más precisa procesos de negocio que conduzcan a un mejor estado de la organización.

Trabajar con datos de series temporales puede resultar un reto, por lo cual, Forecasting dispone de las técnicas avanzadas que necesita junto con los métodos tradicionales de predicción. Su interfaz intuitiva permite que un usuario no experto en estadística pueda trabajar con esta herramienta.

Los nuevos usuarios que realicen pronósticos podrán crearlos de forma sofisticada, teniendo en cuenta diversas variables, y los usuarios expertos pueden utilizar Forecasting para validar sus modelos.

 

Modelos de series temporales con variables explicativas

Forecasting incluye modelado causal temporal, esta técnica intenta descubrir relaciones causales clave en datos de series temporales. Se especifica un conjunto de series como variables objetivo y un conjunto de entradas candidato para estos objetivos, el procedimiento crea un modelo para cada campo objetivo y solo incluye las entradas que tienen una relación causal con este. El enfoque difiere del modelado de serie temporal tradicional en donde hay que especificar explícitamente los predictores para una serie de objetivos.

 

Forecasting permite:

  • Graficar series para detectar componentes que definen su comportamiento.
  • Desarrollar modelos de suavizado exponencial.
  • Crear y aplicar modelos tradicionales (ARMA, ARIMA, SARIMA, …).
  • Desarrollar modelos de descomposición estacional.
  • Determinar si existe relación entre los errores de pronóstico para evaluar el modelo.

IBM SPSS Neural Networks

Aborda complejos problemas predictivos o analiza datos que no satisfacen las condiciones estadísticas para ser abordados con técnicas estadísticas clásicas, todo esto sin necesidad de avanzados conocimientos matemáticos o de los fenómenos a modelar.

Identifica y cuantifica fácilmente las relaciones existentes entre las variables de interés y aquellas consideradas como predictoras, generando precisos modelos de riesgo, comerciales o de segmentación pudiendo adelantarse a las acciones de los clientes o del mercado en general.

Se puede combinar Neural Networks con otros procedimientos estadísticos para obtener una visión clara en diversas áreas. En investigación de mercados, por ejemplo, crear perfiles de clientes y descubrir sus preferencias y en marketing, segmentar la base de clientes y optimizar las campañas. En análisis financiero, utilizar Neural Networks para analizar la capacidad de crédito de los clientes y detectar un posible fraude. Se puede utilizar en análisis operativo esta nueva herramienta para administrar el flujo de efectivo y mejorar la planeación logística. Las aplicaciones científicas y en el área de salud incluyen el pronóstico del coste de tratamientos, el análisis del desempeño médico y la predicción del tiempo de hospitalización de pacientes.

 

Controla el proceso desde el inicio hasta el final

Con Neural Networks se puede seleccionar el procedimiento Perceptrón Multicapa (MLP) o el procedimiento de Función Radial Básico (RBF).

Ambos procedimientos tienen técnicas supervisadas de aprendizaje y utilizan arquitecturas unidireccionales, esto significa que los datos se mueven exclusivamente en una sola dirección, desde los nodos de entrada a través de los nodos de las capas ocultas hasta los nodos de salida. La elección del procedimiento estará influenciada por el tipo de datos y el nivel de complejidad que se determina como usuario.

Mientras que el procedimiento MLP encuentra relaciones más complejas, el procedimiento RBF es en general más rápido. El usuario puede configurar el procedimiento eligiendo cómo hacer la partición de datos, la clase de arquitectura a utilizar y los recursos que se aplicarán al análisis. Finalmente, se puede elegir desplegar los resultados en tablas o gráficos, guardar las puntuaciones en la base de datos activa o exportar los modelos en archivos XML para calificar futuros datos.

Con cualquiera de estos procedimientos se puede dividir los datos en grupos de entrenamiento y validación, con los datos de entrenamiento se estiman los parámetros de la red y con el grupo de validación se previene el sobreajuste.

IBM SPSS Exact Tests

Analiza conjuntos de datos pequeños con mayor precisión

Exact Tests es particularmente útil si se realiza investigación mediante encuestas de tipo médico o social, bioestadística, investigación de mercados o realiza cualquier tipo de experimento.

Para determinar si existe una relación entre variables, los investigadores a menudo observan la significancia de los resultados en tablas cruzadas y pruebas no paramétricas, y los métodos tradicionales de cálculo son adecuados si sus datos cumplen con los supuestos subyacentes. Sin embargo, si cuenta con un pequeño número de variables con un alto porcentaje de respuesta en una categoría o los datos se subdividen en grupos reducidos, las pruebas tradicionales pueden ser incorrectas, Exact Tests trabaja sobre este problema.

 

Utiliza muestras pequeñas con credibilidad

Si asegurar una muestra grande es imposible o costoso, Exact Tests permite utilizar muestras pequeñas y aun así mantener la fiabilidad de resultados, dividir los datos en grupos tan pequeños como se desee, incrementando el aprendizaje con el análisis de los subgrupos. No estará limitado por frecuencias esperadas por celda para tener resultados correctos, y también se puede confiar en Exact Tests cuando esté investigando ocurrencias raras en grandes bases de datos.

 

Mantiene las categorías originales

No se pierde información valiosa agrupando categorías para satisfacer los requisitos de los contrastes de las pruebas tradicionales, con Exact Tests se puede mantener el diseño original o las categorías naturales, por ejemplo regiones, ingreso o grupos de edad y analizar lo que realmente pretende estudiar.

 

Interpreta y aplica fácilmente pruebas exactas

Exact Tests es de fácil ejecución, puede estimar los contrastes en cualquier momento solamente presionando un botón. No es necesario aprender nuevas teorías estadísticas o procedimientos para la interpretación de resultados, se interpretan de la misma forma en la que se interpretó los resultados para los análisis desarrollados en Statistics Base.

Cuenta con las pruebas estadísticas correctas para los datos disponibles, ya que hay más de 30 pruebas exactas que cubren el espectro de problemas de datos no paramétricos y categóricos para bases de datos pequeñas y grandes.

IBM SPSS Conjoint Analysis

Identifica cómo se valora cada atributo individual de sus productos y cómo afecta las preferencias de sus consumidores. Diseña esquemas de precios o paquetes de productos con base en el análisis conjunto, para obtener ventajas competitivas.

Con Conjoint Analysis es fácil medir el trade off entre diferentes atributos del producto entendidos como un conjunto, este módulo permite reproducir la forma en que los clientes toman decisiones comparando sus productos o servicios con los de la competencia. Con este conocimiento, la organización podrá entender las preferencias de sus clientes y diseñar productos que incluyan las características más importantes para su público objetivo, fijar precios basándose en el valor que el mercado asigna a los atributos del producto y realizar campañas de marketing que resalten los atributos más importantes para sus clientes.

Aun cuando los competidores, los productos y los precios cambian, se puede utilizar los resultados de Conjoint Analysis para desarrollar modelos de simulación de mercado que incorporen estos cambios, y otras propuestas para mejorarlos, lo cual permitirá predecir la respuesta a sus propuestas antes de invertir en el desarrollo de productos y programas de marketing.

 

Conjoint Analysis da respuestas a preguntas críticas:

  • ¿Cuál es la combinación de características que será más exitosa?
  • ¿Cuál es el segmento del mercado que está más interesado en un producto?
  • ¿Cuál es la campaña de marketing que resultará más atractiva para determinado segmento?
  • ¿Qué mejoras en un producto afectarán más las preferencias de los consumidores e incrementarán las ventas?
  • ¿Cuál es el precio ideal de un producto o servicio?
  • ¿Podemos incrementar los precios sin tener una pérdida significativa en las ventas?

 

Conjoint Analysis proporciona todas las herramientas necesitadas

Este módulo facilita la clasificación de características de productos. Se puede utilizar los procedimientos de Conjoint Analysis para:

  • Generar diseños fácilmente con el generador de diseños, produce un vector ortogonal de posibles productos alternativos que combinan las diferentes características de los productos con los niveles especificados.
  • Construir “tarjetas” para averiguar las preferencias de los encuestados, éstos las pueden ordenar con el fin de clasificar productos alternativos.
  • Analizar los resultados con una opción de Conjoint Analysis especialmente adaptada para desarrollar regresión. Se obtendrán resultados con los que se pueden cuantificar qué características del producto son las más relevantes y qué niveles son preferidos, también hacer simulaciones que indicarán la cuota de mercado de los productos alternativos.

IBM SPSS Direct Marketing

Este módulo está diseñado para segmentar mercados buscando maximizar las diferencias entre los grupos encontrados utilizando técnicas automáticas y semiautomáticas, sin perder de vista el objetivo de negocio.  Evalúa las respuestas a sus gestiones comerciales desde un punto vista multidimensional y cuantitativo, identificando rápidamente las principales variables que las mueven. Con este módulo se puede, además:

  • Identificar qué clientes tienen más posibilidades de responder a ofertas promocionales específicas.
  • Desarrollar estrategias de marketing para cada grupo de clientes.
  • Comparar la efectividad de las campañas por correo directo.
  • Aumentar los beneficios y reducir costes al enviar mensajes por correo únicamente a aquellos clientes con más posibilidades de responder.
  • Evitar que los mensajes enviados sean clasificados como correo spam al supervisar la frecuencia con la que se envían correos electrónicos a cada grupo de clientes.
  • Seleccionar posibles ubicaciones para comercios.

 

Funciones y ventajas

Aunque Direct Marketing permite aplicar análisis robustos, el usuario no necesita ser un experto en estadística o programación para usarlo. Su intuitiva interfaz guía en cada paso de los análisis, y el Asistente para nueva puntuación facilita la aplicación del modelo sobre nuevos datos. Después de ejecutar un análisis, los resultados se pueden interpretar fácilmente.

Direct Marketing incluye una combinación de procedimientos específicos que permiten que los expertos en marketing directo y bases de datos realicen actividades de análisis y preparación de datos.

 

Direct Marketing permite:

  • Generar puntuación RFM: este análisis genera una puntuación para cada uno de los clientes en función de su compra más reciente, la frecuencia y el valor monetario de sus compras.
  • Segmentar a los clientes o contactos, por medio de la creación de “conglomerados”.
  • Crear perfiles de los clientes o contactos identificando características compartidas para mejorar la orientación de las campañas y ofertas de marketing.
  • Identificar quiénes tienen más posibilidades de compra por medio de la construcción de puntuaciones de propensión para mejorar la intensidad y oportunidad de las campañas.
  • Probar paquetes de control, paquetes nuevos (de prueba) que mejoran el paquete (de control) existente.
  • Conocer el origen de las respuestas identificándolas por código postal.
  • Entender mejor a los clientes para mejorar las campañas de marketing mediante las técnicas y procedimientos disponibles en Direct Marketing.

Se puede trabajar estos puntos con el módulo Direct Marketing, o bien usarlo junto con otras aplicaciones de Statistics.

IBM SPSS Bootstrapping

Aborda de manera precisa y simple problemas de alta complejidad estadística, determina los parámetros de su población (ingreso, edad, nivel de compras, etc.) de manera robusta y consistente. Con este módulo se obtienen indicadores poblacionales más fiables que apoyarán en las distintas técnicas y tareas analíticas que se abordan habitualmente en los estudios.

Estima rápida y fácilmente la distribución de muestreo de un estimador, realizando de nuevo un muestreo sobre la muestra original, creando versiones alternativas del conjunto de datos para poder realizar análisis más precisos. Estima también errores e intervalos de confianza de un parámetro poblacional como la media, la mediana, la proporción, la razón de ventajas, el coeficiente de correlación y el coeficiente de regresión entre otros.  Así, Bootstrapping ofrece un método eficaz para asegurar que los modelos son estables y fiables.

 

Bootstrapping permite:

  • Repetir muestreos de forma rápida y sencilla.
  • Estimar la distribución de muestreo de un estimador de forma instantánea.
  • Reducir el impacto de los valores atípicos.
  • Calcular los errores estándares y los intervalos de confianza de los estimadores de forma correcta.
  • Asegurar la estabilidad y fiabilidad de los modelos.
  • Crear muestreos autodocimantes de muchos procedimientos analíticos.

El procedimiento está disponible para la ejecución al realizar análisis de estadística descriptiva e inferencial como es el análisis de frecuencias, explorar, pruebas de medias, tablas cruzadas y correlaciones. También para procedimientos más complejos como regresión lineal, logística, multinomial, ordinal, GLM, GENLIN, análisis discriminante, modelos lineales mixtos y regresión de Cox.

Es necesario disponer de los módulos Statistics Base, Regression y Advanced Statistics para aprovechar al máximo el uso de Bootstrapping.

IBM SPSS Statistics Server

Este software ofrece todas las opciones de análisis de Statistics Base con un performance más rápido. Puede incrementar la cantidad de los procesos analíticos a manejar, pasar de trabajar con un único departamento a trabajar con muchos más usuarios de la organización.

Statistics Server ofrece todas las características de Statistics, pero con un mayor rendimiento y acceso analítico personalizado para los usuarios empresariales. El procesamiento de datos y análisis utiliza los recursos de memoria del servidor, y el almacenamiento de datos también se centraliza por lo que no es necesario transferir los datos por la red. Así, se genera ahorro de tiempo y se incrementa la productividad.

También incrementa la seguridad, ya que también se pueden establecer estándares y contraseñas para los datos sensibles, y se puede encriptar la comunicación entre el usuario cliente y el server.

 

Puede manejar las funciones administrativas de los usuarios de forma más eficiente, con herramientas y opciones más avanzadas

Puede asignar prioridades de uso de recursos para usuarios de alta prioridad. También es posible desconectar Statistics cliente de la red cuando se realizan trabajos que requieren la memoria del servidor y trabajar sin comprometer la ejecución completa de un análisis o salida. Los archivos temporales, creados por el procedimiento ordenar dentro de Statistics Server, pueden ser comprimidos para ahorrar espacio en el disco.

 

Statistics Server permite, además:

  • Obtener mayor rendimiento analítico sobre todo para los conjuntos de datos más grandes distribuidos en tu organización.
  • Automatizar y planificar tareas repetitivas, entre las que se incluyen informes, preparación de datos y otros trabajos por lotes manejando Statistics desde una aplicación externa e implementando comandos de extensión en Java.
  • Mejorar la productividad de los analistas liberando los recursos de las máquinas de escritorio, de manera que las tareas analíticas se realicen en el servidor.

IBM SPSS Text Analytics for Surveys

El software Text Analytics for Surveys ayuda a obtener información a partir de respuestas de texto libre de forma más rápida y simple; incluso si los analistas no cuentan con experiencia previa en análisis de textos.

 

Sacar el máximo partido del texto de las encuestas

Los datos de encuesta sin estructurar pueden transformarse en datos cuantitativos, sin necesidad de leer las palabras de las respuestas una por una. Text Analytics for Surveys está diseñado específicamente para analizar el texto contenido en las preguntas de respuesta abierta en las encuestas y está basado en las potentes tecnologías de procesamiento del lenguaje natural (NLP).

Los usuarios de negocio podrán conocer las actitudes y opiniones de los clientes, para así poder satisfacer sus necesidades con mucha más rentabilidad y los analistas de encuestas pueden proporcionar informes con mayor valor, sin la enorme carga de trabajo y gastos asociados con la codificación manual.

 

Categorización rápida de las respuestas textuales

Text Analytics for Surveys automatiza el proceso de clasificación de las respuestas de texto de forma rápida y coherente, permitiendo también intervenir de forma manual para personalizar los resultados. En todo momento se dispone del control del proceso de categorización. La herramienta utiliza tecnologías lingüísticas que permiten analizar las ambigüedades naturales del lenguaje y descubrir patrones en las opiniones.

 

Text Analytics for Surveys permite:

  • Identificar los temas principales sin tener que leer cada palabra de las respuestas.
  • Distinguir fácilmente entre los comentarios positivos y negativos.
  • Categorizar o “codificar” respuestas de forma más coherente.
  • Crear categorías más rápidamente, y reutilizar categorías existentes en encuestas concurrentes o similares.
  • Utilizar bibliotecas disponibles de forma predeterminada en el sistema, específicas para analizar las encuestas de satisfacción del cliente.
  • Ahorrar costos al eliminar o reducir la dependencia de servicios externos.
  • Accionar sobre la satisfacción de los clientes de forma mucho más ágil a partir de la puntuación de sus respuestas.
  • Trabajar con textos de más de una docena de idiomas utilizando las nuevas funciones de traducción automatizada de Language Weaver.

IBM SPSS Amos

Construye de forma rápida, eficiente y ágil avanzados modelos de ecuaciones estructurales, que permitirán entender todas las combinaciones e interacciones de variables latentes y otras variables para explicar procesos de percepción y toma de decisiones de los clientes.  Identifica el peso de cada atributo, y al mismo tiempo determina la interacción que existe entre ellos, para saber cuáles son redundantes y cuáles son los más explicativos.

 

Confirma las relaciones complejas entre las variables de los modelos

Amos es un potente software de modelización de ecuaciones estructurales (SEM) el cual permite fundamentar y confirmar el estudio y teorías con ampliaciones de métodos estándar de análisis multivariante, incluyendo regresión, análisis de factores, correlación y análisis de varianza. Amos especifica, estima, estudia y presenta el modelo en un diagrama causal intuitivo para mostrar y evaluar las relaciones entre las variables.

Se puede construir rápidamente modelos de actitudes y comportamientos en Amos que reflejan realmente relaciones complejas. Cualquier variable numérica, observada o latente, puede utilizarse para pronosticar cualquier otra variable numérica. Amos incluye opciones estadísticas ampliadas, basadas en estimación Bayesiana.

 

Amos permite:

  • Mostrar la estimación de una variable objetivo con datos ordenados categóricamente y censurados. Esto permite crear modelos basados en información no numérica sin tener que asignar puntuaciones numéricas a los datos y trabajar correcta y fácilmente con información censurada.
  • Imputar valores numéricos para datos ordenados categóricamente y censurados. El conjunto de datos resultante se puede utilizar como input para los programas que requieran completa información numérica.
  • Estimar distribuciones a posteriori, para determinar los valores probables para datos perdidos en un modelo de variables latentes.
  • Analizar simultáneamente los datos de diferentes poblaciones ubicada en diferentes archivos.
  • Aumentar la fiabilidad de variables en los análisis incluyendo diversos indicadores.
  • Generar puntuaciones factoriales, con múltiples imputaciones.
  • Realizar estudios longitudinales, análisis de grupos múltiples y análisis de fiabilidad.
  • Evaluar modelos con diversas medidas de bondad de ajuste.

 

De la visualización del modelo en pantalla a la publicación de resultados de forma rápida

El enfoque de visualización interactiva de Amos se aproxima a la modelización de ecuaciones estructurales (SEM) para facilitar su aprendizaje y uso. En la interfaz de Amos se puede crear diagramas causales de los análisis utilizando herramientas de dibujo en vez de escribir ecuaciones o tecleando comandos.