lunes, 28 de abril de 2014

Software para el Analisis de Datos Cuantitativos



Software para el Análisis Cuantitativo




      Los paquetes de software para el análisis cuantitativo van desde los más simples hasta los más complicados, desde los generales hasta los especializados. Los software de hojas de cálculo son capaces de realizar la mayoría de los análisis cuantitativos y algunos procedimientos avanzados. Los programas de software para estadísticas, como los que se utilizan en las universidades, manejan un rango de procedimientos analíticos. Otros son especializados y manejan un tipo de análisis específico.

Función

El software para análisis cuantitativo se utiliza para analizar datos cuantitativos financieros y de otros tipos mediante el uso de procedimientos estadísticos.

Identificación

Para la mayoría de los usuarios generales, un programa de hojas de cálculo como el Excel de Microsoft es suficiente para realizar un análisis cuantitativo. El menú “Analysis ToolPak” que se encuentra bajo los add-ins en Excel permite que el programa pueda realizar una variedad de análisis estadísticos.

Características

Las aplicaciones adicionales como XLSTAT, que se pueden comprar y descargar en línea, incrementan las capacidades del Excel al permitirle realizar procedimientos analíticos más complejos.

Tipos

Existen tipos más avanzados de software cuantitativo. Los paquetes estadísticos como SAS y SPSS son populares entre las universidades y los investigadores profesionales. Otros programas de software se especializan en tipos específicos de análisis, como series de tiempo o análisis de contenidos.

Beneficios

Puedes acceder a una variedad de aplicaciones gratuitas de software para análisis cuantitativo en Internet, para descargar y usar.

Advertencia

La mayoría de los software de análisis cuantitativo, especialmente los programas avanzados de estadísticas, dan por sentado que el usuario tiene un cierto nivel de conocimiento sobre estadística.

Programas estadísticos más utilizados

      Existen multitud de paquetes informáticos aparte es éstos, tanto de software privado como de software libre, sin embargo, los más utilizados son estos. A pesar de que SAS y SPSS suelen ser considerados los más potentes, hay muchísimas empresas que utilizan programas mucho menos potentes como Excel. Esto se debe sobre todo a que su uso parece más sencillo, la mayoría de las personas están familiarizadas con él y la mayor parte de las empresas ya tienen instalado Excel en sus ordenadores, mientras que las licencias de SAS[1] y SPSS[2] cuestan varios miles de euros. Sin embargo, a nivel de investigación estadística se utilizan siempre paquetes estadísticos propiamente dichos ya que suelen tener una capacidad mucho mayor.

      SPSS es un programa estadístico informático muy usado en las ciencias sociales y las empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo de Statistical Package for the Social Sciences aunque también se ha referido como "Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no es acrónimo de nada.





  
 Beneficios

     Un programa SPSS permite a un usuario llevar a cabo el mismo procedimiento en repetidas ocasiones, sin tener que recordar los menús desplegables o los comandos que debe hacer clic y elegir con el fin de establecer la serie de los procedimientos necesarios. Esto ahorra tiempo al organizar y analizar los datos. Estos programas también pueden ser modificados para funcionar con diferentes modelos estadísticos, analizar diferentes variables o acceder a archivos de datos diferentes. Para ejecutar un programa, simplemente haz clic en la sintaxis y arrastra para resaltarlo. Después de esto, haz clic en el comando "execute" (ejecutar), una clave en forma de flecha en el menú de archivo de sintaxis.

     SPSS, es un poderoso sistema para realizar análisis estadísticos y gestión de información en un entorno gráfico, con ayuda de menús descriptivos y cajas de diálogo que solicitan información al usuario para realizar el trabajo más pesado. La mayoría de las tareas se pueden realizar simplemente dando clic, pero lo más importante es saber que es lo que realmente queremos que realice el sistema, de tal forma que nos ayude en el análisis de la información, del experimento y/o de la investigación. Como todos los programas en ambiente Windows, su manejo es hace fácil, accesible y eficiente, pero con un gran problema, ya que debido a la facilidad de uso y rapidez, proporciona mucha información que realmente no queremos o no sabemos analizar. Cuenta con una simple interfase para el análisis estadístico, proporciona opciones para desarrollar el trabajo en forma rápida y eficiente; debido a que se trabaja a través de ventanas especificas, editor de datos, para definir las variables, un visor o ventana de resultados, para analizarlos, mostrándolos o ocultándolos de forma selectiva. Tablas pivote multidimensionales, para : reorganizar filas, columnas y capas, permite dividir las tablas para mostrar un solo grupo
Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad para trabajar con grandes bases de datos y un sencillo interface para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar análisis con 2 millones de registros y 250.000 variables. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos. Cada uno de estos módulos se compra por separado.

       Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.
      Actualmente, compite no sólo con softwares licenciados como lo son SAS, MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas operativos como Linux, además de versiones para Windows y OS X. Este último paquete pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.

Módulos del SPSS

      El sistema de módulos de SPSS, como los de otros programas (similar al de algunos lenguajes de programación) provee toda una serie de capacidades adicionales a las existentes en el sistema base. Algunos de los módulos disponibles son:
  • Modelos de Regresión
  • Modelos Avanzados
    • Reducción de datos: Permite crear variables sintéticas a partir de variables colineales por medio del Análisis Factorial.
    • Clasificación: Permite realizar agrupaciones de observaciones o de variables (cluster analysis) mediante tres algoritmos distintos.
    • Pruebas no paramétricas: Permite realizar distintas pruebas estadísticas especializadas en distribuciones no normales.
  • Tablas: Permite al usuario dar un formato especial a las salidas de los datos para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los desarrolladores del software por dejar de lado el sistema original de TABLES para hacer uso más extensivo de las llamadas CUSTOM TABLES.
  • Tendencias
  • Categorías: Permite realizar análisis multivariados de variables normalmente categorías. También se pueden usar variables métricas siempre que se realice el proceso de recodificación adecuado de las mismas.
  • Análisis Conjunto: Permite realizar el análisis de datos recogidos para este tipo específico de pruebas estadísticas.
  • Mapas: Permite la representación geográfica de la información contenida en un fichero (descontinuado para SPSS 16).
  • Pruebas Exactas: permite realizar pruebas estadísticas en muestras pequeñas.
  • Análisis de Valores Perdidos: Regresión simple basada en imputaciones sobre los valores ausentes.
  • Muestras Complejas: permite trabajar para la creación de muestras estratificadas, por conglomerados u otros tipos de muestras.
  • SamplePower (cálculo de tamaños muestrales)
  • Árboles de Clasificación: Permite formular árboles de clasificación y/o decisión con lo cual se puede identificar la conformación de grupos y predecir la conducta de sus miembros.
  • Validación de Datos: Permite al usuario realizar revisiones lógicas de la información contenida en un fichero ".sav" y obtener reportes de los valores considerados atípicos. Es similar al uso de sintaxis o scripts para realizar revisiones de los ficheros. De la misma forma que estos mecanismos es posterior a la digitalización de los datos.
  • SPSS Programmability Extension (SPSS 14 en adelante). Permite utilizar el lenguaje de programación Python para un mejor control de diversos procesos dentro del programa que hasta ahora eran realizados principalmente mediante scripts (con el lenguaje SAX Basic). Existe también la posibilidad de usar las tecnologías .NET de Microsoft para hacer uso de las librerías del SPSS. Aunque algunos usuarios han cuestionado sobre la necesidad de incluir otros lenguajes, la empresa no tiene esto entre sus objetivos inmediatos.
      Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es un programa completo de la versión correspondiente pero limitada en su capacidad en cuanto al número de registros y variables que puede procesar. Esta versión es para fines de enseñanza del manejo del programa

Manejo

SPSS tiene un sistema de ficheros en el cual el principal son los archivos de datos (extensión. SAV). Aparte de este tipo existen otros dos tipos de uso frecuente:
  • Archivos de salida (output, extensión. SPO): en estos se despliega toda la información de manipulación de los datos que realizan los usuarios mediante las ventanas de comandos. Son susceptibles de ser exportados con varios formatos (originalmente HTML, RTF o TXT, actualmente la versión 15 incorpora la exportación a PDF junto a los formatos XLS y DOC que ya se encontraban en la versión 12)
  • Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de SPSS cuentan con un botón que permite hacer el pegado del proceso que el usuario desea realizar. Lo anterior genera un archivo de sintaxis donde se van guardando todas las instrucciones que llevan a cabo los comandos del SPSS. Este archivo es susceptible de ser modificado por el usuario. Muchos de los primeros usuarios del SPSS suelen escribir estos archivos en vez de utilizar el sistema de pegado del programa.
       Existe un tercer tipo de fichero: el fichero de scripts (extensión. SBS). Este fichero es utilizado por los usuarios más avanzados del software para generar rutinas que permiten automatizar procesos muy largos y/o complejos. Muchos de estos procesos suelen no ser parte de las salidas estándar de los comandos del SPSS, aunque parten de estas salidas. Buena parte de la funcionalidad de los archivos de scripts ha sido ahora asumida por la inserción del lenguaje de programación Python en las rutinas de sintax del SPSS. Procedimientos que antes solo se podían realizar mediante scripts ahora se pueden hacer desde el sintax mismo.

       El programa cuando se instala trae un determinado número de ejemplos o utilidades de casi todos los ficheros en cuestión. Estos son usados para ilustrar algunos de los ejemplos de uso del programa.

Aquí está una pequeña lista de cosas que se pueden hacer mediante este programa:

1. Introducción de datos:
Vamos a vista de datos y se introducen en DISTINTAS columnas (porque son distintas variables) de arriba abajo
2. Cálculos básicos:
-para hacer operaciones: ANALIZAR>>estadísticos descriptivos>>frecuencias (para tablas de frecuencias) ahí llevas la variable que te interese al otro lado y le das a estadísticos donde marcaremos todo lo que queramos saber (media, moda, mediana, cuartiles…). Nos aparecerá una pantalla nueva con los resultados. Si necesitamos saber P2,5 o P97,5 habría que hacerlo aquí.
-ANALIZAR>>estadísticos descriptivos>>explorar: ahí introducimos la variable en el primer campo (lista de dependientes) y le damos a aceptar. Aquí nos da toda la información de antes pero ADEMÁS nos da el intervalo de confianza y estimación muestral así como el error típico de la media ENCIMA nos da las gráficas del diagrama tronco hojas y el de cajas.
-Para la ASIMETRIA y la KURTOSIS: En simetría: si es negativo está sesgada a la IZQUIERDA si es 0 es simétrica y si es positivo está sesgada a la DERECHA.En curtosis: si está rondando el 0 es mesocurtica, si es negativo platicúrtica y si es positiva leptocúrtica
-ANALIZAR>>estadísticos descriptivos>>frecuencias>>gráficos esto es útil para ver la FORMA DE LA DISTRIBUCIÓN ya que podemos superponer la curva de la normal. Si la curva se parece al histograma podemos decir que es simétrica.
-Si por ejemplo queremos hacer una nube de puntos o un diagrama de disperisón para ver dos variables cuantitativas,vamos a Gráficos>>cuadro de diálogos antiguos>>dispersión puntos>>dispersión simple>>definir>> OJO hay que saber cual es la dependiente y cual la independiente. En función de será la X (dependiente (Y) y independiente (X)[la edad por ejemplo sería independiente en la mayoría de los casos])
-Otra cosa que podemos sacar es el coeficiente de correlación lineal de Pearson ANALIZAR>>correlaciones>>bivariadas. Ahí nos aparecerá una tabla. En una diagonal siempre nos saldrá 1 (no hacer caso) en el otro te aparecerá otro valor, que será el importante.
-El coeficiente de regresión y el coeficiente de determinación: ANALIZAR>>regresión>>lineal. De todas las tablas que hay, hay que fijarse en la que pone RESUMEN DEL MODELO y fijarse en la R2 (coef. De determinación). Para sacar el coeficiente de regresión (b) hay que mirar en una tabla llama COEFICIENTES. Ahí vemos dos numero debajo de la B. la primera se llama constante (también denominada a) y el segundo es el coeficiente B de regresión. En resumen hay que coger el SEGUNDO.
-Si queremos contrastar dos medias: ANALIZAR>> comparar medias>>prueba t para muestras independientes>>definir grupos.
-Para hacer una selección de datos de una variable: DATOS>>Seleccionar casos>>Si satisface la condición>>Pones la variable a la derecha=(lo que quieras comparar) Ahora ya vamos a ANALIZAR>>explorar.
-ANALIZAR>>Estadístico descriptivo>>tablas de contingencia>>casillas>>% en filas>> aceptar
-ANALIZAR>>Estadísticos descriptivos>>Tablas de contingencia>>Mostras gráfico de barras agrupados Y estadísticos>>(el estadístico que se quiera)
-ANALIZAR>>Comparar medias>>Prueba T para 1 muestra>>(ponemos el valor en valor de prueba)>>Aceptar `[Miramos en Sig]
-Si queremos cambiar el nombre a las variables para que sea más cómodo, se puede en VISTA DE VARIABLES (pestaña derecha) y clickas en el nombre.


 


Excel

Microsoft Excel es una aplicación distribuida por Microsoft Office para hojas de cálculo. Este programa es desarrollado y distribuido por Microsoft, y es utilizado normalmente en tareas financieras y contables.


 
 Aplicaciones

     Excel permite a los usuarios elaborar tablas y formatos que incluyan cálculos matemáticos mediante fórmulas; las cuales pueden usar “operadores matemáticos” como son: + (suma), - (resta), * (multiplicación), / (división) y ^ (exponenciación); además de poder utilizar elementos denominados “funciones” (especie de fórmulas, pre-configuradas) como por ejemplo: Suma(),Promedio(),BuscarV(), etc.

       Así mismo Excel es útil para gestionar “Listas” o “Bases de Datos”; es decir agrupar, ordenar y filtrar la información.
La lista de versiones de Microsoft Excel que han sido lanzadas al mercado para Microsoft Windows son:
Año - Versión
  • 1985 - 01 (Solo para MAC)
  • 1987 - 02 (Microsoft Excel 2.0)
  • 1990 - 03 (Microsoft Excel 3.0)
  • 1992 - 04 (Microsoft Excel 4.0)
  • 1993 - 05 (Microsoft Excel For NT)
  • 1995 - 06 (Microsoft Excel 1995)
  • 1997 - 07 (Microsoft Excel 1997)
  • 1999 - 08 (Microsoft Excel 2000)
  • 2001 - 09 (Microsoft Excel XP)
  • 2003 - 10 (Microsoft Excel 2003)
  • 2007 - 11 (Microsoft Excel 2007)
  • 2009 - 12 (Microsoft Excel 2010)
  • 2013 - 13 (Microsoft Excel 2013)
  • 2013 - 14 (Microsoft Excel 365)
     A principios de 1993, Excel se convirtió en el objetivo de una demanda por otra empresa que ya tenía a la venta un paquete de software llamado "Excel" en el sector financiero ya que era un producto muy competitivo en el Mercado. Como resultado de la controversia, Microsoft estaba obligada a hacer referencia al programa como "Microsoft Excel" en todos sus comunicados de prensa oficiales y documentos jurídicos. Sin embargo, con el tiempo esta práctica ha sido ignorada, y Microsoft aclaró definitivamente la cuestión cuando se adquirió la marca del otro programa.

       Microsoft alentó el uso de las letras XL como abreviatura para el programa; el icono del programa en Windows todavía consiste en una estilizada combinación de las dos letras. La extensión de archivo por defecto del formato Excel puede ser .xls en versiones anteriores o iguales a Excel 2003 (11.0), .xlsx para libros de Excel regulares en versiones posteriores o iguales a Excel 2007 (12.0), .xlsm para libros de Excel preparados para macros en versiones posteriores o iguales a Excel 2007 (12.0)2 o .xlsb para libros de Excel binarios en versiones posteriores o iguales a Excel 2007 (12.0).

       Excel ofrece una interfaz de usuario ajustada a las principales características de las hojas de cálculo, en esencia manteniendo ciertas premisas que pueden encontrarse en la hoja de cálculo original, VisiCalc: el programa muestra las celdas organizadas en filas y columnas, y cada celda contiene datos o una fórmula, con referencias relativas ,absolutas o mixtas a otras celdas.

        Excel fue la primera hoja de cálculo que permite al usuario definir la apariencia (las fuentes, atributos de carácter y celdas). También introdujo recomputación inteligente de celdas, donde celdas dependientes de otra celda que han sido modificadas, se actualizan al instante (programas de hoja de cálculo anterior recalculaban la totalidad de los datos todo el tiempo o esperaban para un comando específico del usuario). Excel tiene una amplia capacidad gráfica, y permite a los usuarios realizar, entre otras muchas aplicaciones, listados usados en combinación de correspondencia.

       Cuando Microsoft primeramente empaquetó Microsoft Word y Microsoft PowerPoint en Microsoft Office en 1993, rediseñó las GUIs de las aplicaciones para mayor coherencia con Excel, producto insigne de Microsoft en el momento.
Desde 1993, Excel ha incluido Visual Basic para Aplicaciones (VBA), un lenguaje de programación basado en Visual Basic, que añade la capacidad para automatizar tareas en Excel y para proporcionar funciones definidas por el usuario para su uso en las hojas de trabajo. VBA es una poderosa anexión a la aplicación que, en versiones posteriores, incluye un completo entorno de desarrollo integrado (IDE) conocido también como Editor de VBA. La grabación de macros puede producir código (VBA) para repetir las acciones del usuario, lo que permite la automatización de simples tareas. (VBA) permite la creación de formularios y controles en la hoja de trabajo para comunicarse con el usuario. Admite el uso del lenguaje (pero no la creación) de las DLL de ActiveX (COM); versiones posteriores añadieron soporte para los módulos de clase permitiendo el uso de técnicas de programación básicas orientadas a objetos.

        La funcionalidad de la automatización proporcionada por (VBA) originó que Excel se convirtiera en un objetivo para virus en macros. Este fue un grave problema en el mundo corporativo hasta que los productos antivirus comenzaron a detectar estos virus. Microsoft tomó medidas tardíamente para mitigar este riesgo mediante la adición de la opción de deshabilitar la ejecución automática de las macros al abrir un archivo excel.

 

 

Bibliografía Consultada

Ø  es.wikipedia.org/wiki/SPSS
Ø  Pardo, A. y Ruiz, M. A. (2002). SPSS 11. Guía para el análisis de datos.
Ø  es.wikipedia.org/wiki/Microsoft_Excel
Ø  www.monografias.com/trabajos16/sepa-excel/sepa-excel.shtml




No hay comentarios.:

Publicar un comentario