Análisis estadísticos de datos
Tomando como base los aportes de Jacqueline Hurtado (2012), la rama de las matemáticas encargada del análisis de datos en la investigación, es la estadística, aplicada como una herramienta que le permite al investigador agrupar, organizar, analizar, e interpretar resultados, para esto toma como base la fundamentación noológica, es decir, a partir del análisis mental, el uso de la inteligencia para la construcción del conocimiento con el fin de dar respuestas a los interrogantes formulados al problema de investigación.
Cuando se utiliza una prueba estadística en una investigación se establece un sistema de relaciones entre los datos con el fin de generar conclusiones desde sus resultados, como existencia o no entre eventos, variables o información generada desde los grupos de análisis; cambios en la magnitud de una variable luego de la aplicación de un tratamiento. En ese sentido, las pruebas estadísticas le suministran al investigador bases para comparar, criterios para referenciar o diferenciar desde el análisis de probabilidades si existe o no diferencias significativas entre grupos.
En ese sentido, actualmente los datos de una investigación deben ser procesados y analizados por medio de una computadora, especialmente si se tiene un volumen de datos considerables. Por otra parte, en prácticamente todas las organizaciones, empresas, instituciones de educación superior, centros de investigación, y demás entes que desarrollan investigación disponen de sistemas de cómputo para archivar y analizar datos; cada investigación desde el análisis de su objeto de conocimiento y el objetivo planteado debe tomar una u otra prueba estadística.
En torno a lo anterior se debe tener en cuenta que la estadística se define como la aplicación del método científico en el análisis de datos numéricos con el fin de tomar decisiones racionales (Berenson y Levine 1987). Igualmente se debe tener en cuenta lo propuesto por Gil (2003), al definir la estadística como una ciencia cuyo objeto es el estudio de métodos y técnicas para el tratamiento de conjuntos de datos numéricos, permiten la descripción de conjuntos de datos y la inferencia sobre conjuntos más amplios. Sus métodos pueden ser aplicados en distintos campos del saber, constituyendo un importante instrumento para el estudio científico.
De esa forma, la estadística permite recolectar, analizar, interpretar y presentar la información que se obtiene en el desarrollo de una determinada investigación; el paso siguiente a la elaboración del Plan de investigación estadístico es la recolección definitiva de los datos. Esta recolección consiste en los procedimientos de observación y anotación o registro de los hechos en los formularios que se han diseñado previamente. De esta recolección depende en gran parte la calidad del análisis que se realice, ya que pueden existir interpretaciones falsas y análisis erróneos de las situaciones, cuando existen fallas en la recolección de la información.
Por esto todo dato o grupo de datos obtenido, antes de ser totalizado y utilizado requiere un examen crítico, sobre aspectos de exactitud, precisión y representatividad, lo que se denomina la crítica del dato; después en caso que sea necesario, se procede a su codificación. Una vez se terminan de recoger los datos, se deben organizar y resumir para obtener información significativa, es decir, analizar los datos utilizándose para esto la estadística descriptiva, la Estadística inferencial o el Análisis multivariado. Teniendo en cuenta los objetivos planteados en la investigación, se elige que métodos, técnicas o estadísticos utilizar, a continuación una breve descripción de estos:
Estadística descriptiva. Métodos que implican recopilación, caracterización y presentación de un conjunto de datos con el fin de describir varias de las características. Se refiere a la recolección, organización, caracterización de conjuntos de datos numéricos que pueden corresponder a una muestra o a una población, con el objetivo de presentarlos de manera organizada y resumida para describir diversas características que la conformen. Algunos métodos estadísticos que se aplican en la estadística descriptiva son: las distribuciones de frecuencia, algunas gráficas como son el histograma y el polígono de frecuencia y medidas estadísticas como son la media, la mediana y la moda. Estas medidas se llaman medidas de tendencia central. La desviación estándar, el recorrido y algunas otras se llaman medidas de variabilidad. Se considera todo un conjunto de normas y procedimientos que permiten:
- Organizar los datos: Gráficos y tablas de frecuencias.
- Establecimiento de índices: Tendencia central, dispersión, posición y forma.
- Medición de relaciones entre variables: Determinación del grado de asociación entre variables.
- Transformaciones entre variables: tipificación de variables.
Estadística inferencial. Métodos que permiten hacer estimación de una característica de la población o de toma de decisiones con respecto a una población basada solo en los resultados obtenidos de la muestra. También se le llama inferencia estadística o estadística inductiva. En ella se analizan datos con la finalidad de conocer características o concluir acerca de una población. Son los procedimientos estadísticos que se aplican para llegar a conclusiones acerca de un conjunto de datos numéricos que forman la población, a partir de analizar solamente una parte de ella, es decir a un subconjunto de la población al que se le llama muestra.
Su utilización en la investigación pretende deducir consecuencias acerca de la población, partiendo de los datos obtenidos a partir de una muestra representativa de dicha población. Los campos de actuación de la estadística inferencial son:
- Muestreo
- Estimación de parámetros
- Contraste de hipótesis.
Análisis Multivariado. Este tipo de análisis se utiliza para distribuciones bidimensionales, dos variables, para determinar si existe alguna relación entre ellas y cuantificar dicha relación; estas variables pueden ser ambas discretas, continuas o una discreta y la otra continua. Para su utilización se requiere el uso de paquetes estadísticos por computador. Se llama Xi la primera variable (los valores varían de 1 hasta n), Yi la segunda variable (los valores varían de 1 hasta n). Siempre se tomaran pares de observaciones (Xi,Yi). Los datos de la distribución bidimensional, pueden representarse gráficamente en un par de ejes coordenados. Tomando el eje de las abscisas para la primera variable (X) y al eje de las coordenadas, para los valores de la segunda variable (Y). En un plano cartesiano se presentan tantos puntos como pares de observaciones se tengan; a cada punto corresponde 1 par de observaciones, a esta representación gráfica se le denomina Diagrama de esparcimiento o nube de puntos.