El Análisis Exploratorio
de Datos (AED) es un enfoque que prioriza el análisis de datos y sobre este
particular existen múltiples criterios.
Monterde y Perea, menciona
que el AED es, “por una parte, una perspectiva o actitud sobre el análisis de
datos, en la que se exhorta a que el investigador adopte una actitud activa en
y hacia el análisis de los mismos, como un medio para sugerir nuevas hipótesis
de trabajo. Por otra parte, se compone de un renovado utillaje conceptual e
instrumental respecto a lo que podríamos llamar Estadística Descriptiva
“clásica”, con el fin de optimizar la cantidad de información que los datos
recogidos puedan ofrecer al investigador, mediante representaciones gráficas, a
base de reducir la influencia de las puntuaciones extremas en los estadísticos
con el empleo de, los que por ello se ha convenido en llamar, “estadísticos
resistentes”.
Ante lo mencionado surge
una pregunta, ¿cómo se inserta lo que ya se conoce de estadística? La respuesta no puede darse en pocos párrafos,
se requiere la revisión y lectura, desde el desarrollo de la teoría y la
ejemplificación correspondiente para comprender la concepción de AED y sus
similitudes y diferencias con la estadística clásica.
Muchos coincidirán en que
no se exagera si se dice que el objeto de la Estadística es el estudio de
métodos científicos para organizar, presentar y analizar datos estadísticos, pero
el problema está en cómo empezar a organizar los datos, todos los que han pasado
por un curso básico de Estadística
recordará la prioridad que se da a las tablas de frecuencia, al estudio de la
distribución normal o la correlación lineal que describen de una manera simple
el comportamiento de los datos.
Estos temas, que la AED no
los desecha, representan estructuras a gran escala que resumen las relaciones
entre todos los datos y que liberan a los investigadores de la búsqueda
minuciosa de modelos, para el entendimiento de las estructuras que subyacen en
grandes conjuntos de datos; esta es una primera idea de la concepción del AED.
Desde su comienzo, el AED
ha tenido como finalidad la revisión de los datos previo a la aplicación de
cualquier técnica estadística para alcanzar primero un entendimiento básico de
los mismos y de las relaciones existentes entre las variables analizadas. Es
decir, cualquier cálculo, (promedios, desviaciones, correlaciones, etc.) debe
estar precedido por un análisis visual de los datos, dicho de otro modo,
mientras la Estadística Descriptiva clásica se ocupa de recoger, ordenar y
representar los datos en forma de tablas, agrupándolos por intervalo y
calculando estadísticos basados principalmente en la distancia y con datos
centrados en la media (promedio); el AED se preocupa primero por detectar
anomalías y errores en las distribuciones univariadas de los datos, intentando
descubrir en ellos patrones o modelos, pero empleando variadas técnicas gráficas
y buscando estimadores no paramétricos o estimadores libres de distribución o
simplemente estimadores robustos, según el término acuñado por Box, tratando de
llevar el estudio de la información que se tiene, hacia una modelización más
completa que la establecida por la Estadística Clásica, basados principalmente
en el orden y centrados en la mediana.
Los programas estadísticos
como el SPSS, Minitab, Statgraphs, Statsoft, SAS, IDAMS y otros, ofrecen muchas
posibilidades a partir de interaccione simples y amigables, con diálogos
dinámicos tanto de la Estadística Clásica como las de AED, debiendo tener en
cuenta que una buena gráfica
informa más que un conjunto de números disgregados.
En
resumen el AED,
permite que hablen los datos y a partir
de ellos encontrar los patrones y modelos indicados, con esto se logra
que en muchas situaciones, el AED puede preceder a una situación de inferencia formal,
mientras que en otras, puede sugerir preguntas y conclusiones que se podrían
confirmar con un estudio adicional, por esto el AED es una herramienta de
utilidad en la generación de hipótesis, conjeturas y preguntas de investigación
acerca de una realidad que los datos fueron obtenidos.
En la investigación de
diferentes áreas, donde intervienen numerosas variables y donde los datos no abundan,
el AED bien utilizado se convierten en instrumento que complementan los diseños
de investigación y dan validez, confiabilidad y rigor científico a los resultados.