martes, 7 de mayo de 2013

Pensamiento Estadístico



La mayoría de instituciones públicas y privadas reciben, generan, producen y gestionan miles de datos. Muchas veces el tratamiento de estos datos está en manos de personas e incluso profesionales que no tienen pensamiento estadístico, para tomar decisiones adecuadas a partir de estos datos, que ayuden a cumplir los objetivos y metas institucionales.

En Special Publication on Statistical Thinking, en 1996, se detalla que el pensamiento estadístico es una filosofía de aprendizaje y acción basada en tres principios inevitables que son:

  • todo trabajo ocurre en un sistema de procesos relacionados;
  • variación existe en todos los procesos; y
  • entender y reducir la variación son las claves del éxito.      
El pensamiento estadístico es una forma o un proceso de pensar (filosofía), en lugar de realizar cálculos, ésta es la diferencia básica entre el pensamiento estadístico y las técnicas estadísticas.

El pensamiento estadístico en los directivos, funcionarios y empresarios es importante y necesario para el desarrollo de una cultura estadística, haciendo uso de los recursos que ofrece la tecnología para enseñar y difundir la estadística, sin olvidar que también es necesaria la atención al contenido estadístico que todo profesional requiere urgentemente.

Los responsables en dirigir una institución deben estar capacitados para usar correctamente el lenguaje estadístico y tener habilidades para construir argumentos estadísticos basados en hechos (datos). Si se tiene una actitud positiva sobre los beneficios de la estadística, su trascendencia y su alcance, se podrá incrementar su aplicación en la gestión de la institución y generalizar su uso en áreas impensables del negocio.

En la actualidad (era de la información) debe promoverse el pensamiento estadístico en la capacitación o enseñanza de la estadística, porque es necesario remarcar que antes de aplicar métodos y técnicas estadísticas debe hacerse uso del pensamiento estadístico, ya que es la recopilación de principios, lenguaje y mecanismos para razonar y plantear una solución a un problema que requiere cuantificación. Cuando se aprende el pensamiento estadístico, se aplica y entiende mejor los procesos y el trabajo en general, lo que conlleva a delimitar, plantear y solucionar los problemas institucionales.

A pesar de los avances logrados en estadística a la actualidad, aún las empresas y las instituciones tutelares de gobierno no han llegado a incorporar a la práctica el pensamiento estadístico necesario, a pesar que las Tecnologías de Información, permiten que el desarrollo del pensamiento estadístico sea más alcanzable.

Vean en el siguiente vídeo  un ejemplo de cómo se puede analizar con las estadísticas lo que sucede en el mundo, mejor aún lo podemos hacer en las empresas y en las instituciones de un país.

jueves, 2 de mayo de 2013

Estadística y Datamining

Existen instituciones complejas que realizan miles de transacciones diarias para lo cual es necesario  tomar una cantidad similar o mayor de decisiones individuales o agregadas; estas instituciones por lo general trabajan con personas y atienden a personas, entre las instituciones a las que me refiero están los hospitales, clínicas, colegios, universidades, bancos, supermercados y empresas que brindan múltiples servicios o venden determinados productos.


El servicio o producto que se brinda, no sólo implica la entrega de este como tal, sino que además en su consecución hay un conjunto de datos que se generan a su alrededor: por ejemplo si se brinda un servicio de salud, se tiene todos los datos del paciente y del  mal que lo aqueja, está el médico que lo atiende, personal auxiliar y administrativo, la infraestructura que se debe usar, equipos,  materiales, sala de operaciones, servicios intermedios etc., es decir cuando un paciente ingresa a un establecimiento de salud de cualquier nivel, pone en funcionamiento todo su  sistema de atención y su sistema de información que va registrando datos.

Estos datos en conjunto pueden servir para a posteriori evaluar y conocer como se viene dando nuestro servicios a través de indicadores, con lo cual se pueden hacer las correcciones necesarias ahí donde hay falencias, demoras o muestras de poca eficiencia.

Si se cuenta con bases de datos corporativas (Datawarehouse) o por áreas específicas (Datamart), no solo podemos obtener información sino también conocimiento de lo que pasa en nuestra institución, para lo cual podemos extraer  información oculta y predecible de esas bases de datos, esto es lo que se denomina Datamining o Mineria de datos, el Datamining es una poderosa tecnología con gran potencial que ayuda a concentrarse en la información más importante de las bases de datos corporativas de por si complejas.  Las herramientas de Datamining predicen tendencias  y comportamientos, permitiendo a las instituciones tomar decisiones proactivas, conducidas por un conocimiento cercano de lo que acontece.

Las herramientas de Datamining pueden responder a preguntas de negocios que tradicionalmente consumen mucho tiempo para ser resueltas y a los cuales los usuarios de esta información casi no están dispuestos a aceptar. Estas herramientas exploran las bases de datos en busca de patrones ocultos, encontrando información predecible que un experto no puede llegar a encontrar porque se encuentra fuera de sus expectativas. Muchas instituciones y empresas colectan miles de datos y no saben qué hacer con estos. Las técnicas de Datamining pueden ser implementadas en plataformas ya existentes de software y hardware para acrecentar el valor de las fuentes de datos y puedan ser integradas a nuevos sistemas.

Las técnicas de Datamining ya están listas para su aplicación, ya que está soportado por tres tecnologías que son suficientemente maduras: a) Recolección masiva de datos b) Potentes computadoras y c) Algoritmos de Datamining.

Las técnicas más comúnmente (ver otras herramientas) usadas en el análisis en el Datamining son:
·         Redes neuronales artificiales.
·         Arboles de decisión.
·         Algoritmos genéticos.
·         Método del vecino más cercano
·         Regla de inducción (fuerte uso de la ciencia Estadística y las probabilidades)

Pero sin las técnicas de la Estadística no existe un análisis efectivo, sin análisis efectivo no existe inteligencia de negocios, explicación de los hechos o generación de conocimiento de una realidad concreta. Y entones ¿cómo se puede esperar sacar algo de la ingente cantidad de gigabytes o terabytes de datos y tomar buenas decisiones y consistentes que permitan hacer bien las cosas de mi institución? Con la Estadística, se puede transformar los datos en conocimiento sobre los procesos de su institución y su negocio.


lunes, 22 de abril de 2013

¿Dónde están los datos?




Cuando se lleva a cabo una investigación,  luego de definir el problema y las variables que explican o describen los hechos que van a ser  medidos y evaluados, es necesario ir pensando en los datos, ya que de nada servirá determinar el problema, los objetivos y las variables, si luego nos enteramos que es difícil obtener los datos, tanto a nivel primario como secundario.

En algunos casos por la naturaleza del problema y de la investigación sólo será posible utilizar datos secundarios, es decir datos que se encuentran en documentos o en base de datos, elaboradas a partir de fuentes primarias, y que en la mayoría de los casos corresponden a  datos estadísticos de información permanente que se genera en las diferentes instituciones del estado; por ejemplo: las defunciones, enfermedades, las microempresas creadas mensualmente, flujo turístico por tipo de hotel, casos o expedientes  judiciales resueltos, número de edificios en construcción, número de viviendas construidas por distrito, número de sentenciados, alumnos matriculados por tipo de escuela, comportamiento del dólar, producción por sector, etc. La lista puede ser interminable. ¿Pero dónde están esos datos?

El gran productor, de la mayoría de estos datos es el INEI, que se encarga de acopiar, organizar y difundir  en forma oficial las estadísticas nacionales, pero también están todos los Ministerios que en gran medida cuentan con datos e información sectorial respectiva y están dispuestos en bases de datos, archivos en formatos Excel, SPSS, DBF, SQL, PDF o TXT, a las cuales se puede acceder directamente o realizar algunas transformaciones, para ser utilizados según el interés particular. Incluso en algunos casos se brinda datos en serie de tiempo es decir el comportamiento de una variable a través de los días, meses o años.

Detrás de estos datos hay recursos  dispuestos: equipos, oficinas, sistemas, papelería y útiles de oficina y sobre todo personas (administrativos, de apoyo y especialistas) y en algunos casos hay estadísticos; estos datos son el producto de una serie de esfuerzos, que ameritan ser utilizados, lo cual implicaría, analizarlos, exprimirlos y torturarlos a fin de encontrar explicaciones más sustanciales a la situación que se estudia.

El no darle uso a los datos, se pierde recursos y  oportunidades de no encontrar la solución a problemas cotidianos, y a prever situaciones en este mundo tan complejo y cada vez más insalvable. Sin embargo muchas de las soluciones esta en los propios datos que genera el problema, que luego de un análisis multidisciplinario se puede construir salidas inteligentes, económicas y de beneficio común, usando herramientas tecnológicas, estadística y decisión.

Empecemos tratando bien a los datos es la materia prima de la estadística, hay que hacer que hablen. Evitemos caer en la infoxicación.

sábado, 2 de marzo de 2013

Ramas de la Ciencia Estadística





Para aplicar la Ciencia Estadística en las distintas áreas de la ciencia físicas, naturales, humanas, sociales, económicas, tecnológicas y de las que se inventen en el futuro, se puede utilizar  los siguientes ramas de la Estadística:

·         Estadística descriptiva.
·         Inferencia.
·         Técnicas de muestreo.
·         Diseño Experimental y Análisis de la variancia.
·         Análisis de regresión y correlación.
·         Tablas de contingencia.
·         Teoría de la decisión.
·         Series temporales.
·         Estadística no paramétrica.
·         Organización de Estadísticas.
·         Minería de Datos (Datamining).
·         Actuarial y Supervivencia.
·         Análisis Demográfico.
·         Bioestadística.
·         Control Estadístico de Calidad.
·         Econometría.
·         Estudio de Mercados.

¡Cada una de estas líneas!, ha sido motivo de cientos o quizás miles de estudios o aplicaciones y se han escrito libros, textos, artículos especializados y se aplican a diversas investigaciones universitarias o tesis de grado y postgrado, y se han desarrollado aplicaciones web para interactuar con el usuario y se han creado diversos paquetes estadísticos  especializados o generales  en la cual se puede aplicar los conceptos de cada rama (Una Mirada a la Estadística, CIMAT).

Sin embargo, estas ramas de la estadística, por lo general no se aplican en forma aislada de las demás, más bien interactúan y se comunican a través de diferentes pruebas y técnicas, lo que permite tener mayor confiabilidad en los resultados y asegurar que se van a tomar mejores decisiones.

Vean como la  Ciencia Estadística y sus ramas va en paralelo con el desarrollo del mundo y su apoyo es trascendental, a propósito del  “Año Internacional de la Estadística”.

miércoles, 27 de febrero de 2013

Me gusta ser Estadístico



Porque cada día se producen millones de hechos en el universo.
Porque me gusta encontrar la explicación de esos hechos.
Porque en cada uno de esos hechos hay números.
Porque el capricho de cada número obedece a sinergias que busco descubrir.
Porque ser un dato estadístico no es culpa de la Estadística.
Porque me gusta arar en el desierto para encontrar un dato.
Porque quisiera saber cuándo se hace constante el número 2.71828203081451 ...
Porque respeto la Ley de los grandes números.
Porque me fascina buscar una aguja en un pajar.
Porque me encandila distinguir las gotas del océano.
Porque sospecho de algo raro cuando veo números primos.
Porque no todo puede ser número par.
Porque me gusta el 69.
Porque estoy de acuerdo en el 80% de los casos con Pareto.
Porque me gusta deslizarme por una gráfico de Gauss.
Porque estudie la biografía de William Sealy Gosset alias "Sudent".
Porque coincido probablemente con Bayes.
Porque la Estadística no es una mentira más, sino usada por mentirosos.
Porque me gustaría saber en qué número acaba 3.14159265358979 ...
Porque puedo calcular la variancia de los latidos de mi corazón al amar.
Porque me ayuda a saber cuánto ganar o cuanto perder en la vida
Porque puede salvar vidas.
Porque puede ayudar a los pobres.
Porque permite buscar la justicia.
Porque da oportunidad de incluir a los marginados.
Porque es ciencia y es verdad con margen de error.
Porque es humana y social.
Porque su filosofía es sistémica e integradora.
Porque me ayuda a razonar y experimentar nuestro mundo.
Porque me avisa cuando viene la derrota y el triunfo.
Porque brinda indicios para encontrar la verdad.
Porque me mantiene ocupado en la vida.
y porque tengo 1956 razones más ...

.
Por eso me gusta ser Estadístico.