Información sobre innovación, productividad y tecnología

La ciencia de datos como arte

El análisis de datos es difícil y parte del problema es que pocas personas pueden explicar cómo hacerlo. No es que no haya personas que realicen análisis de datos de forma regular. Sino que las personas que son realmente buenas en esto aún tienen que iluminar sobre el proceso de pensamiento que siguen.


Imagina que le preguntas a un compositor cómo escribe sus canciones. Hay muchas herramientas a las que puede recurrir. Tenemos una comprensión general de cómo debe estructurarse una buena canción: cuánto tiempo debe durar, cuántos versos, tal vez haya un verso seguido de un coro, etc. En otras palabras, hay un marco abstracto para las canciones en general. De manera similar, la teoría musical nos dice que ciertas combinaciones de notas y acordes funcionan bien juntas y otras combinaciones no suenan bien. Por muy buenas que puedan ser esas herramientas, en última instancia, el conocimiento de la estructura de la canción y la teoría musical por sí solo no lo convierte en una buena canción. Se necesita algo más.

En algún momento, el compositor debe inyectar una chispa creativa en el proceso para unir todas las herramientas de composición y hacer algo que la gente quiera escuchar. Esta es una parte clave del arte de escribir canciones. Esa chispa creativa es difícil de describir, mucho menos de escribir, pero claramente es esencial para escribir buenas canciones. Si no fuera así, tendríamos computadoras creando canciones de éxito con regularidad. Para bien o para mal, eso aún no ha sucedido.

Al igual que la composición de canciones, es importante darse cuenta que el análisis de datos es un arte. Todavía no es algo que podamos enseñarle a una computadora. Los analistas de datos tienen muchas herramientas a su disposición, desde la regresión lineal hasta los árboles de clasificación e incluso el aprendizaje profundo. Y todas esas herramientas se han enseñado cuidadosamente a las computadoras. Pero, en última instancia, un analista de datos debe encontrar una manera de reunir todas las herramientas y aplicarlas a los datos para responder una pregunta relevante, una pregunta de interés para las personas.


Desafortunadamente, el proceso de análisis de datos no es uno que hayamos podido escribir de manera efectiva. Es cierto que hay muchos libros de texto de estadística y tal vez tengamos algunos de ellos. Pero ninguno de estos aborda realmente los problemas centrales involucrados en la realización de análisis de datos del mundo real.

Describir el análisis de datos presenta un enigma difícil. Por un lado, desarrollar un marco útil implica caracterizar los elementos de un análisis de datos utilizando un lenguaje abstracto para encontrar los puntos en común entre los diferentes tipos de análisis. A veces, este idioma es el lenguaje de las matemáticas. Por otro lado, a menudo son los mismos detalles de un análisis lo que hacen que cada uno de ellos sea tan difícil e interesante. ¿Cómo se puede generalizar eficazmente a través de muchos análisis de datos diferentes, cuando cada uno de estos tiene aspectos importantes únicos?

Es así que el proceso de análisis no es una "fórmula" específica para el análisis de datos, algo así como "aplicar este método y luego ejecutar esta prueba", sino que es un proceso general que, con suerte, se puede aplicar en una variedad de situaciones. Finalmente, a través de la experiencia, tanto en la gestión de analistas de datos como en la realización de estos, se observará cuidadosamente qué produce resultados coherentes y qué no produce información útil sobre los datos.


Share:

No hay comentarios.:

Publicar un comentario

Recent Posts

Popular Posts