Datos, Información y cómo se hace mal uso de ellos

Datos, Información y cómo se hace mal uso de ellos

Miércoles 18 Ago 2010

Hace algunos días Wired publicó un artículo con el provocativo nombre "The Web is Dead. Long live the Internet". La idea central es que el uso de la Web ha ido declinando y está siendo reemplazada por aplicaciones específicas. Prueba de ello es un gráfico que muestra que el tráfico de la Web (entiéndase HTML en el reportaje) ha ido disminuyendo proporcionalmente en relación al de video y otros. No quiero entrar en las falencias del reportaje en sí, sino enfocarme en un solo detalle: Cómo la forma en que mostramos los datos afectan nuestra percepción.

Datos != Información

Cuando entregamos datos (en este caso, estimaciones del tráfico por Internet separado por "tipo") estamos hablando (generalmente) de números sin ningún significado inherente: Si digo "5", eso es un dato. Un archivo en formato CSV es un conjunto de datos. Lo interesante es cómo se interpretan estos datos en base a su contexto (cuáles son las unidades, de qué se trata, cómo fue medido o se llegó a este valor, etcétera). En definitiva el dato sólo es útil en un contexto, lo que hace que éste sea tanto o más importante que el dato mismo.


No entendemos datos per se

Más aún, como opinión personal, los humanos no trabajamos a nivel de datos (para eso están los computadores), sino más bien a nivel de información (incluyendo el contexto). Los seres humanos necesitamos entender el big picture que un conjunto de datos nos da y es esta idea final lo que nos queda como producto.

Como visualizamos determina como entendemos

Es claro que la forma como se despliegan los datos determina cuan fácil podemos entenderlos(*). Así, algunas veces el tenerlos en gráficos, agregados, o tablas es lo más adecuado, dependiendo tanto de la naturaleza de éstos como de lo que queremos transmitir (la información).

Es ahí donde Wired se cae, pues en ese caso, el usar porcentaje no se una decisión inocua sino claramente intenta apoyar la tesis del artículo que de otra forma no sería posible con los mismos datos. Como contraejemplo, la gente de BoingBoing, usó los mismos datos esta vez usando números duros y mostró exactamente lo contrario a la tesis de Wired (en este caso, el uso de la Web está creciando, como se ve en la sección roja de la imagen más abajo). Esto, sin considerar que los datos bytes transmitidos no son los mejores para estudiar qué es lo trendy en Internet.


¿Cómo evitar malos usos de los datos?

Algo tan simple como cambiar la escala de un gráfico hace la diferencia entre decir "La Web está muriendo" a "La Web está creciendo". Para alguien que no sepa mucho sobre las tecnologías involucradas, este cambio puede pasar desapercibido. ¿Es posible evitar el uso malintencionado de datos? En principio, lo único que se me ocurre por ahora es considerar las opiniones de la comunidad: Después de todo, uno no es experto en todas las materias y si nos encontramos con datos relacionados a un área en la cual no somos expertos, es claro que podemos obviar cosas que son importantes a la hora de entender de qué se trata la información desplegada.

(*) Recomiendo un blog muy bonito, aunque no siempre de lo más útil, llamado Information is beautiful.

Imágenes: Wired y BoingBoing.

Foto de Alvaro Alvaro Graves @alvarograves PhD en Ciencias Cognitivas e Investigador en temas de Open Data, Visualizaciones, Web Semántica, eScience y Web Science. Ingeniero civil en computación. http://www.graves.cl