martes, 6 de noviembre de 2012

De los datos al conocimiento-educ.ar

http://www.educ.ar

De los datos al conocimiento

Los usuarios de internet no solo consumimos información, sino que también la producimos en volúmenes crecientes, y cada día más participantes se suman a este proceso de alimentación de la web. Pero, ¿cómo se obtiene información de entre tantos datos? ¿Quiénes los registran? ¿De qué manera se buscan y analizan para utilizarlos según diversos objetivos? De eso se trata el Big data, también conocido como minería de datos.
Suele decirse que «en internet está todo», lo que invita a creer de manera un poco ingenua que solo es cuestión de navegar y buscar. Sucede que, comparando internet con una gran mina donde explorar en busca de recursos útiles a nuestros propósitos, allí se encontrarán cosas que sirven y otras que no, y surgirá el problema de que no todo lo que necesitamos es fácilmente accesible.

Tratemos, por un momento, de dimensionar la cantidad de datos que generamos diariamente solo en la escuela. Contemos cuántos alumnos hay en el aula, cuáles son sus nombres, edades, fechas de cumpleaños, lugares de nacimiento, nombre de sus padres, hermanos, abuelos, sus respectivas edades… Describámoslos uno por uno: color de ojos, pelo, altura, peso, anotemos las direcciones de sus casas, el talle de zapatos, guardapolvo, sus programas de televisión favoritos, sus calificaciones en la escuela, los promedios, los trabajos que cada uno presentó. Pasemos al aula, cuántos metros cuadrados tiene, altura, ancho, cantidad de ventanas, forma de abrir las ventanas, servicios, disposición de los bancos, cantidad de bancos, de pizarrones, cuántas tizas utilizamos por día por mes por año, número de borradores, de docentes, color de las paredes, afiches pegados en ellas… Y si ya nos cansamos de calcular, multipliquemos lo que ya tenemos por todas las aulas de la escuela, y por todas las escuelas del distrito, y las de la localidad, la provincia, el país, la región… Necesitamos ayuda tanto para registrar toda esta información, como también para procesarla y poder utilizarla para algún fin útil.

Qué es Big data

Foto de pasillo largo con archiveros a ambos lados y , en el fondo, una persona buscando algo en uno de ellos.

Ernesto Mislej, especialista y docente de la maestría en Explotación de Datos y Descubrimiento de Conocimiento (Data Mining & Knowledge Discovery) de la Universidad de Buenos Aires (UBA), explica que el concepto de minería de datos, o data mining, refiere básicamente a la exploración y análisis de grandes cantidades de datos para encontrar patrones, reglas o modelos comunes entre estos. Pero no se trata únicamente de la cantidad: Big data es igual a cantidad de datos, más velocidad de procesamiento, más variedad de información.

¿Qué hacemos día a día en internet? Subimos fotos, escribimos en blogs, cargamos videos, buscamos todo tipo de información, compartimos una nota interesante, enviamos correos electrónicos, compramos en comercios virtuales, participamos de redes sociales y comunidades de interés, conversamos, opinamos. Sin embargo, estas actividades, y otras, de las que participamos como agentes de datos que además de consumir información también la generan, representan solo una parte del total, ya que se suma que la nueva generación de aplicaciones y desarrollos generan por sí mismos información propia, datos que ayudan a su clasificación, etiquetado e identificación.

Es por todo esto que los especialistas de la industria de las tecnologías de la información sostienen que el Big data nos ayudará a tomar mejores decisiones.

Para qué sirve el Big data: el potencial de los datos públicos

Mislej señala que en cada área o actividad se pueden utilizar modelos de data mining: «La AFIP utiliza procedimientos soportados por técnicas de minería de datos para sus controles impositivos y aduaneros con el fin de detectar fraude y descubrir nuevos patrones de evasión; en agricultura se usan para optimizar zonas de cultivo; también en nuevas formas de participación ciudadana; en inteligencia y seguridad, planificación estratégica, exploración minera y de hidrocarburos, detección de fallas en la red eléctrica, logística, estimación de impacto impositivo, etcétera».  
Estos procedimientos, y la actividad en la red en general, permiten tomar decisiones de todo tipo: planificar qué construir y dónde hacerlo, prevenir un desastre natural, evitar un embotellamiento, detectar posibles derrumbes.

El lado humano

Si fuera posible grabar todas nuestras clases y ver cómo evoluciona la comprensión de un tema en particular a lo largo del año, ¿cómo podríamos usar esa información para mejorar no solo nuestra práctica docente sino también para contar con mejores recursos que enriquezcan el proceso de enseñanza-aprendizaje?

El hecho de que todo parece estar informatizado y de que existen aplicaciones y herramientas informáticas capaces de recopilar, almacenar y graficar estos datos no significa que no tengamos nada que hacer en el mundo del Big data. Muy por el contrario, la clave está, justamente, en la interpretación de esos datos, qué decidamos hacer y cómo los utilicemos. Enseñar no solo a saber de dónde proviene y que significa cada dato, sino cómo podemos relacionarlos para que nos sirvan como insumo en nuestros estudios es lo que terminará por demostrarnos el enorme potencial de contar con enormes flujos de información en tiempo real.

No obstante, como nos señala Mislej, siempre la visualización termina empujándonos a una interpretación. «En cuanto a las competencias, uno debería dejarse llevar por los sentidos y que estos hagan el trabajo y que perciban los patrones que subyacen a la visualización. Es verdad que un gráfico en escala logarítmica es más raro que uno en escala lineal. Pero uno se va entrenando en reconocer los “sesgos” o suposiciones de cada metáfora visual».

De los datos al conocimiento