Skip to content

SIMMAC 2016 – Big Data

24 febrero, 2016

baner XX SIMMAC

En esta semana -23 al 26 de Febrero- se está llevando a cabo el vigésimo Simposio de Métodos Matemáticos Aplicados a Ciencias, SIMMAC, una actividad que se realiza cada dos años y que, según se mencionó en el discurso de inauguración, ha crecido de una decena de expositores a casi 200, tratando diversos temas, a saber: Biomatemáticas, Matemáticas Financieras, Optimización, Investigación de Operaciones, Análisis Numérico, Probabilidad, Estadística, entre otras.

La conferencia inaugural estuvo a cargo de Oldemar Rodriguez y fue titulada como “Relación entre Big Data, minería de datos, análisis de datos y estadística”, donde aclara algunas de las características que definen y diferencian al llamado Big Data de la estadística.

Humor: “turn your data into big data by changing your file extension from xml to csv”
(visto en twitter, fuente no encontrada)

De aquí en adelante me baso en la charla casi literal, de las anotaciones que consideré llamativas, colocándolas en itálicas lo dicho por Rodriguez, y lo que no, es mi complemento o interpretación.

Rodriguez – ¿qué es big data? Suena más a marketing… dicen que si las empresas no se cambian a big data se mueren… que si es sólo una moda.

R – una manera de definirlo es cuando la Cantidad de datos llega a tal punto que SQL no es capaz de procesarlos.

R- Pues para que algo se considere big data, tiene que ser información – que se genera de manera – activa, caracterizada por: volumen, velocidad (de generación de datos),  y su variedad -de tipo de datos.

R- ¿cómo ha evolucionado? En cantidad, por su evolucion exponencial; lo que es grande hoy, no lo será mañana. Desde 1970 a 1990 se le conocía como analisis de datos (exploratory data analysis/ entra SQL). De 1990 a 2000, entra la  olap (online analytic processing), donde cambió la noción de, a partir del cúmulo de datos, hacer una operación cada vez para ahorrar espacio, al ya tener realizada la operación para ahorrar tiempo. Ya despúes del 2000 empieza la transición de llamarse mineria de datos a ser big data.

20160223_113004

El manejo de Big Data necesita conocimientos integrados -“hasta de hackeo”.

R – ¿Quienes usan realmente big data? Las Redes sociales y La Banca.

R – Big data requiere de big analytics. Análisis de datos simbólicos, de transformar o compresionar datos a algo mas manejable. Se cambia de la perspectiva de tener “datos” a tener “un concepto”. Por ejemplo, una persona es el concepto, sus gustos, un banco pasa ya no hablar de transacciones, sino de clientes. A la Banca le interesa también por el concepto de préstamos, para saber si un cliente tiene deudas en otros bancos.

R- Esto empieza a diferenciar a la mineria de datos de la estadística, por transformar datos en conceptos, para una mejor toma de decisiones.  Además, la mineria trata de automatizar el análisis, se cambia a tener una metodología, definir algoritmos matemáticos. Ya no es encontrar un modelo, sino un algoritmo.

R-Otra diferencia de la mineria respecto de la estadística, es que ya no supone un tipo de distribución –por ejemplo, una distribución normal-. También es un distintivo la optimización, interesa más la interpretación, busca ser predictivo más que descriptivo. Se basa en las probabilidades de eventos. Es más, esto se ha vuelto parte de las cláusulas legales –dado que algunas empresas esperan un sí o no

20160223_112353 v2

Rodriguez en la sesión de preguntas acerca de cómo empresas usan el big data: – Google mapea todo el internet cada 15min y lo guarda en sus propios servidores. Cuando uno hace una búsqueda, Google busca en sus servidores. Cuando en los resultados un enlace no funciona, es porque funcionaba cuando Google hizo el mapeo y se cayó en el transcurso de dicho último mapeo.

20160223_112344 v2

Rodriguez también menciona que con el surgimiento del Big Data, varias empresas han empezado a requerir de matemáticos. En esto puedo dar comentario de primera mano pues he visto que algunas empresas han creado -HASTA AHORA- departamentos de investigación y desarrollo, para el análisis de datos. Aunque los datos han sido grandes, me atrevería a decir que aún no llega a los requisitos de ser Big Data per se.

Latinoamérica aún no está consciente de cuánto progreso pueden aportar físicos y matemáticos en casi toda una variedad de áreas, aún se hacen estimaciones “al ojo”, cuando podrían tener más precisión bajo un análisis cuidadoso y, por qué no, científico.

screen-shot-2015-04-23-at-8-41-34-pm1

(chiste obligatorio)

———————————————–

En otros temas, durante el SIMMAC expondré brevemente de la investigación que junto a la Dra. P. Pennigton estamos realizando respecto al Mal de Chagas, que también escribí algo para la #CienciaLatina de la Red Latinoamericana de Blogs de Ciencias, RedLBC.

Hasta pronto.

*Quedo debiendo una segunda parte acerca de wavelets, de repente quedé sin inspiración en ese entonces, y esperaré a que vuelta para hablar de ello en su momento.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: