Es importante conocer la diferencia entre minería de datos y big data si queremos hablar con propiedad, ya que, aunque los términos se suelen usar de manera indistinta en los grandes medios de comunicación, son diferentes entre sí.
Los dos tienen que ver con la inmensa cantidad de datos que generamos, solo basta ver nuestros discos duros, pero los especialistas en ambas disciplinas se ocupan de cosas diferentes.
¿Qué es la minería de datos?
Si tenemos muchos datos, teras y teras, poseemos una gran cantidad de información, pero nos sirve de poco si no podemos extraer nada útil, buscar patrones, o analizar lo que contienen todos estos archivos.
De forma doméstica, un disco duro de varios teras no nos vale si no podemos hacer búsquedas de información en ellos, pues en este caso no encontraríamos nada o tardaríamos tanto que los archivos no nos serían útiles.
A nivel empresarial, la minería de datos es lo que hacen programas como los ERP o los CRM, que ayudan a tomar decisiones gracias a la información que los empleados van introduciendo, se puede ver el seguimiento a los clientes, conocer cuáles son más rentables, en qué fase dejan de serlo, etc.
Suelen estar en la nube y son escalables, permitiendo que la minería de datos entre en los distintos departamentos conforme se vaya necesitando. Además, ahora se pueden comprar por sectores, por lo que están especializados y dan mejores resultados.
La cantidad de aplicaciones es enorme, y en ellas intervienen disciplinas como la estadística, el aprendizaje automático, las bases de datos, etc., por lo que las personas que se quieren adentrar en ella tienen un largo camino por delante.
Ahora mismo hay formación específica, para la cual conviene tener una buena base de matemáticas y programación, ya que son muy necesarias.
¿Qué es el big data?
Con este concepto nos referimos a los datos en bruto, a cantidades enormes que superan los 30 teras, una cifra a partir de la cual los especialistas hablan de big data, pues cifras menores son muy manejables en la actualidad.
Estos conjuntos de datos tienen en común el volumen, su variabilidad y la velocidad a la que crecen, lo que significa que su captura y gestión con las herramientas que todos conocemos como las bases de datos, es prácticamente imposible.
Es cierto que estos datos se pueden guardar en estas bases, por ejemplo, creando un Excel enorme, pero por su tamaño solo será un almacén sin ningún tipo de utilidad.
Buena parte de estos datos no están estructurados y se producen de forma continua, lo que hace muy complicado poder filtrarlos de manera que nos sirvan, que al fin y al cabo es de lo que se trata.
Así, la tarea de un profesional de este sector es conseguir que los datos sean accesibles, válidos y veraces, que no se corrompan ni se confundan en ningún momento.
Como en el caso anterior, cada vez hay más cursos destinados a formar especialistas en big data, para los cuales se deben tener los mismos conocimientos que en el caso anterior, relacionados con las matemáticas y la programación.
Estos profesionales ahora tienen ante sí grandes retos a los que no hacen frente los que se dedican a la minería de datos, como son los de proteger todas estas cifras y apuntes de los ciberdelincuentes y los de no almacenar los que no sean relevantes para la empresa.
Los piratas informáticos están ávidos de información, pues saben que vale mucho dinero, y las leyes sobre qué datos tienen de nosotros las empresas son cada vez más restrictivas, de manera que hay que tener cuidado.
¿En qué se diferencian la minería de datos y el big data?
Ambos conceptos se relacionan y no se entienden el uno sobre el otro, puesto que no se puede hacer minería si los datos no están accesibles y bien estructurados, de la misma forma que acumular teras y teras de información no vale para nada si no se puede analizar de manera casi automática.
A fin de que quede claro, la diferencia es que mientras en el big data se trata de almacenar datos que se puedan tratar, la minería de datos es la que hace el tratamiento.
De este modo, el big data para pymes y para cualquier otro tipo de empresa es muy útil, ya que permitirá que la toma de decisiones sobre el negocio sea más sencilla que nunca, algo que se puede hacer desde la pantalla del PC.
Existen herramientas específicas a la hora de analizar los datos
Lo bueno de que ambas disciplinas estén tan desarrolladas es que ni siquiera hace falta tener en plantilla a un experto con el fin de que nos ayude, puesto que como hemos visto antes ya existen todo tipo de soluciones en el mercado.
Estos softwares que se ejecutan en la nube son los que se encargan de llevar a cabo toda la analítica, que será más fiable cuando más datos se obtengan, que pueden ser partes de trabajo, horas empleadas por proyectos, clientes, facturación, etc.
Es evidente que las empresas de mayor tamaño sacarán más provecho debido a que generan más información, pero incluso un pequeño autónomo se va a beneficiar del big data y la minería de datos, puesto que, aunque no produce tanta información, es demasiada y no la puede almacenar en su cabeza de ninguna forma.
En resumen, la diferencia entre minería de datos y big data es que mientras la primera los analiza y saca conclusiones, la segunda se encarga de que estén a buen recaudo y guardados de una manera que sean utilizables por cualquier especialista o por la multitud de softwares que hay en el mercado con este fin.