La minería de datos es un proceso de análisis de datos que las empresas y los propietarios de negocios utilizan para examinar datos sin procesar, incluidos números de ventas, precios y clientes, para desarrollar mejores estrategias de marketing, mejorar el rendimiento o disminuir los costos de administración del negocio. La minería de datos también sirve para descubrir nuevos patrones de comportamiento entre los consumidores.
Una vez que una empresa analiza los datos relevantes a través de utilidades de administración de bases de datos como SQL Server de Microsoft o Data Mining Suite de Oracle, aplica la información resultante como una forma de predecir los factores futuros relacionados con el negocio. Por ejemplo, las tiendas de comestibles y los supermercados utilizan técnicas de minería de datos para analizar qué consumidores compran qué productos, cuánto gastan en esos productos y cuándo es más probable que gasten. Luego, utilizan la información derivada del proceso para determinar cuándo ofrecer descuentos y cómo dirigir productos a ciertos consumidores en función de sus hábitos de compra. Los entrenadores de algunos equipos de baloncesto, como los Toronto Raptors, utilizan la minería de datos para diseñar un enfoque específico cuando se enfrentan a diferentes equipos.
A partir de 2015, los dos algoritmos más comunes que utilizan las empresas para analizar datos incluyen la regresión y la clasificación. El primero desarrolla una fórmula matemática basada en los datos existentes, lo que permite a las empresas aplicar esa fórmula a un nuevo conjunto de datos para predecir con eficacia el comportamiento futuro, pero solo es útil para datos continuos, incluido el peso, el tiempo o la velocidad. Este último es más adecuado para datos categóricos, incluidos colores, nombres o género.