A Data Mining representa a análise de grandes quantidades de informação, de forma a descobrir padrões e criar conhecimento. Para tal, extrai informação de bases de dados e faz uso de estatística, princípios de Machine Learning e Inteligência Artificial.
É capaz de descrever os insights e conhecimento obtido através da análise dos padrões na informação. Além disso, pode usar esse conhecimento para prever padrões futuros. Isto é conseguido através de algoritmos, usando métodos de reconhecimento de padrões como a análise de clusters, deteção de anomalias, dependência de dados, árvores de decisão, modelos de regressão, entre outros.
A quantidade de informação que é possível analisar é surpreendente, e depende bastante do serviço em causa. Por exemplo, é possível saber onde uma pessoa vive, que carro conduz, os países que visitou, as revistas e jornais que lê, os websites que mais utiliza, entre a imensidão de dados que produzimos a cada segundo.
O maior ponto de diferenciação da Data Mining é a capacidade de analisar uma quantidade de dados que seria impossível analisar manualmente. O objetivo é extrair conhecimento dos dados, por isso, o processo deve ser feito de forma mais automatizada possível, para que a análise e tomada de decisão possam ser céleres.
Esta informação é usada pelas empresas de diversas formas, estabelecendo-se diferenças não só entre empresas, mas também dentro das diversas áreas das empresas. Por exemplo, o departamento de marketing consegue beneficiar com a capacidade de personalizar serviços e produtos, e a melhoria da experiência do consumidor. Por sua vez, uma empresa fabril pode usufruir da melhoria da segurança do produto, da identificação de problemas de qualidade e da melhoria de processos operacionais.
Apesar da adoção da Data Mining, existem naturalmente algumas questões sobre a privacidade. As bases de dados comerciais podem conter informação detalhada dos indivíduos, desde os seus registos médicos ou transações bancárias, apenas para nomear alguns exemplos. Por norma, a questão não está na Data Mining em si, visto que esta é um retrato mais geral e não está aprofundado para questões demasiado específicas. A questão principal detém-se com o uso desapropriado ou a divulgação errônea da informação.
A Data Mining mostra-se deste modo como uma forma de ver além da ponta do icebergue de informação e de criar conhecimento útil sobre a mesma.