数据挖掘是什么意思?

时间:2022-05-08 04:22:28

数据挖掘是指从大型数据集里自动搜索隐藏于其中的有着特殊关联的信息的过程。数据挖掘是什么意思?数据挖掘是跨计算机科学和统计学的一个子领域,其价值是使用智能方法从数据集中提取信息,并将信息转换为可理解的结构,以供进一步使用。数据挖掘是数据库知识发现(Knowledge Discovery in Database, KDD)的子过程。

除了数据挖掘,数据库知识发现还涉及数据库管理、数据预处理、频繁模式挖掘、聚类分析、分类、文本分析和可视化等方面。信用评分是数据挖掘在金融领域最成功的应用,可以说信用评分是数据挖掘的“前辈”,因为其出现和应用的时间远早于数据挖掘(数据挖掘的历史还不到30年),信用评分是消费者行为数据方面最早的应用之一。说起信用评分模型,大家就会提起逻辑回归模型,但是实际上信用评分模型的构建过程并不是简单应用逻辑回归之类的预测算法,目前数据挖掘中最常用的技术,包括聚类、分类特征选择、相关性分析以及预测分析等,在信用评分中都得到了成功的应用。图2.4展示了信用评分的基本流程。