腾讯大讲堂59-数据蕴含商机,挖掘决胜千里(PPT下载)
几个基本概念
模型(Model) vs 模式(Pattern)
数据挖掘的根本目的就是把样本数据中隐含的结构泛化(Generalize)到总体(Population)上去
模型:对数据集的一种全局性的整体特征的描述或概括,适用于数据空间中的所有点,例如聚类分析
模式:对数据集的一种局部性的有限特征的描述或概括,适用于数据空间的一个子集,例如关联分析
数据挖掘的根本目的就是把样本数据中隐含的结构泛化(Generalize)到总体(Population)上去
模型:对数据集的一种全局性的整体特征的描述或概括,适用于数据空间中的所有点,例如聚类分析
模式:对数据集的一种局部性的有限特征的描述或概括,适用于数据空间的一个子集,例如关联分析
算法(Algorithm):一个定义完备(well-defined)的过程,它以数据作为输入并产生模型或模式形式的输出
描述型挖掘(Descriptive) vs 预测型挖掘(Predictive)
描述型挖掘:对数据进行概括,以方便的形式呈现数据的重要特征
预测型挖掘:根据观察到的对象特征值来预测它的其他特征值
描述型挖掘可以是目的,也可以是手段
描述型挖掘:对数据进行概括,以方便的形式呈现数据的重要特征
预测型挖掘:根据观察到的对象特征值来预测它的其他特征值
描述型挖掘可以是目的,也可以是手段