数据挖掘其实就是对数据仓库进行挖掘 (相关性就像铁锹和土堆 自己理解) 数据仓库属于后台工作 数据挖掘大部分属于前台工作
有些小项目为了节省开支,数据仓库和数据挖掘都是同一批人做 ,这时候你绕不开
有些大型项目各部门工作划分的很明显 数据仓库工作归数据建模人员做 数据挖掘归数据展现人员做 这个时候自然可以绕开
你知道这些语言的话就具备条件了,不过你需要学习一些bi的工具(了解cube、追溯、下探等原理)。现在国内做数据挖掘效果不好,因为国内几乎所有的信息通信产业它不是以业务为驱动的,技术人员和业务人员/决策人员之间的鸿沟无法逾越,往往都是业务/决策人员要看什么了,技术人员去做(技术人员也同样缺乏业务的敏锐度,导致它们不知道什么样的组合数据是有价值的,不知道价值链在哪里)。国内没有企业能做到这一点,但是这恰恰是数据挖掘的核心所在。目前国内的数据挖掘大多都是简单的照搬国外的多年以前的东西,楼上说到算法。。。我想说的是在国内没有滋生这种健康的环境,搞学术有时间接触,企业中几乎没有需要在算法上做深究了,都是成熟的别人的东西。。。。
数据仓库一般用于传统的企业,这里面的数据是经过清洗的,在5-10年,甚至更长时间内是不变的,用于后续的数据挖掘和分析用。
数据挖掘主要集中在挖掘和分析上,不过前期也需要ETL,但是要不要放入数据仓库里与具体应用有关了
替楼上补充,数据仓库可以让高级DBA来代替,但是数据挖掘就不行了,有算法问题。
你可以把数据仓库看成矿山,而数据挖掘就是采矿。