当前位置 博文首页 > 孙中明:Hadoop基础-01-基本概念
https://blog.csdn.net/jankin6/category_10362674.html
源码见 https://github.com/hiszm/hadoop-train
有一天,一名美国男子闯入他家附近的一家TARGET,抗议道:“你们竟然给我17岁的女儿发婴儿尿片和童车的优惠券,你们这是赤裸裸的侮辱,我要起诉你们!”
店铺经理立刻跑出来承认错误,迷惑的经理到最后也没明白,到底发生了什么
一个月后,这名男子来TARGET道歉
因为他后来才知道女儿的确怀孕了
这样说来,TARGET比这位父亲知道他女儿怀孕的时间,足足早了一个月。
那么问题来了,TARGET是怎么知道的呢?
这个女孩之前并没有购买过任何的母婴用品
原来,这就是神秘的大数据发挥的作用。
数据采集:Flume sqoop
数据存储:Hadoop
数据处理,分析,挖掘:Hadoop,Spark,Flink
数据可视化:echart
为了应对大数据带来的挑战
Google提供的思路(未开源)
所以开发者根据谷歌的思路构建了Hadoop
cs