加入收藏 | 设为首页 | 会员中心 | 我要投稿 厦门网 (https://www.xiamenwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

[bigdata-026] 大数据principle No.1~No.4

发布时间:2020-12-31 07:52:22 所属栏目:大数据 来源:网络整理
导读:Principle No.1 只有干净的数据才能进入存储。 这个原则是极其重要。 1. 大数据eco,唯一的优点是处理海量数据,但是工具一般都不完善,藏着各种坑。不像传统数据库和传统功能,完备精致。 2. 最佳的使用方式就是:数据是干净清洁完美的,用大数据工具处理,

Principle No.1 只有干净的数据才能进入存储。


这个原则是极其重要。

1. 大数据eco,唯一的优点是处理海量数据,但是工具一般都不完善,藏着各种坑。不像传统数据库和传统功能,完备精致。


2. 最佳的使用方式就是:数据是干净清洁完美的,用大数据工具处理,性能很爽。


3. 但是,如果你试图用大数据eco做数据清洗,烦死你!


4. 所以,数据务必清洗好了再进入大数据存储,然后再去做计算。


Principle No.2:数据存储用hbase,如果数据永远不需要修改更新,可以考虑存hdfs。


Principle No.3: hive建metadata,impala做计算。


Principle No.4:? 有些人都期望用SQL解决所有问题,给他们SQL吧。

(编辑:厦门网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读