大数据常用架构和技术

问题描述:

大数据常用架构和技术
1个回答 分类:大数据 2024-05-22 10:57:33

问题解答:

我来补答

传统大数据架构 之所以叫传统大数据架构,是因为其定位是为了解决传统BI的问题。 优点:简单,易懂,对于BI系统来说,基本思想没有发生变化,变化的仅仅是技术选型,用大数据架构替换掉BI的组件。

五种大数据处理架构大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。 虽然处理数据所需的计算能力或存... 五种大数据处理架构大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。

3 Storm Storm是 Twitter 主推的分布式计算系统。 它在Hadoop的基础上提供了实时运算的特性,可以实时的处理大数据流。 不同于Hadoop和Spark,Storm不进行数据的收集和存储工作,它直接通过网络实时的接受数据并且实时的处理数据,然后直接通过网络实时的传回结果。

  通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。 结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。 最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件或记录的固定字段中。 相对应的,没有固定结构不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、、XML、HTML、各类报表、图像和/信息等等。

剩余:2000