二、Hadoop 运行环境搭建

发表于2021-03-31更新于2022-06-05字数统计2.2k阅读时长17分

Hadoop 运行环境搭建

一、Hadoop 组成

发表于2021-03-31更新于2022-06-05字数统计929阅读时长5分

Hadoop 的组成

发表于2021-03-28更新于2022-06-05字数统计2k阅读时长13分

Spark 计算框架为了能够进行高并发和高吞吐的数据处理，封装了三大数据结构，用于处理不同的应用场景。三大数据结构分别是：

接下来我们一起看看这三大数据结构是如何在数据处理中使用的。

发表于2021-03-28更新于2022-06-05字数统计2.2k阅读时长12分

Spark 框架的核心是一个计算引擎，整体来说，它采用了标准 master-slave 的结构。如下图所示，它展示了一个 Spark 执行时的基本结构。图形中的 Driver 表示 master，负责管理整个集群中的作业任务调度。图形中的 Executor 则是 slave，负责实际执行任务。

发表于2021-03-26更新于2022-06-05字数统计4k阅读时长28分

Spark 作为一个数据处理框架和计算引擎，被设计在所有常见的集群环境中运行, 在国内工作中主流的环境为Yarn，不过逐渐容器式环境也慢慢流行起来。接下来，我们就分别看看不同环境下 Spark 的运行。

发表于2021-03-26更新于2022-06-05字数统计353阅读时长4分

Scala常见操作总结

发表于2021-03-26更新于2022-06-05字数统计445阅读时长3分

推荐先了解一下hashCode、identityHashCode、equals和==的原理，再来看Scala中==、eq与equals的区别

发表于2021-03-26更新于2022-06-05字数统计3k阅读时长21分

Spark快速入门

发表于2021-03-26更新于2022-06-05字数统计1k阅读时长7分

Scala编程之递归思想

发表于2021-03-26更新于2022-06-05字数统计4.1k阅读时长30分

Scala之函数式编程（高级部分）