2025-01-22 – 王子健-Blog

HDFS读写压测针对HDFS 的读写性能进行测试写入压测 hadoop jar share/hadoop/ […]

高可用架构 RM可以选择嵌入基于 Zookeeper 的 ActiveStandbyElector，以决定哪个 […]

调度器的类型在Yarn中有三种调度器可以选择：FIFO Scheduler ，Capacity Schedu […]

队列的定义 YARN 队列类似于工作负载的逻辑分类器，它将集群中的资源分配给不同的用户或应用程序。每个队列可以 […]

参考： https://www.cnblogs.com/liangzilx/p/14837562.html h […]

参考： https://blog.csdn.net/qq_37933018/article/details/1 […]

前置流程：文件大小评估文件格式评估 block块（物理划分） split分片（逻辑划分）首先会获取切片信 […]

不同的分区由不同的reduce来处理，比如： reduce1 只拉取136号段的分区。 reduce2 只拉 […]

Job的创建切片机制 split计算公式：finalSplitSize=max(minSize,min(ma […]

分治一定是要基于大量的数据场景！ MR思想基于HDFS分布式系统的分布式计算引擎，将计算分布在各个不同的 […]

存储形式行式存储适合事务型应用：行式存储对于频繁进行更新和插入操作的事务型应用非常有效，因为每次操作只需要 […]

参考： https://hadoop.apache.org/docs/r3.4.0/hadoop-projec […]

DataNode数据结构一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身， […]

思考思考：NameNode中的元数据是存储在哪里的？首先，我们做个假设，如果存储在NameNode节点的磁 […]

写数据流程写流程前提：副本数：3 写流程之前：会将修改的元数据edits文件，写入到edits_inpro […]

HDFS 概念 Hadoop 分布式文件系统（Hadoop Distributed File System） […]

官网提供的思路希望获得锁的客户端执行以下操作：使用路径名“ locknode/guid-lock-”并设置 […]

服务发现、主机发现、故障转移 💡思路: 将所有节点都注册到severs目录下，然后让程序监听当前所有节点。通 […]

原理在 ZooKeeper 的 Leader 选举过程中，Zab 协议（ZooKeeper Atomic B […]

CAP 理论 CAP 理论，是关于分布式系统中一致性、可用性和分区容错性之间权衡的理论。CAP 理论的三项核心 […]

日度归档：2025-01-22