mapreduce共154篇

MySQL  如何利用分片来解决 500 亿数据的存储问题-小浪学习网

MySQL 如何利用分片来解决 500 亿数据的存储问题

这是一个关于我们在多个 MySQL 服务器上分割数据的技术研究。我们在 2012 年年初完成了这个分片方法,它仍是我们今天用来存储核心数据的系统。 在我们讨论如何分割数据之前,让我们先了解一下我...
站长的头像-小浪学习网站长9个月前
3911
Debian Hadoop集群维护有哪些要点-小浪学习网

Debian Hadoop集群维护有哪些要点

Debian Hadoop集群维护的关键点主要涵盖以下几个方面: 网络设置: 确保网络接口的设置正确,包括IP地址、网关和DNS等。在Debian系统中,可以通过编辑 /etc/network/interfaces 文件来调整网络...
站长的头像-小浪学习网站长3个月前
3315
HDFS资源管理怎样实现-小浪学习网

HDFS资源管理怎样实现

HDFS(Hadoop Distributed File System)的资源管理主要借助于YARN(Yet Another Resource Negotiator)来完成。YARN作为Hadoop 2.x版本新增的资源管理模块,承担着集群资源的调度与任务安排的...
站长的头像-小浪学习网站长1个月前
238
CentOS HDFS与YARN集成方式-小浪学习网

CentOS HDFS与YARN集成方式

在centos上整合hdfs(hadoop distributed file system)与yarn(yet another resource negotiator)涵盖了一系列流程,包含前期准备、参数调整及服务开启等环节。以下为完整的整合流程: 前期准...
站长的头像-小浪学习网站长1个月前
3312
Google在构建静态代码分析工具方面的实例分析-小浪学习网

Google在构建静态代码分析工具方面的实例分析

软件bug耗费开发者和软件公司大量的时间和金钱。 以2014年为例,被广泛使用的ssl协议实现中的一个(“goto fail”)bug导致可接受无效的ssl证书,另外一个与日期格式化相关的bug导致twitter的大...
站长的头像-小浪学习网站长11个月前
4110
Debian环境中Hadoop性能调优实践-小浪学习网

Debian环境中Hadoop性能调优实践

提升Debian环境下Hadoop集群性能,需要多方面协同优化,涵盖硬件资源配置、操作系统参数调整、JVM参数设置、Hadoop配置参数微调、数据分区策略、压缩技术应用以及持续监控和动态调整等环节。以...
站长的头像-小浪学习网站长3个月前
3915
Hadoop网络通信如何优化-小浪学习网

Hadoop网络通信如何优化

优化Hadoop网络通信可以从多方面入手,以下是一些关键策略: 1. 硬件优化 升级网络设备:采用高速交换机和路由器,确保网络带宽充足。 增加内存和CPU:提升节点的处理能力,降低网络传输延迟。 ...
站长的头像-小浪学习网站长2个月前
486
HDFS数据压缩如何实现-小浪学习网

HDFS数据压缩如何实现

HDFS(Hadoop Distributed File System)是一个分布式文件系统,用于存储大量数据。为了提高存储效率和减少网络传输开销,HDFS支持数据压缩。以下是HDFS数据压缩的实现方法: 选择合适的压缩算...
站长的头像-小浪学习网站长1个月前
2515
【Hive】hive 数据倾斜、优化策略、hive执行过程、垃圾回收-小浪学习网

【Hive】hive 数据倾斜、优化策略、hive执行过程、垃圾回收

1. 数据倾斜 ​1.1 什么是数据倾斜?由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点Hadoop 框架的特性代码语言:txt复制- 不怕数据大,怕数据倾斜- Jobs 数比较多的作业运行效率...
站长的头像-小浪学习网站长33天前
255
Debian Hadoop资源管理如何实现-小浪学习网

Debian Hadoop资源管理如何实现

本文介绍如何在Debian系统上配置Hadoop资源管理器。 以下步骤涵盖了Hadoop集群的搭建和验证。 一、Hadoop安装与环境配置 首先,在Debian系统上安装Hadoop。 假设您已下载Hadoop 2.7.2安装包,可...
站长的头像-小浪学习网站长4个月前
419