您的位置:知识库 » 标签为“Hadoop”的文章
当前排序:阅读数 按发布时间
英文原文:How to beat the CAP theorem CAP 定理是数据系统设计的基本理论,目前几乎所有的数据系统的设计都遵循了这个定理。但 CAP 定理给目前的数据系统带......
作者: Nathan Marz   2011-12-09 13:43:58 阅读:10667 标签:CAP 数据库 Hadoop Twitter
英文原文:The Log: What every software engineer should know about real-time data's unifying abstraction 我在六年前的一个令人兴奋的时刻加入到LinkedIn公司。从那个时候开始我们就破解单一的、集中式...
作者: Jay Kreps   2015-04-10 18:51:56 阅读:10272 标签:大数据 LinkedIn Hadoop
阿里巴巴作为国内使用Hadoop最早的公司之一,已开启了Apache Hadoop 2.0时代。阿里巴巴的Hadoop集群,即云梯集群,分为存储与计算两个模块,计算模块既有MRv1,也有YARN集群,它们共享一个存储HDFS集群。云梯YARN集群上既支持MapReduce,也支持Spark、MP...
作者: 沈洪   2014-01-16 20:56:55 阅读:8973 标签:阿里巴巴 云梯 Hadoop
引言 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞...
2013-01-30 14:19:50 阅读:8915 标签:Hadoop 文件系统
生活中,可能所有人都间接用过他的作品,他是 Lucene、Nutch 、Hadoop 等项目的发起人。是他,把高深莫测的搜索技术形成产品,贡献给普罗大众;还是他,打造了目前在云计算和大数据领域里如日中天的 Hadoop。他是某种意义上的盗火者,他就是 Doug Cutting。 从实习生做起 ...
作者: 徐威龙   2013-10-03 12:10:50 阅读:8448 标签:Hadoop
文/张巡 在说Hadoop之前,作为一个铁杆粉丝先粉一下Google。Google的伟大之处不仅在于它建立了一个强悍的搜索引擎,它还创造了几项革命性的技术:GFS,MapRedu......
作者: 张巡   2010-12-01 12:01:08 阅读:3827 标签:Hadoop
Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架,借助于 Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。本文将介绍 MapReduce 计算模型,分布式并行计算等基本概念,以及 Hadoop 的安装部署和基本运行方法。
作者: 曹羽中   2010-09-03 06:59:49 阅读:3081 标签:Hadoop 云计算
Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架,借助于 Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。在本文中,详细介绍了如何针对一个具体的并行计算任务,基于 Hadoop 编写程序,如何使用 IBM MapReduce Tools 在 Eclipse 环境中编译并运行 Hadoop 程序。
作者: 曹羽中   2010-09-03 10:48:33 阅读:3037 标签:Hadoop 开源
Apache Hadoop是一个用于构建大规模,共享存储和计算基础设施的软件框架,Hadoop集群经常用于各种研究和开发项目,如Yahoo!,eBay,Facebook,Twitter等互联网公司就......
2010-12-06 10:21:12 阅读:2139 标签:Apache Hadoop 反模式
近日,Yahoo! Hadoop Map-Reduce开发团队领导Arun Murthy展示了针对Hadoop的重新设计过的核心Map-Reduce架构,旨在简化升级、支持更大的集群、更快的恢复,还要支持除......
作者: Ron Bodkin   2011-03-22 11:41:12 阅读:1345 标签:Hadoop