搜索全部搜索文章搜索资源
Hadoop1.X集群完全分布式模式环境部署
Hadoop1.X集群完全分布式模式环境部署1 Hadoop简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapR......U1312-13 21:36
Hadoop2.x 集群搭建
Hadoop2.x 集群搭建一些重复的细节参考Hadoop1.X集群完全分布式模式环境部署1 HADOOP 集群搭建1.1 集群简介HADOOP 集群具体来说包含两个集群:HDFS 集群和YARN集群,两者逻辑上分离,但物理上常在一起.HD......U3812-13 21:29
Hadoop1.X集群完全分布式模式环境部署
Hadoop1.X集群完全分布式模式环境部署1 Hadoop简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapR......U1312-13 21:29
Hadoop—MapReduce计算气象温度
Hadoop—MapReduce计算气象温度1 运行环境说明1.1 硬软件环境主机操作系统:Mac OS 64 bit ,8G内存虚拟软件:Parallers Desktop12虚拟机操作系统:CentOS 64位,单核,512内存JDK:......U712-13 21:29
【趣学程序】Linux上安装Tengine(Nginx)
linux 安装tenginetengine是什么tengine是由淘宝网发起的Web服务器项目。它在Nginx的基础上,针对大访问量网站的需求,添加了很多高级功能和特性。Tengine的性能和稳定性已经在大型的网站如淘宝网,天猫商城等得到......U4612-13 18:35
PB级数据实现秒级查询ES的安装
什么是ES?ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发......U4812-13 18:35
Etl之HiveSql调优(设置map reduce 的数量)
前言:最近发现hivesql的执行速度特别慢,前面我们已经说明了left和union的优化,下面咱们分析一下增加或者减少reduce的数量来提升hsql的速度。参考:http://www.cnblogs.com/liqiu/p/487323......U3512-07 10:59
is running beyond physical memory limits. Current usage: 2.0 GB of 2 GB physical memory used; 2.6 GB
昨天使用hadoop跑五一的数据,发现报错:Container [pid=47660,containerID=container_1453101066555_4130018_01_000067] is running beyond phys......U3812-07 10:57
elasticsearch + hive环境搭建
一、环境介绍:elasticsearch:2.3.1hive:0.12二、环境搭建2.1 首先获取elasticsearc-hadoop的jar包链接地址:http://jcenter.bintray.com/org/elasticsear......U4112-07 10:57
python + hadoop (案例)
python如何链接hadoop,并且使用hadoop的资源,这篇文章介绍了一个简单的案例!一、python的map/reduce代码首先认为大家已经对haoop已经有了很多的了解,那么需要建立mapper和reducer,分别代码如下:1......U312-07 10:57
从架构特点到功能缺陷,重新认识分析型分布式数据库
写在前面本文是分布式数据库的总纲文章的第一部分,主要探讨分析性分布式数据库的发展和技术差异;第二部分则是交易性数据库的一些关键特性分析。Ivan开始计划的分布式数据库是不含分析场景的,所以严格来说本篇算是番外篇,后续待条件具备将以独立主题的......U512-07 10:02
spark之Standalone模式部署配置详解
spark运行模式Spark 有很多种模式,最简单就是单机本地模式,还有单机伪分布式模式,复杂的则运行在集群中,目前能很好的运行在 Yarn和 Mesos 中,当然 Spark 还有自带的 Standalone 模式,对于大多数情况 Sta......U112-06 08:45
从HDFS架构和设计看Hadoop和云计算的关系
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的......U3712-05 09:12
WOT2016黄慧攀:海量日志处理可以不用Hadoop或Spark
4月14-15日在北京珠三角JW万豪酒店,51CTO将举办WOT互联网运维与开发者峰会。WOT秉承专注技术,服务技术人群的理念,自 2012年首次举办以来,历经4届,积累了大量的技术资源,成为广大技术从业者和技术爱好者一致认可的技术分享大会......U712-05 09:08
Hadoop MapReduce如何进行WordCount自主编译运行
上次我们已经搭建了Hadoop的伪分布式环境,并且运行了一下Hadoop自带的例子–WordCount程序,展现良好。但是大多数时候还是得自己写程序,编译,打包,然后运行的,所以做一次自编译打包运行的实验。U2812-05 09:01