怎样用windows eclipse 编程hadoop

如题所述

1、目标:
在三台ubuntu上搭建hadoop开发环境;
在windows下利用Eclipse访问ubuntu下的hadoop环境,进行开发;
2、软硬件要求:
软件: hadoop-0.20.2 ,jdk-1.6 ,操作系统 ubuntu10.10 , Eclipse3.7 ;
硬件:3台装有ubuntu系统的机器(我使用的是在一台windows xp下利用 VMware workstation 安装了三台ubuntu虚拟机)
3台ubuntu虚拟器使用相同的用户名和密码 如我的用户名都是matt,
3、ubuntu上搭建hadoop环境
(这一步我直接省略,在网上有很多参考),搭建好后的配置文件如下:
core-site.xml
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/matt/HadoopInstall/tmp</value>
<description>A base for other temporary directories.</description>
</property>
<!-- file system properties -->
<property>
<name>fs.default.name</name>
<value>hdfs://tiger:9000</value>
</property>
</configuration>
mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>tiger:9001</value>
</property>
</configuration>
hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>
4、在windows上安装eclipse3.7,
首先先进行windows系统参数设置,进入C:\WINDOWS\system32\drivers\etc 将hosts中加入主机名与对应Ip的关系
tiger 192.168.200.195
lion 192.168.200.196
wolf 192.168.200.197
(这三台分别是我的三台ubuntu虚拟机的主机名和对应的IP,可以参考我之前写的日志VMware虚拟机与主机共享上网的设置)
在官网下载解压eclipse3.7,然后将hadoop插件直接拷到eclipse的plugins里就可以了(hadoop0.20.2自带的hadoop插件只能支持
eclipse3.3.2以下版本,因此这个插件是我在google中搜索的);重启eclipse 通过点击Window -> Open Perspective -> Other 选择、Map/Reduce,图标是个蓝色的象。就可以看到mapreduce视图了;接下来进行设置mapreduce开发环境,在
eclipse下端,控制台旁边会多一个Tab,叫“Map/Reduce Locations”,在下面空白的地方点右键,选择“New Hadoop location...”,
弹出配置框

其中Location name可以随便起,Map/Reduce Master要与你的mapered-site.xml对应,DFS与core-site.xml对应,User name是
unbuntu中搭建hadoop环境的用户名;接下来设置advanced parameter,里面主要注意的是 hadoop.tmp.dir(要与配置文件中的临时
目录一致) 和 hadoop.job.ugi(hadoop环境的用户名和组名 在这里就是 matt ,matt)这个变量名可能在刚开始时不存在,没有关系
先配置好其他的,确认保存。这时打开project Explorer就可以看到DFS Location了

如果在第一次没有hadoop.job.ugi变量的配置时在/hadoop/mapred/system下你是没有查看权限的 也就是查看不
到/matt/HadoopInstall/tmp这个目录,也不能进行删除文件操作,这时再打开advanced parameter,将值配置为上面提到的对应值就
好了(matt,matt);到这里整个配置部分就ok了;
5、运行第一个程序wordcount
在 project Explorer中右键->new ->mapreduce project 然后点击 configure Hadoop install directory 浏览到 hadoop0.20.2文件夹
下,这样project就会自动把hadoop下的jar包导入到工程,然后把hadoop自带的wordcount源码复制到project src目录下(注意包名要
一致)然后右键 Run As -> Run configuration ,弹出配置窗口单击左边的javap Application 选择WordCount程序,然后在右侧的
Arguments Program arguments 中配置运行参数(hdfs://tiger:9000/user/matt/input hdfs://tiger:9000/user/matt/output 分别对应程
序输入目录和输出目录)点击apply,然后再在wordcount上右键 ->run on hadoop 程序就能运行并在eclipse中打印日志信息了。
温馨提示:内容为网友见解,仅供参考
无其他回答

怎样用windows eclipse 编程hadoop
在官网下载解压eclipse3.7,然后将hadoop插件直接拷到eclipse的plugins里就可以了(hadoop0.20.2自带的hadoop插件只能支持 eclipse3.3.2以下版本,因此这个插件是我在google中搜索的);重启eclipse 通过点击Window -> Open Perspective -> Other 选择、Map\/Reduce,图标是个蓝色的象。就可以看到mapreduce视...

window下怎么编译hadoop的源码
a) 进入windows命令行模式,进入到D:\\soft\\hadoop-2.6.4-src\\hadoop-maven-plugins目录,执行"mvn install"命令,如果命令行界面提示:build success"时表示成功:b) 进入到hadoop-2.5.2-src 目录,执行"mvn eclipse:eclipse -DskipTests"命令,如果出现"BUILD SUCCESS"说明hadoop源码编译成功。c) 打...

如何在win7下的eclipse中调试Hadoop2.2.0的程序
出现这个异常,一般是HDFS的路径写的有问题,解决办法,拷贝集群上的core-site.xml和hdfs-site.xml文件,放在eclipse的src根目录下即可。 第四个异常: Java代码 Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava\/lang\/String;I)Z 出现...

在eclipse上怎样安装hadoop详细步骤
1在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统。首先下载VMware-workstation并安装,在Vmware的主页上新建一个虚拟机,一路下一步,直到让选择系统镜像路径,这里选择centos系统映像,然后,需要输入linux的用户名,这个比较重要,最好填写hadoop,因为这个名字在后面要用到好多次。接下来还是...

eclipse安装hadoop插件时没有DFS locations图标,有map\/reduce location...
1、首先重启Eclipse,在【Windows】|【Preferences】目录下,会多出Hadoop Map\/Reduce选项。2、在Eclipse中,选择【Window】|【Preferences】选择“Hadoop Map\/Reduce”,点击【Browse】,选择Hadoop文件夹的路径。3、点击【OK】后,出现Map\/Reduce Locations选项卡。4、出现Map\/Reduce Locations选项卡,如下...

eclipse上开发hadoop上传到DFS上的文件打开没有数据
你先使用命令行查看一下是否有内容:hdfs fs -cat <path>

如何给eclipse安装hadoop插件找不到
1、下载Eclipse解压。2、把hadoop-eclipse-plugin-1.1.2.jar放到eclipse的plugs目录下。我的hadoop集群用的版本:hadoop1.1.2 hadoop0.20以后的版本的安装目录下contrib\/没有eclipse的hadoop-*-eclipse-plugin.jar插件,需要自己用ant编译。源文件在:hadoop-x.y.z\/src\/contrib\/eclipse-plugin 下,...

请教eclipse里面开发Hadoop程序的input怎么设置
下面是一点见解:input代表你要输入的文件:可以替换成你想要用的文件名,一般路径是\/user\/hadoop.output代表你要创建输出文件的名字(每执行一次都要删除,不然会报错,找不到多刷新)user(1)代表该文件夹下有一个文件。如果想看hdfs上的文件,可以在eclipse上看到,但要多刷新,如下图左边文件夹:...

如何用idea能不能远程连接hadoop
1.1 下载hadoop-eclipse-plugin插件 hadoop-eclipse-plugin是一个专门用于eclipse的hadoop插件,可以直接在IDE环境中查看hdfs的目录和文件内容。其源代码托管于github上,官网地址是 https:\/\/github.com\/winghc\/hadoop2x-eclipse-plugin 有兴趣的可以自己下载源码编译,百度一下N多文章,但如果只是使用 https...

window上的myeclipse怎么配置hadoop
步骤:1)将Hadoop-eclipse-Plugin-1.2.1.jar(本文已提供,可自行下载)放到MyEclipse安装目录的dropins文件夹下,重新启动MyEclipse。会发现在Project Explorer下出现DFS Locations.表明MyEclipse已经识别Hadoop-eclipse-Plugin-1.2.1.jar插件。注意:Hadoop-eclipse-Plugin-1.2.1.jar这个jar包在Hadoop-1.2...

相似回答