博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
在eclipse中远程连接并读取数据
阅读量:4188 次
发布时间:2019-05-26

本文共 1316 字,大约阅读时间需要 4 分钟。

如何在eclipse中远程连接并读取数据,在网上搜的代码,大部分说的都比较复杂,其实如果只想连接HDFS读取一些数据话,这个是非常简单的,如果还要在Eclipse上远程提交MapReduce作业,这个就比较麻烦了,需要改动几处hadoop的源码才可以,所以建议初学者,还是在eclipse中,写好MR的类,然后打包成一个jar包上传linux并执行。

下面进入正题,在eclipse上连接hadoop,为了方便建议大家把hadoop里面所有的jar包都整理成一份目录的jar包,默认的hadoop的jar中是分散在\hadoop-2.5.0\share\hadoop目录下的各个子文件夹里,这6个目录分别是common,hdfs,httpfs,mapreduce,tools,yarn,然后把集中起来的jar中,引入项目中。
接下来,我们便可以编写我们的工具类,来读取HDFS上的数据了,注意这里并不需要把hadoop的conf下的配置文件core-site.xml,hdfs-site.xml等拷贝到项目的根目录下,而在网上看到的大部分的文章都说把hadoop的配置文件拷贝下来,其实完全没必要,我们只需要在实例化出来的Configuration中加入HDFS的端口路径即可,其他的除了hadoop的jar包外,任何配置文件都不需要,核心代码如下:

Java代码  
  1. static Configuration conf=new  Configuration();  
  2. static FileSystem fs=null;  
  3. static{  
  4. try {  
  5.     //默认的hadoop的fs.defaultFS的端口号为8020,这里需要跟集群里面的配置一致  
  6.     conf.set("fs.defaultFS","hdfs://dnode1:8020/");    
  7.     fs=FileSystem.get(conf);  
  8. catch (IOException e) {  
  9.     log.error("初始化FileSystem失败!",e);  
  10. }  
  11. }  
static Configuration conf=new  Configuration();	static FileSystem fs=null;	static{	try {		//默认的hadoop的fs.defaultFS的端口号为8020,这里需要跟集群里面的配置一致    	conf.set("fs.defaultFS","hdfs://dnode1:8020/");  		fs=FileSystem.get(conf);	} catch (IOException e) {		log.error("初始化FileSystem失败!",e);	}	}

OK,只需要这简单的一行,我们就可以读取HDFS上的数据了,另外如要注意的是,需要把hadoop的对应的host也配置在win上的host文件里,避免访问文件系统出错,只要上面这一步打通,下面的对于HDFS系统上文件和目录增删改查,以及对文件内容的读取和写入,散仙在这里就不多写了,这个很简单,大家看看FileSystem这个类的Api就能很容易掌握的。

转载地址:http://pxjoi.baihongyu.com/

你可能感兴趣的文章
图解LogCat的用法
查看>>
学习Android界面设计的超级利器HierarchyView.bat
查看>>
众多Android 开源项目推荐,给力工作给力学习
查看>>
Android线程模型和AsyncTask
查看>>
Android Activity和Intent机制
查看>>
Java多线程-阻塞队列BlockingQueue
查看>>
Android动画开发——Animation动画效果
查看>>
webview加载网页的时候在标题栏上显示加载进度
查看>>
Android 配置 OpenCV2.3.1
查看>>
Android pull封装,直接解析xml
查看>>
Eclipse 快捷键
查看>>
launcher修改--launcher架构解析
查看>>
Android之最简单的ImageView加边框方法
查看>>
Windows:Apache与Tomcat集群调优
查看>>
Apache+2Tomcat 集群及调优
查看>>
通向架构师的道路(第三天)之apache性能调优
查看>>
Tomcat性能调优
查看>>
Tomcat集群
查看>>
quartz在集群环境下的最终解决方案
查看>>
ERwin Data Modeler 建模实践
查看>>