`
jbm3072
  • 浏览: 209207 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop HDFS权限控制

阅读更多
HDFS支持权限控制,但支持较弱。HDFS的设计是基于POSIX模型的,支持按用户、用户组、其他用户的读写执行控制权限。在linux命令行下,可以使用下面的命令修改文件的权限、文件所有者,文件所属组:
hadoop fs –chmod (修改文件所有者,文件所属组,其他用户的读、写、执行权限)
haddop fs –chown  (修改文件所有者)
hadoop fs –chgrp   (修改文件所属组)
不同用户使用不同的linux帐户即可访问到特定文件。
启动hadoop hdfs系统的用户即为超级用户,可以进行任意的操作。
   需要注意的是:HDFS本身没有提供用户名、用户组的创建,在客户端调用hadoop 的文件操作命令时,hadoop 识别出执行命令所在进程的用户名和用户组,然后使用这个用户名和组来检查文件权限。
用户名=linux命令中的`whoami`,而组名等于`bash -c groups `。
   根据上述原理来看hdfs的文件系统权限管理较弱。如果用户知道hdfs name node 地址和端口号,在安装hdfs客户端后,使用和name node 相同的用户名,即可获取到所有文件的访问权限。
  
   另外,hdfs有一个web 访问方式。可以通过修改参数,来修改webserver启动的用户名和组(配置参数:dfs.web.ugi)。这样通过web方式就只能访问dfs.web.ugi对应用户和组可以访问的文件。
  如果要限制hdfs的web访问,可以考虑为webserver增加一个过滤器. 目前0.23.0通过代码增加一个patch来实现该功能,但0.20.2根据参考文献1描述不支持Kerberos认证。
    
    许多公司对hadoop进行了重新封装,增加了自己的功能。有些公司增加了安全授权这块的模块。下面介绍两种:
第一种:Yahoo! Distribution of Hadoop
hadoop是由yahoo引导开发并贡献到开源社区的。yahoo对hadoop进行了封装,并在http://yahoo.github.com/hadoop-common/ 上以开源的形式对外发布。Hadoop Distribution of Hadoop with security 0.20.104.2 增加了安全的支持,集成了Kerberos 开源授权标准。访问参考文献[3]获取更多关于0.20.104.2版本增加功能的信息
第二种:Cludera's hue (http://cloudera.github.com/hue/)
其依赖于Cloudera's Distribution including Apache Hadoop (CDH)。CDH是一个hadoop工程和子工程的集合。CDH 安装比hadoop的安装简单。linux下输入yum就能安装。访问https://ccp.cloudera.com/display/DOC/Documentation  了解关于CDH更多的信息。CDH也有权限控制和管理的工具。具体这个东西我还没有安装过。
   
参考文献:
[1] http://hadoop.apache.org/common/docs/r0.20.2/hdfs_permissions_guide.html
[2] https://issues.apache.org/jira/browse/HADOOP-7119
[3] http://yahoo.github.com/hadoop-common/
[4] http://yahoo.github.com/hadoop-common/releases/0.20.104.2/ 
[5] http://cloudera.github.com/hue/
0
0
分享到:
评论

相关推荐

    Hadoop HDFS系统双机热备方案

    名字节点负责整个文件系统目录结构、文档权限和文档的扩展属性连同维护整个文档系统的数据一致性和响应客户端的请求。HDFS能够配置两个名字节点服务器,采用active/passive模式,两个服务器采用共享存储的方式来存放...

    apache-ranger-1.2.0.tar Hadoop集群权限框架

    Apache Ranger 支持以下HDP组件的验证、授权、审计、数据加密、安全管理: Apache Hadoop HDFS Apache Hive Apache HBase Apache Storm Apache Knox Apache Solr Apache Kafka YARN

    Hadoop大数据平台构建、HDFS配置、启动与验证教学课件.pptx

    # chmod 777 /opt --修改 /opt 文件夹的权限,使得 hadoop用户可读写 主节点使用 hadoop 用户登录 [root@master ~]# su – hadoop --从root用户切换为hadoop身份 通过 SecureCRT 软件上传 Hadoop安装文件到 /opt ...

    Hadoop从入门到上手企业开发

    003 Linux 环境下基本命令使用及Linux系统中文件的类型和权限 004 Linux 环境下基本命令讲解二 005 Linux 系统远程FTP工具与桌面工具XManager使用和培养三大能力 006 Linux 系统基本命令和基本配置的复习讲解 007 ...

    hadoop3.3.3-winutils

    Hadoop3.x在组成上没有变化Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 (1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每...

    Hadoop官方中文帮助文档1.1.0

    6.HDFS权限指南 7.HDFS配额管理指南 8.命令手册 9.FS Shell使用指南 10.DistCp使用指南 11.Map-Reduce教程 12.Hadoop本地库 13.Streaming 14.Hadoop Archives 15.Hadoop On Demand 另附带 Hadoop API

    eclipse的hadoop插件

    eclipse的hadoop插件,可以在eclipse中直接操作hdfs,比较方便,需要在hdfs-site.xml中设置dfs.permissions.enabled为false,来关闭hdfs的权限验证,将jar放在eclipse软件的dropins文件夹中,重启即可,对于hadoop2.x或...

    实验2 熟悉常用的HDFS操作

    实验2 熟悉常用的HDFS操作 一、实验目的 1. 理解HDFS在Hadoop体系结构中的角色; 2. 熟练使用HDFS操作常用的Shell命令; 3. 熟悉HDFS操作常用的...(4) 显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;

    hadoop高可用搭建

    接着我给hadoop用户设置面免密码权限,也可自行添加其他权限。 chmod +w /etc/sudoers hadoop ALL=(root)NOPASSWD:ALL chmod -w /etc/sudoers 2.2安装JDK  将下载好的安装包解压到 /usr/java/jdk1.7,然后设置...

    徐老师大数据 Hadoop架构完全分析课程 Hadoop入门学习视频教程

    027.Hadoop架构分析之启动脚本分析(数据格式化与hdfs.cmd命令).mp4 028.Hadoop架构分析之启动脚本分析(mapred.cmd和虚拟机参数设置).mp4 029.Hadoop架构分析之启动脚本分析(start-yarn.cmd命令).mp4 030....

    Hadoop实战中文版

    7.2 探查任务特定信息 7.3 划分为多个输出文件 7.4 以数据库作为输入输出 7.5 保持输出的顺序 7.6 小结 第8章 管理Hadoop 8.1 为实际应用设置特定参数值 8.2 系统体检 8.3 权限设置 8.4 配额管理 8.5 启用...

    Hadoop官方中文文档

    Hadoop官方文档,中文手册,介绍Hadoop快速入门,集群搭建,HDFS架构设计、使用、权限、配额管理等,

    HDFS原理图

    此图包含内容:HDFS结构/HDFS运行机制、HDFS优缺点、HDFS架构、HDFS数据存储单元(block)、HDFS设计思想、SNN合并流程、Block的副本放置策略、HDFS读流程、HDFS写流程、HDFS文件权限与安全模式,需要使用viso工具打开...

    hadoop-管理

    首先是用root权限关闭所有节点的防火墙,/etc/init.d/iptables stop 然后启动hadoop集群 来到hadoop的安装路径执行: ./start-all.sh 待到集群全部成功启动之后两分钟之后执行关闭hadoop文件系统的安全模式, ./...

    数据科学导论实验报告 实验1:常用Linux操作和 Hadoop操作

    数据科学导论 实验1:常用Linux操作和 Hadoop操作 1、Linux虚拟机安装和操作 2、Hadoop安装和操作 1)创建Hadoop用户 2)SSH登录权限设置 3)安装Java环境 4)单机安装配置 5)伪分布式安装配置

    Apache Hadoop---Ranger.docx

    Apache Ranger提供一个集中式安全管理框架, 并解决授权和...它可以对Hadoop生态的组件如HDFS、Yarn、Hive、Hbase等进行细粒度的数据访问控制。通过操作Ranger控制台,管理员可以轻松的通过配置策略来控制用户访问权限。

    实验2常用的HDFS操作.doc

    (4)显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息 (5)给定HDFS中某一个目录,输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息,如果该文件是目录,则递归输出该目录下所有文件...

    大数据云计算技术系列 Hadoop之Hbase简介(共19页).pdf

    History ...2 面向列:面向列(族)的存储和权限控制,列(族)独立检索。 3 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。 下面一幅图是Hbase在Hadoop Ecosystem中的位置。

    hdfs_permissions_guide

    云计算Hadoop平台权限指导Hadoop permission guide

    java查看函数源码-BigDataArchitect:大数据架构师

    java查看函数源码 BigDataArchitect 注意: ...6. hadoop-HDFS权限、企业级搭建、idea+maven开发HDFS 7. hadoop-MapReduce原理精讲、轻松入门 8. hadoop-MapReduce调度原理,Yarn原理 9. hadoop-MapRed

Global site tag (gtag.js) - Google Analytics