#title Hadoop 설치하기 [[TableOfContents]] http://blog.naver.com/gsk1047?Redirect=Log&logNo=113239580 ==== 하둡 이란 ==== 하둡은 아파치의 오픈 소스 프로젝트(http://hadoop.apache.org/) 중의 하나로 확자성 있는 분산 컴퓨팅 오픈 소스 소프트웨어 라고 정의되어 있다. 또한 여러 가지 하둡 프로젝트 들이 많은데 HBase, Pig, ZooKeeper, Hive 등이 그것이다. ==== 하둡 설치 하기 ==== 하둡은 일단 리눅스 환경에서 설치가 가능하다 내부적으로 리눅스 명령어들을 사용하기 때문이다. 따라서 윈도우 환경이라도 리눅스 명령어를 사용하는 환경이라면 설치가 가능 하다. 여기서는 우분투 서버 버전을 기준으로 설치 해 보도록 하겠다. 가장 첫번째로 자바를 설치 해야 한다. 하둡 프레임 워크 자체가 자바로 만들어져 있기 때문이다. 하지만 하둡은 C++나 루비, 파이선을 지원한다. 그럼 이제부터 하둡을 설치 해 보기로 하자. 1. jdk 설치 하기 https://cds.sun.com/is-bin/INTERSHOP.enfinity/WFS/CDS-CDS_SMI-Site/en_US/-/USD/ViewProductDetail-Start?ProductRef=java_ee_sdk-6u1u21-wjdk-oth-JPR@CDS-CDS_SMI hadoop폴더를 만들고 jdk를 다운 받은 후에 압축을 해제 한다. 2. hadoop 설치 하기 http://mirror.apache-kr.org//hadoop/core/ 하둡 패키지를 다운 받고 압축을 해제 한다.역시 만들어둔 hadoop폴더 아래 압축을 해제 하자. 3. 환경변수 설정 하기 bash쉘 환경에서 설정이다. vi ~/.bashrc export JAVA_HOME=jdk 압축을 푼 경로를 지정 한다. export HADOOP_HOME=hadoop 압축을 푼 경로를 지정한다. export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH 이렇게 설정 한다. 설정 파일을 적용 하기 위해서는 . .bashrc 또는 source .bashrc를 수행 한다. 4. 테스트 해 보기 이제 하둡이 잘 실행 되는지 확인 해 보기 위해서 워드 카운트 예제를 돌려 보자. 하둡 설치 폴더로 간다. hadoop jar hadoop-0.20.2-examples.jar wordcount input.txt output 을 수행 하고 나서 output폴도 속의 파일을 확인 해 보자 별에러없이 잘 수행 됐다면 하둡이 잘 설치 된 것이다. 다음 시간에는 클러스터링 환경을 구축해 보도록 하겠다.