#title Hadoop 설치하기
[[TableOfContents]]

http://blog.naver.com/gsk1047?Redirect=Log&logNo=113239580
==== 하둡 이란 ====
하둡은 아파치의 오픈 소스 프로젝트(http://hadoop.apache.org/) 중의 하나로 확자성 있는 분산 컴퓨팅 오픈 소스 소프트웨어 라고 정의되어 있다. 또한 여러 가지 하둡 프로젝트 들이 많은데 HBase, Pig, ZooKeeper, Hive 등이 그것이다. 

==== 하둡 설치 하기 ====
하둡은 일단 리눅스 환경에서 설치가 가능하다 내부적으로 리눅스 명령어들을 사용하기 때문이다. 따라서 윈도우 환경이라도 리눅스 명령어를 사용하는 환경이라면 설치가 가능 하다. 여기서는 우분투 서버 버전을 기준으로 설치 해 보도록 하겠다.
가장 첫번째로 자바를 설치 해야 한다. 하둡 프레임 워크 자체가 자바로 만들어져 있기 때문이다. 하지만 하둡은 C++나 루비, 파이선을 지원한다. 그럼 이제부터 하둡을 설치 해 보기로 하자.

1. jdk 설치 하기
https://cds.sun.com/is-bin/INTERSHOP.enfinity/WFS/CDS-CDS_SMI-Site/en_US/-/USD/ViewProductDetail-Start?ProductRef=java_ee_sdk-6u1u21-wjdk-oth-JPR@CDS-CDS_SMI
hadoop폴더를 만들고 jdk를 다운 받은 후에 압축을 해제 한다.
 
2. hadoop 설치 하기
http://mirror.apache-kr.org//hadoop/core/
하둡 패키지를 다운 받고 압축을 해제 한다.역시 만들어둔 hadoop폴더 아래 압축을 해제 하자.
 
3. 환경변수 설정 하기
bash쉘 환경에서 설정이다.
vi ~/.bashrc 
export JAVA_HOME=jdk 압축을 푼 경로를 지정 한다.
export HADOOP_HOME=hadoop 압축을 푼 경로를 지정한다.
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
이렇게 설정 한다.
설정 파일을 적용 하기 위해서는 
. .bashrc 또는 source .bashrc를 수행 한다.
 
4. 테스트 해 보기
이제 하둡이 잘 실행 되는지 확인 해 보기 위해서 워드 카운트 예제를 돌려 보자.
하둡 설치 폴더로 간다.
 
hadoop jar hadoop-0.20.2-examples.jar wordcount input.txt output

을 수행 하고 나서  output폴도 속의 파일을 확인 해 보자
별에러없이 잘 수행 됐다면 하둡이 잘 설치 된 것이다.
다음 시간에는 클러스터링 환경을 구축해 보도록 하겠다.