"Spark"의 두 판 사이의 차이

오픈소스 비즈니스 컨설팅
둘러보기로 가기 검색하러 가기
잔글
16번째 줄: 16번째 줄:
 
=== Spark 설치 ===
 
=== Spark 설치 ===
  
  cd ~
+
Spark 설치
 +
  cd /
 
  mkdir  install
 
  mkdir  install
  cd install
+
  mkdir appl
wget http://apache.mirror.cdnetworks.com/spark/spark-2.3.0/spark-2.3.0-bin-hadoop2.7.tgz
 
 
   
 
   
  cd ~
+
  cd /install
  tar  -xvzf  install/spark-2.3.0-bin-hadoop2.7.tgz
+
wget  http://apache.mirror.cdnetworks.com/spark/spark-2.3.0/spark-2.3.0-bin-hadoop2.7.tgz
 +
 +
cd  /appl
 +
  tar  -xvzf  /install/spark-2.3.0-bin-hadoop2.7.tgz
 
  mv  spark-2.3.0-bin-hadoop2.7  spark
 
  mv  spark-2.3.0-bin-hadoop2.7  spark
 
   
 
   
  cd  spark
+
  cd  /appl/spark
 
  cd  conf
 
  cd  conf
 
  cp  spark-env.sh.template      spark-env.sh
 
  cp  spark-env.sh.template      spark-env.sh
32번째 줄: 35번째 줄:
 
  vi  log4j.properties
 
  vi  log4j.properties
 
     log4j.rootCategory=WARN, console
 
     log4j.rootCategory=WARN, console
 +
 +
Scala 설치
 +
cd  /install
 +
wget  https://downloads.lightbend.com/scala/2.12.3/scala-2.12.3.tgz
 +
cd  /appl
 +
tar  -xvzf  /install/scala-2.12.3.tgz
 +
mv  scala-2.12.3.tgz  scala
  
 
=== 폴더 구성 ===
 
=== 폴더 구성 ===

2018년 4월 26일 (목) 13:41 판

인-메모리 기반의 클러스터 컴퓨팅 프레임워크인 Spark를 정리 합니다.

  • API : Java, Scala, Python, R

Spark 개요

Apach Spark UC 버클리 대학의 AMPLab에서 내놓은 대용량 분산 처리 및 분석용 오픈소스이다. 2014년 2월부터 아파치 재단의 톱 프로젝트가 되었다.

  • 대화형 질의 분석기(Shark), 대용량 그래프 처리 및 분석기(Bagel), 실시간 분석기(Spark Streaming) 등을 함께 제공

Spark 구성

Spark 설치

Spark 설치

cd  /
mkdir  install
mkdir  appl

cd  /install
wget  http://apache.mirror.cdnetworks.com/spark/spark-2.3.0/spark-2.3.0-bin-hadoop2.7.tgz

cd  /appl
tar  -xvzf  /install/spark-2.3.0-bin-hadoop2.7.tgz
mv  spark-2.3.0-bin-hadoop2.7  spark

cd  /appl/spark
cd  conf
cp  spark-env.sh.template      spark-env.sh
cp  log4j.properties.template  log4j.properties
vi  spark-env.sh
vi  log4j.properties
    log4j.rootCategory=WARN, console

Scala 설치

cd  /install
wget  https://downloads.lightbend.com/scala/2.12.3/scala-2.12.3.tgz
cd  /appl
tar  -xvzf  /install/scala-2.12.3.tgz
mv  scala-2.12.3.tgz  scala

폴더 구성

  • R/
  • bin/
  • conf/
  • data/
  • examples/
  • jars/
  • kubernetes/
  • licenses/
  • python/
  • sbin/
  • yarn/

참고 문헌