Adresaci szkolenia

Administratorzy systemów odpowiedzialni za zarządzanie klastrami Hadoop

Cel szkolenia

Kurs ten zawiera podstawowe informacje nt wdrażania klastrów Apache™ Hadoop®. W trakcie szkolenia każdy z uczestników stworzy swój własny klaster Hadoop używając dystrybucji CDH (Cloudera’s Distribution, wraz z Apache Hadoop) lub Hortonworks Data Platform. Główne usługi Hadoop zostaną omówione w szczegółach wraz ze sposobami rozwiązywania problemów oraz przywracania funkcjonalności po awarii klastra. Szkolenie dostarcza także fundamentalnej wiedzy nt usług takich jak Ambari, Zookeeper, Pig, Hive, HBase, Sqoop, Flume, oraz Oozie.

Główne korzyści
Po szkoleniu uczestnicy zdobędą wiedzę i umiejętności:

  • niezbędne do poprawnego wdrażania i zarządzania klastrami Hadoop

Wymagania

Uczestnicy powinni posiadać wiedzę pozwalającą na biegłe i komfortowe posługiwanie się komendami w systemie Linux, nie jest wymagane wcześniejsze doświadczenie z klastrami Hadoop

Parametry szkolenia

3*8 godzin (3*7 godzin netto) wykładów i warsztatów.

Wielkość grupy: maks. 8-10 osób.

Program szkolenia

Moduł 1: "Big Data", the big picture

  • Centralna architektura Hadoop: HDFS, MapReduce
  • Dystrybucje Hadoop: Cloudera, MapR, Hortonworks
  • Ekosystem Hadoop: Ambari, Pig, Hive, Zookeeper, HBase, Sqoop, Flume, Oozie


Moduł 2: HDFS

  • Projekt i działanie: NameNode oraz Secondary NameNode, Meta-data storage oraz aktualizacje, Data storage oraz przepływy
  • Planowanie i tworzenie: Założenia wydajnościowe, ładowanie i zarządzanie plikami danych, udoskonalanie działania


Moduł 3: MapReduce

  • Historia i teoria działania
  • Implementacja Apache Hadoop: Jobtracker, Tasktrackers , DataNodes


Moduł 4: Autentykacja i Autoryzacja

  • Użytkownicy Hadoop
  • HDFS: Właściciele plików i uprawnienia



Moduł 5: Kolejkowanie w MapReduce

  • FIFO
  • Fair


Moduł 6: Monitorowanie i obsługa klastra

  • Dodawanie i usuwanie węzłów DataNodes
  • Monitorowanie i balansowanie w HDFS storage
  • Statusy Jobtracker i Tasktracker


Moduł 7: Rozwiązywanie problemów

  • Wolne i długie wykonywanie zadań
  • Lokalizacja i wykorzystanie plików log
  • Przywracanie po awarii
  • Rebalansowanie klastra

Pytania?

* Wymagane.


Konsultant on-line
Skorzystaj z usług naszego konsultanta on-line.
Naciśnij przycisk ‘Skorzystaj’ aby przejść do okienka czatu
Kontakt
ul. Nowogrodzka 62c
02-002 Warszawa
Telefon +48 22 2035600
Fax +48 22 2035601
Email