Adresaci szkolenia:

Analitycy danych oraz programiści, którzy chcą rozpocząć swoją przygodę z analizą dużych zbiorów danych.

Cel szkolenia:

Przekrojowe szkolenie mające na celu zapoznanie się z narzędziami przeznaczonymi dla analityka big data. Szkolenie skupia się na płynnym wejściu w podstawy każdego narzędzia, tak aby analityk danych mógł w przyszłości bez problemu poruszać się po ekosystemie Hadoop.

Mocne strony szkolenia:

Zapoznanie z wieloma narzędziami i językami programowania, szkolenie ma na celu pokazanie jak łatwo można analizować dane bez użycia konsoli i narzędzi IDE.

Wymagania:

Podstawy SQL, podstawowa umiejętność programowania, najlepiej w: Python, R lub Java

Parametry szkolenia:

Wielkość grupy: maks. 8-10 osób.

Program szkolenia

  1. Wprowadzenie do Big Data
    1. Definicja
    2. Geneza Big Data
    3. Klasyfikacja problemu
    4. Przegląd ekosystemu Hadoop
    5. Dystrybucje Big Data
  2. Wprowadzenie do MapReduce na przykładzie platformy Hadoop
    1. Architektura
    2. HDFS and YARN
    3. Map Reduce Framework
    4. Map Reduce Streaming
    5. Warsztat Map Reduce
  3. Wprowadzenie do analizy danych na przykładzie Hive
    1. Architektura
    2. Tryby pracy
    3. Typy danych
    4. Składnia
    5. Formaty danych
    6. Wydajność
    7. Warsztat Hive
    8. Ładowanie danych
    9. Zapytania
    10. Partycjonowanie
    11. Formaty danych
    12. Silnik przetwarzania
    13. Funkcje okienkowe
    14. UDF
  4. Wprowadzenie do Spark
    1. Architektura
    2. Ekosystem Spark
    3. Transformacje i akcje RDD
    4. Dataframe i SparkSQL
    5. Spark ML
    6. Warsztat
    • RDD
    • Spark SQL
    • Spark ML z wykorzystaniem wybranych algorytmów

Pytania?

* Wymagane.
** Szczegóły promocji w Regulaminie.


Konsultant on-line
Skorzystaj z usług naszego konsultanta on-line.
Naciśnij przycisk ‘Skorzystaj’ aby przejść do okienka czatu
Kontakt
ul. Nowogrodzka 62c
02-002 Warszawa
Telefon +48 22 2035600
Fax +48 22 2035601
Email