Cele szkolenia

  • Przedstawienie nie-informatykom i nie-programistom podstawowych idei Big Data na pozomie najbardziej ogólnym – Big Data nie w znaczeniu technologii baz danych i generowania zestawień danych z baz typu NoSQL, natomiast Big Data w znaczeniu wykorzystania nowoczesnych narzędzi analitycznych eksploracji danych w celu analizy danych, wyciągania wniosków i podejmowania decyzji procesowych/biznesowych.
  • Prezentacja wybranych metod i narzędzi eksploracji danych.
  • Przykładowe możliwości wykorzystania szeroko rozumianego podejścia Big Data w analizie i doskonaleniu procesów – Big Data w skali firmowo-biznesowej.

Termin i miejsce

Szacunkowy udział części praktycznej

35%

Symbol szkolenia

BDA-P

Program i ćwiczenia

1. Wprowadzenie – Wartość informacji. Definicje Big Data (składowe, cechy charakterystyczne wymiary – internetowy, korporacyjny, firmowy). Informatyczny i informacyjnywymiar Big Data – bazy SQL, bazy NoSQL, portale internetowe, platformy przechowywania danych (Map Reduce, Hadoop), sposoby pozyskiwania informacji z danych (statystyka, eksploracja danych). Cyfryzacja życia w erze Big Data (danetyzacja rzeczywistości – korzyści, zagrożenia, aspekty etyczne, „ciemne strony” Big Data). Specjalista Big Data – badacz danych.

2.Relacyjne bazy danych, hurtownie danych – Definicja relacyjnego modelu danych, organizacja logiczna, właściwości modelu relacyjnego, zasady konstrukcji. Systemy zarządzania relacyjnymi bazami danych, strukturami język zapytań SQL – podstawy składni, przykłady wykorzystania. Hurtownie danych – definicja, rodzaje, możliwości wykorzystania.

3. Analiza danych, wybrane metody eksploracji danych – Praca z danymi, rodzaje danych. Metody, narzędzia: wizualizacja – przedstawienie pojedynczych zmiennych (histogram, box – plot), oczyszczanie danych, przekształcanie danych (normalizacja, standaryzacja) narzędzia do przedstawiania zależności pomiędzy wieloma zmiennymi (wykresy rozrzutu), regresja i korelacja, modele regresji (liniowa, logistyczna), analiza wariancji (ANOVA), tablice wielodzielcze, drzewa decyzyjne, problem obserwacji odstających, asocjacje, grupowanie (algorytmy grupowania), analiza skupień, analiza składowych głównych, analiza czynnikowa.

4.Narzędzia analizy danych – Charakterystyka wybranych środowisk rachunkowych wykorzystywanych w eksploracji danych: Excel, Minitab, JMP, SPSS, QDA.

Ćwiczenia:

  • Konstrukcja i wykorzystanie relacyjnej bazy danych (elementy strukturalnego języka zapytań SQL) – Access.
  • Wizualizacja danych, czyszczenie danych – wykrywania wartości izolowanych, transformacja danych (Excel, Minitab).
  • Analiza wariancji (ANOVA) (Minitab).
  • Analiza regresji i korelacji – regresja wielokrotna liniowa, wybór najlepszego podzbioru predyktorów (zmiennych objaśniających) – Excel, Minitab.
  • Analiza regresji – regresja logistyczna (Minitab).
  • Projektowanie okresów gwarancyjnych (Minitab).
  • Prognozowanie, wygładzanie danych (Excel, Minitab).
  • Analiza czynnikowa (Minitab).
  • Analiza skupień (Minitab).
  • Wykorzystanie techniki kart kontrolnych SPC w analizie danych (Excel, Minitab).
  • Analiza danych procesowych z wykorzystaniem możliwości środowiska QDA

Adresaci

  • ​Specjaliści ds. jakości, inżynierowie jakości.
  • Inżynierowie procesu, technolodzy.
  • Osoby odpowiedzialne za jakość dostawców, pracownicy działów współpracujących z klientem.
  • Członkowie zespołów realizujących projekty doskonalące, analitycy zajmujący się analizą i przetwarzaniem danych.

Korzyści dla uczestnika

Uczestnik uczy się:

  • Identyfikować zapotrzebowanie na analizy z zakresu Big Data.
  • Naczym polegają podstawowe metody eksploracji danych.
  • Jakie środowiska rachunkowe pozwalają na eksplorację danych.

Uczestnik dowiaduje się:

  • Co oznacza Big Data – jakie są wymiary i specyfika, skala i właściwości tego podejścia.
  • Jakie korzyści płyną z Big Data – Big Data może pokazać nowe związki między danymi, niewidziane wcześniej tendencje i przyczynić się do wzrostu wiedzy procesowej która może być wykorzystana w doskonaleniu procesu.
  • Jakie środki, narzędzia i środowisko można wykorzystać w zakresie wydobywania wiedzy z danych tj. eksploracji danych.

Informacje dodatkowe

Cena szkolenia obejmuje:

  • udział w szkoleniu, 
  • materiały w formie papierowej, segregator, notatnik, długopis,
  • bezpłatny dostęp do elektronicznych materiałów szkoleniowych w systemie Biblioteka TQMsoft,
  • certyfikat uczestnictwa w szkoleniu,
  • możliwość bezpłatnych 3-miesięcznych konsultacji po szkoleniu, które realizowane są poprzez Panel Konsultacyjny,
  • obiady, przerwy kawowe oraz słodki poczęstunek