Data analyst – ścieżka kariery
Jak zostać analitykiem danych – wymagane umiejętności, kursy, narzędzia?
Projekt-Plan
Dlaczego: Branża danych jest szeroka; musisz wiedzieć, czy celujesz w analitykę biznesową (BI), produktową czy finansową.
Jak:
- Przeczytaj o różnicach między Data Analyst, Business Analyst i Data Scientist.
- Wybierz jedną domenę (np. E-commerce lub Finanse), która Cię interesuje.
- Sprawdź raporty płacowe (np. No Fluff Jobs) dla wybranej roli.
Gotowe, gdy: Masz wybraną jedną konkretną ścieżkę specjalizacji.
Dlaczego: Bez zrozumienia rozkładów i miar tendencji centralnej nie zinterpretujesz poprawnie żadnego zbioru danych.
Jak:
- Naucz się obliczać średnią, medianę, modę oraz odchylenie standardowe.
- Zrozum pojęcie rozkładu normalnego i wartości odstających (outliers).
- Wykorzystaj darmowe zasoby Khan Academy (dział Statistics).
Gotowe, gdy: Potrafisz wyjaśnić różnicę między średnią a medianą na przykładzie zarobków.
Dlaczego: To klucz do wyciągania wniosków, które nie są dziełem przypadku (istotność statystyczna).
Jak:
- Zrozum pojęcie p-value oraz błędu I i II rodzaju.
- Naucz się podstawowych testów: t-test oraz Chi-kwadrat.
- Przeczytaj artykuły o testach A/B w biznesie.
Gotowe, gdy: Rozumiesz, kiedy wynik analizy jest statystycznie istotny.
Dlaczego: Analityk, który nie potrafi sprzedać swoich wniosków, jest bezużyteczny dla biznesu.
Jak:
- Skup się na rozdziałach o usuwaniu zbędnych elementów z wykresów (clutter).
- Naucz się kierować wzrokiem odbiorcy za pomocą kontrastu.
- Zastosuj zasadę 'pre-attentive attributes'.
Gotowe, gdy: Przeczytana książka i wynotowane 5 zasad tworzenia czytelnych wykresów.
Dlaczego: Excel to wciąż najpopularniejsze narzędzie do szybkiej ad-hoc analizy w firmach.
Jak:
- Opanuj funkcje wyszukiwania: XLOOKUP (następca VLOOKUP).
- Naucz się tworzyć tabele przestawne (Pivot Tables) i fragmentatory.
- Poznaj Power Query do automatyzacji czyszczenia danych.
Gotowe, gdy: Potrafisz połączyć dwa pliki CSV i stworzyć z nich raport przestawny w 10 minut.
Dlaczego: SQL to absolutny fundament (wymagany w 90% ofert). PostgreSQL to standard rynkowy.
Jak:
- Pobierz i zainstaluj PostgreSQL Server.
- Zainstaluj DBeaver (darmowy, uniwersalny klient SQL).
- Załaduj przykładową bazę danych (np. 'DVD Rental' lub 'Northwind').
Gotowe, gdy: Masz działające połączenie z lokalną bazą danych.
Dlaczego: Musisz umieć samodzielnie wyciągać dane z baz bez pomocy programistów.
Jak:
- Ćwicz klauzule: SELECT, FROM, WHERE, GROUP BY, HAVING.
- Opanuj łączenie tabel: INNER JOIN, LEFT JOIN.
- Korzystaj z platformy SQLZoo lub Mode Analytics do darmowych ćwiczeń.
Gotowe, gdy: Piszesz zapytania łączące 3 tabele z agregacją danych.
Dlaczego: To te umiejętności odróżniają juniora od samodzielnego analityka w 2025 roku.
Jak:
- Naucz się pisać czytelny kod za pomocą CTE (WITH clause).
- Opanuj funkcje okna: RANK(), ROW_NUMBER(), SUM() OVER().
- Zrozum różnicę między podzapytaniem a CTE.
Gotowe, gdy: Potrafisz obliczyć średnią kroczącą sprzedaży za pomocą SQL.
Dlaczego: Python pozwala na zaawansowaną statystykę i automatyzację, której nie zrobi Excel.
Jak:
- Zainstaluj dystrybucję Anaconda lub samo środowisko VS Code z rozszerzeniem Python.
- Uruchom pierwszy Jupyter Notebook.
- Zainstaluj biblioteki: pandas, numpy, matplotlib, seaborn.
Gotowe, gdy: Wyświetlasz 'Hello World' w komórce Jupyter Notebook.
Dlaczego: Pandas to 'Excel na sterydach' i standard w pracy z danymi w Pythonie.
Jak:
- Naucz się wczytywać pliki (read_csv).
- Opanuj filtrowanie, grupowanie (groupby) i merge'owanie DataFrame'ów.
- Przerób darmowy kurs 'Kaggle Learn: Pandas'.
Gotowe, gdy: Potrafisz wyczyścić zbiór danych z brakujących wartości (NaN) w Pythonie.
Dlaczego: Narzędzia BI służą do tworzenia dashboardów, które monitoruje zarząd firmy.
Jak:
- Pobierz darmową wersję Power BI Desktop ze strony Microsoft.
- Zaimportuj prosty plik Excel.
- Stwórz pierwszy wykres słupkowy i kołowy.
Gotowe, gdy: Masz zainstalowane narzędzie i wyświetlasz w nim dane z Excela.
Dlaczego: Musisz pracować na realnych, 'brudnych' danych, aby pokazać proces myślowy.
Jak:
- Wejdź na kaggle.com i znajdź zbiór dotyczący np. sprzedaży e-commerce lub churnu klientów.
- Pobierz pliki CSV.
- Przeczytaj dokumentację kolumn (metadata).
Gotowe, gdy: Masz wybrany i pobrany zbiór danych do pierwszego projektu.
Dlaczego: 80% pracy analityka to czyszczenie danych. Pokaż, że to potrafisz.
Jak:
- Usuń duplikaty i obsłuż brakujące dane.
- Znormalizuj formaty dat i tekstu.
- Udokumentuj każdy krok w pliku README na GitHubie.
Gotowe, gdy: Masz czysty zbiór danych gotowy do analizy.
Dlaczego: To Twój główny 'produkt' wizualny dla rekrutera.
Jak:
- Wykorzystaj wyczyszczone dane.
- Dodaj filtry (daty, regiony, kategorie).
- Zastosuj zasady storytellingu (najważniejsze KPI na górze po lewej).
Gotowe, gdy: Dashboard jest gotowy i opublikowany (np. jako PDF lub link do Power BI Service).
Dlaczego: GitHub to Twoje techniczne CV. Rekruterzy sprawdzają tam jakość Twojego kodu.
Jak:
- Stwórz nowe repozytorium.
- Dodaj pliki .sql lub .ipynb.
- Napisz profesjonalne README: Cel projektu, użyte narzędzia, wnioski biznesowe.
Gotowe, gdy: Link do projektu jest publicznie dostępny.
Dlaczego: Większość ofert w IT/Data przechodzi przez LinkedIn.
Jak:
- Dodaj słowa kluczowe: SQL, Python, Power BI, Data Visualization.
- W sekcji 'Featured' dodaj link do swojego portfolio na GitHub.
- Ustaw status 'Open to work' (widoczny tylko dla rekruterów).
Gotowe, gdy: Profil zawiera wszystkie kluczowe skille i link do projektów.
Dlaczego: Relacje budują karierę szybciej niż same aplikacje.
Jak:
- Znajdź 5 osób pracujących jako Data Analyst w firmach, które Cię interesują.
- Wyślij spersonalizowane zaproszenia (bez prośby o pracę, z pytaniem o ich ścieżkę).
- Dołącz do grup tematycznych (np. 'Data Science PL').
Gotowe, gdy: Wysłano 5 spersonalizowanych wiadomości.
Dlaczego: Musisz wiedzieć, czego brakuje w Twoim arsenale, by celnie aplikować.
Jak:
- Przejrzyj 10 ogłoszeń na Junior Data Analyst.
- Wypisz powtarzające się wymagania, których jeszcze nie spełniasz.
- Zaplanuj naukę tych braków na kolejne 2 tygodnie.
Gotowe, gdy: Masz listę 3 konkretnych tematów do nadrobienia.
Dlaczego: Test SQL to standardowy etap rekrutacji. Musisz pisać kod pod presją czasu.
Jak:
- Rozwiązuj zadania na LeetCode (sekcja Database) lub HackerRank.
- Powtórz różnice między WHERE a HAVING.
- Przećwicz pisanie zapytań na kartce (whiteboarding).
Gotowe, gdy: Rozwiązujesz zadania 'Easy' i 'Medium' na LeetCode bez zaglądania do dokumentacji.
Dlaczego: Masowe wysyłanie CV nie działa. Jakość wygrywa z ilością.
Jak:
- Do każdej aplikacji dołącz krótki list motywacyjny (lub wiadomość na LinkedIn).
- Wskaż, jak Twoje projekty z portfolio rozwiązują problemy danej firmy.
- Śledź statusy aplikacji w prostym arkuszu Excel.
Gotowe, gdy: Wysłano 5 dopracowanych aplikacji w bieżącym tygodniu.