1.

Zainstaluj dystrybucję Anaconda i VS Code

Dlaczego to ważne: Prawidłowo skonfigurowane środowisko pozwala na izolację projektów i łatwe zarządzanie bibliotekami AI.

Jak to zrobić:

Pobierz i zainstaluj Anaconda (wersja Open Source).
Zainstaluj Visual Studio Code z rozszerzeniem Python i Jupyter.
Stwórz pierwsze środowisko wirtualne komendą conda create -n ml_basics python=3.10.

Kiedy zadanie jest ukończone: Masz działający edytor VS Code zintegrowany z Jupyter Notebook.

2.

Opanuj podstawy NumPy dla operacji macierzowych

Dlaczego to ważne: Dane w AI to macierze; bez NumPy nie zrozumiesz, jak modele przetwarzają informacje.

Jak to zrobić:

Przećwicz tworzenie tablic (arrays), slicing i broadcasting.
Wykonaj operacje mnożenia macierzy (dot product).
Skup się na wektoryzacji kodu, aby unikać pętli 'for'.

Kiedy zadanie jest ukończone: Potrafisz samodzielnie przekształcić tabelę danych w znormalizowaną macierz NumPy.

3.

Przećwicz manipulację danymi w bibliotece Pandas

Dlaczego to ważne: 80% pracy w ML to czyszczenie danych. Pandas to standard rynkowy.

Jak to zrobić:

Załaduj plik CSV (np. z bazy Titanic).
Wykonaj filtrowanie, grupowanie (groupby) i obsługę brakujących wartości (fillna).
Stwórz nowe cechy (feature engineering) na podstawie istniejących kolumn.

Kiedy zadanie jest ukończone: Wygenerowałeś raport statystyczny z surowego zbioru danych.

4.

Powtórz algebrę liniową i rachunek różniczkowy

Dlaczego to ważne: Algorytmy takie jak Backpropagation opierają się na pochodnych i operacjach na wektorach.

Jak to zrobić:

Obejrzyj serię 'Essence of Linear Algebra' na kanale 3Blue1Brown.
Zrozum pojęcie gradientu i jego rolę w optymalizacji funkcji kosztu.
Skup się na intuicji, a nie na ręcznym liczeniu skomplikowanych całek.

Kiedy zadanie jest ukończone: Potrafisz wyjaśnić, czym jest gradient i jak wpływa na wagę modelu.

5.

Zapisz się na 'Machine Learning Specialization' (Andrew Ng)

Dlaczego to ważne: To absolutnie najlepszy kurs dla początkujących na Coursera, łączący intuicję z matematyką.

Jak to zrobić:

Wybierz opcję 'Audit', jeśli nie potrzebujesz certyfikatu (jest wtedy darmowy).
Skup się na pierwszej części: Regresja i Klasyfikacja.
Rób notatki z wyjaśnień Andrew Ng dotyczących 'intuicji' algorytmów.

Kiedy zadanie jest ukończone: Masz dostęp do materiałów kursu i harmonogram nauki.

6.

Zaimplementuj regresję liniową od zera w Pythonie

Dlaczego to ważne: Zrozumienie mechanizmu 'pod maską' buduje głęboką wiedzę, której nie daje samo użycie gotowych bibliotek.

Jak to zrobić:

Napisz funkcję kosztu (Mean Squared Error).
Napisz algorytm Gradient Descent do aktualizacji wag.
Przetestuj model na prostym zbiorze danych (np. ceny mieszkań).

Kiedy zadanie jest ukończone: Twój własny kod minimalizuje błąd predykcji bez użycia Scikit-learn.

7.

Ukończ moduł o sieciach neuronowych na Coursera

Dlaczego to ważne: Sieci neuronowe to fundament współczesnego Deep Learningu.

Jak to zrobić:

Zrozum funkcje aktywacji (ReLU, Sigmoid, Softmax).
Przejdź przez laboratoria w TensorFlow/Keras zawarte w kursie.
Zwróć uwagę na proces regularyzacji (Dropout, L2), aby uniknąć overfittingu.

Kiedy zadanie jest ukończone: Rozumiesz architekturę prostej sieci typu Feed-forward.

8.

Przerób kurs 'Practical Deep Learning for Coders' (fast.ai)

Dlaczego to ważne: Fast.ai uczy podejścia 'top-down' – najpierw budujesz działający model, potem zgłębiasz teorię. Idealne uzupełnienie dla Coursera.

Jak to zrobić:

Obejrzyj pierwsze 3 lekcje wersji 2024/2025.
Użyj biblioteki fastai do stworzenia klasyfikatora obrazów w 5 liniach kodu.
Wykorzystaj Google Colab dla darmowego GPU.

Kiedy zadanie jest ukończone: Wytrenowałeś model rozpoznający np. rasy psów z dokładnością >90%.

9.

Weź udział w konkursie 'Titanic' na Kaggle

Dlaczego to ważne: Kaggle to poligon doświadczalny dla każdego data scientisty. Konkurs Titanic uczy klasyfikacji binarnej.

Jak to zrobić:

Pobierz dane z Kaggle.
Zastosuj model Random Forest ze Scikit-learn.
Prześlij swój plik predykcji (submission.csv) i sprawdź miejsce w rankingu.

Kiedy zadanie jest ukończone: Twoje nazwisko widnieje na tablicy wyników (Leaderboard).

10.

Stwórz repozytorium GitHub z projektami

Dlaczego to ważne: Kod, którego nie widać, nie istnieje dla rekrutera.

Jak to zrobić:

Załóż konto na GitHub.
Dodaj swoje notebooki z kursów, ale oczyść je i dodaj opisy w plikach README.
Użyj formatu: Problem -> Rozwiązanie -> Wyniki.

Kiedy zadanie jest ukończone: Masz publiczne portfolio z co najmniej 3 różnymi projektami ML.

11.

Przeczytaj 'Hands-On Machine Learning' (Aurélien Géron)

Dlaczego to ważne: To 'biblia' praktycznego ML. Wyjaśnia aspekty inżynieryjne, których brakuje w kursach wideo.

Jak to zrobić:

Skup się na rozdziałach o Scikit-learn (część 1).
Przeanalizuj rozdział o End-to-End Machine Learning Project.
Czytaj ok. 20 stron dziennie, testując kod w Jupyterze.

Kiedy zadanie jest ukończone: Przeczytałeś pierwsze 10 rozdziałów i rozumiesz cykl życia projektu ML.

12.

Zbuduj fiszki (Anki) z kluczowymi pojęciami

Dlaczego to ważne: Metoda Active Recall zapobiega zapominaniu definicji takich jak Bias-Variance Tradeoff czy F1-Score.

Jak to zrobić:

Stwórz talie kart dla: Statystyki, Algorytmów Klasycznych i Deep Learningu.
Codziennie poświęcaj 10 minut na powtórkę.

Kiedy zadanie jest ukończone: Masz bazę min. 100 kart i utrzymujesz passę powtórek przez 7 dni.

13.

Zrozum architekturę Transformer (podstawa ChatGPT)

Dlaczego to ważne: Obecnie rynek AI jest zdominowany przez modele językowe (LLM). Musisz wiedzieć, jak działa mechanizm Attention.

Jak to zrobić:

Przeczytaj artykuł 'Attention Is All You Need' (wersja uproszczona na blogu Jay Alammar).
Obejrzyj tutorial Andreja Karpathy'ego 'Let's build GPT: from scratch'.

Kiedy zadanie jest ukończone: Potrafisz narysować schemat blokowy Transformera i wyjaśnić rolę Self-Attention.

14.

Wykonaj projekt końcowy: Własny model na własnych danych

Dlaczego to ważne: Rozwiązanie unikalnego problemu (np. analiza Twoich wydatków lub predykcja pogody w Twoim mieście) pokazuje najwyższy stopień samodzielności.

Jak to zrobić:

Zbierz dane (web scraping lub API).
Przeprowadź pełny proces: EDA, czyszczenie, modelowanie, ewaluacja.
Opisz wnioski: co zadziałało, a co nie.

Kiedy zadanie jest ukończone: Masz działający model, który rozwiązuje realny, nietrywialny problem.

Szkolenia AI i machine learning

Projekt-Plan