Szkolenia AI i machine learning
Jakie kursy AI i machine learning wybrać jako początkujący – Coursera, edX, fast.ai?
Projekt-Plan
Dlaczego to ważne: Prawidłowo skonfigurowane środowisko pozwala na izolację projektów i łatwe zarządzanie bibliotekami AI.
Jak to zrobić:
- Pobierz i zainstaluj Anaconda (wersja Open Source).
- Zainstaluj Visual Studio Code z rozszerzeniem Python i Jupyter.
- Stwórz pierwsze środowisko wirtualne komendą
conda create -n ml_basics python=3.10.
Kiedy zadanie jest ukończone: Masz działający edytor VS Code zintegrowany z Jupyter Notebook.
Dlaczego to ważne: Dane w AI to macierze; bez NumPy nie zrozumiesz, jak modele przetwarzają informacje.
Jak to zrobić:
- Przećwicz tworzenie tablic (arrays), slicing i broadcasting.
- Wykonaj operacje mnożenia macierzy (dot product).
- Skup się na wektoryzacji kodu, aby unikać pętli 'for'.
Kiedy zadanie jest ukończone: Potrafisz samodzielnie przekształcić tabelę danych w znormalizowaną macierz NumPy.
Dlaczego to ważne: 80% pracy w ML to czyszczenie danych. Pandas to standard rynkowy.
Jak to zrobić:
- Załaduj plik CSV (np. z bazy Titanic).
- Wykonaj filtrowanie, grupowanie (groupby) i obsługę brakujących wartości (fillna).
- Stwórz nowe cechy (feature engineering) na podstawie istniejących kolumn.
Kiedy zadanie jest ukończone: Wygenerowałeś raport statystyczny z surowego zbioru danych.
Dlaczego to ważne: Algorytmy takie jak Backpropagation opierają się na pochodnych i operacjach na wektorach.
Jak to zrobić:
- Obejrzyj serię 'Essence of Linear Algebra' na kanale 3Blue1Brown.
- Zrozum pojęcie gradientu i jego rolę w optymalizacji funkcji kosztu.
- Skup się na intuicji, a nie na ręcznym liczeniu skomplikowanych całek.
Kiedy zadanie jest ukończone: Potrafisz wyjaśnić, czym jest gradient i jak wpływa na wagę modelu.
Dlaczego to ważne: To absolutnie najlepszy kurs dla początkujących na Coursera, łączący intuicję z matematyką.
Jak to zrobić:
- Wybierz opcję 'Audit', jeśli nie potrzebujesz certyfikatu (jest wtedy darmowy).
- Skup się na pierwszej części: Regresja i Klasyfikacja.
- Rób notatki z wyjaśnień Andrew Ng dotyczących 'intuicji' algorytmów.
Kiedy zadanie jest ukończone: Masz dostęp do materiałów kursu i harmonogram nauki.
Dlaczego to ważne: Zrozumienie mechanizmu 'pod maską' buduje głęboką wiedzę, której nie daje samo użycie gotowych bibliotek.
Jak to zrobić:
- Napisz funkcję kosztu (Mean Squared Error).
- Napisz algorytm Gradient Descent do aktualizacji wag.
- Przetestuj model na prostym zbiorze danych (np. ceny mieszkań).
Kiedy zadanie jest ukończone: Twój własny kod minimalizuje błąd predykcji bez użycia Scikit-learn.
Dlaczego to ważne: Sieci neuronowe to fundament współczesnego Deep Learningu.
Jak to zrobić:
- Zrozum funkcje aktywacji (ReLU, Sigmoid, Softmax).
- Przejdź przez laboratoria w TensorFlow/Keras zawarte w kursie.
- Zwróć uwagę na proces regularyzacji (Dropout, L2), aby uniknąć overfittingu.
Kiedy zadanie jest ukończone: Rozumiesz architekturę prostej sieci typu Feed-forward.
Dlaczego to ważne: Fast.ai uczy podejścia 'top-down' – najpierw budujesz działający model, potem zgłębiasz teorię. Idealne uzupełnienie dla Coursera.
Jak to zrobić:
- Obejrzyj pierwsze 3 lekcje wersji 2024/2025.
- Użyj biblioteki fastai do stworzenia klasyfikatora obrazów w 5 liniach kodu.
- Wykorzystaj Google Colab dla darmowego GPU.
Kiedy zadanie jest ukończone: Wytrenowałeś model rozpoznający np. rasy psów z dokładnością >90%.
Dlaczego to ważne: Kaggle to poligon doświadczalny dla każdego data scientisty. Konkurs Titanic uczy klasyfikacji binarnej.
Jak to zrobić:
- Pobierz dane z Kaggle.
- Zastosuj model Random Forest ze Scikit-learn.
- Prześlij swój plik predykcji (submission.csv) i sprawdź miejsce w rankingu.
Kiedy zadanie jest ukończone: Twoje nazwisko widnieje na tablicy wyników (Leaderboard).
Dlaczego to ważne: Kod, którego nie widać, nie istnieje dla rekrutera.
Jak to zrobić:
- Załóż konto na GitHub.
- Dodaj swoje notebooki z kursów, ale oczyść je i dodaj opisy w plikach README.
- Użyj formatu: Problem -> Rozwiązanie -> Wyniki.
Kiedy zadanie jest ukończone: Masz publiczne portfolio z co najmniej 3 różnymi projektami ML.
Dlaczego to ważne: To 'biblia' praktycznego ML. Wyjaśnia aspekty inżynieryjne, których brakuje w kursach wideo.
Jak to zrobić:
- Skup się na rozdziałach o Scikit-learn (część 1).
- Przeanalizuj rozdział o End-to-End Machine Learning Project.
- Czytaj ok. 20 stron dziennie, testując kod w Jupyterze.
Kiedy zadanie jest ukończone: Przeczytałeś pierwsze 10 rozdziałów i rozumiesz cykl życia projektu ML.
Dlaczego to ważne: Metoda Active Recall zapobiega zapominaniu definicji takich jak Bias-Variance Tradeoff czy F1-Score.
Jak to zrobić:
- Stwórz talie kart dla: Statystyki, Algorytmów Klasycznych i Deep Learningu.
- Codziennie poświęcaj 10 minut na powtórkę.
Kiedy zadanie jest ukończone: Masz bazę min. 100 kart i utrzymujesz passę powtórek przez 7 dni.
Dlaczego to ważne: Obecnie rynek AI jest zdominowany przez modele językowe (LLM). Musisz wiedzieć, jak działa mechanizm Attention.
Jak to zrobić:
- Przeczytaj artykuł 'Attention Is All You Need' (wersja uproszczona na blogu Jay Alammar).
- Obejrzyj tutorial Andreja Karpathy'ego 'Let's build GPT: from scratch'.
Kiedy zadanie jest ukończone: Potrafisz narysować schemat blokowy Transformera i wyjaśnić rolę Self-Attention.
Dlaczego to ważne: Rozwiązanie unikalnego problemu (np. analiza Twoich wydatków lub predykcja pogody w Twoim mieście) pokazuje najwyższy stopień samodzielności.
Jak to zrobić:
- Zbierz dane (web scraping lub API).
- Przeprowadź pełny proces: EDA, czyszczenie, modelowanie, ewaluacja.
- Opisz wnioski: co zadziałało, a co nie.
Kiedy zadanie jest ukończone: Masz działający model, który rozwiązuje realny, nietrywialny problem.