Wizja komputerowa i Deep Learning
Opis szkolenia
Szkolenie dla osób znających język Python, którzy chcą rozwinąć swoje umiejętności w kontekście wizji komputerowej i uczenia głębokiego. Uczestnicy przez całe szkolenie pracować będą na rzeczywistym zbiorze danych, po kolei realizując ćwiczenia, składające się finalnie na pełny projekt.
Informacje podstawowe
- Miejsce szkolenia: Rzeszów/zdalnie
- Liczba osób w grupie: 5-8
- Koszt szkolenia: 1600 zł netto
- Czas trwania: 2 dni (14 godzin zegarowych)
- Terminy: sprawdź w formularzu rejestracji poniżej
- Napoje i słodki poczęstunek w cenie
- Certyfikat ukończenia szkolenia
Plan szkolenia
Dzień I
- Wprowadzenie do wizji komputerowej
- Definicja i zastosowania wizji komputerowej
- Przykłady praktyczne: klasyfikacja obrazów, detekcja obiektów, segmentacja
- Podstawowe pojęcia: piksele, kanały kolorów, wymiary obrazów
- Przygotowanie środowiska
- Instalacja PyTorch i torchvision
- Instalacja bibliotek pomocniczych: OpenCV, Pillow, matplotlib
- Sprawdzenie dostępności GPU
- Wczytywanie, wyświetlanie i podstawowa analiza obrazów
- Operacje na obrazach
- Skalowanie, zmiana rozmiaru, przycinanie, obracanie
- Normalizacja i standaryzacja obrazów
- Podstawowe przekształcenia danych (torchvision.transforms)
- Data augmentation – zwiększanie zbioru danych
- Przygotowanie danych
- torch.utils.data.Dataset i DataLoader
- Tworzenie własnych datasetów z obrazów
- Batchowanie, shuffle i podział na zbiory treningowe/walidacyjne/testowe
- Ładowanie predefiniowanych zbiorów danych (MNIST, CIFAR-10, ImageNet)
- Podstawy sieci neuronowych w wizji komputerowej
- Konwolucyjne sieci neuronowe (CNN) – wprowadzenie
- Warstwy CNN: Conv2d, MaxPool2d, AvgPool2d, Linear, aktywacje
- Funkcje strat: CrossEntropyLoss, MSELoss
- Optymalizatory: SGD, Adam
Dzień II
- Trenowanie modeli
- Forward pass i backward pass
- Aktualizacja wag i krok optymalizatora (optimizer.step())
- Obliczanie straty i dokładności
- Zapisywanie i wczytywanie modeli (torch.save, torch.load)
- Ewaluacja i wizualizacja wyników
- Obliczanie dokładności, precyzji, recall, F1-score
- Macierz pomyłek i wizualizacja predykcji
- Analiza wyników na zbiorze testowym
- Wykresy strat i dokładności w czasie trenowania
- Transfer Learning
- Korzystanie z modeli pretrenowanych (torchvision.models)
- Fine-tuning – dostosowanie modelu do własnego zadania
- Feature extraction – wykorzystanie istniejących cech bez trenowania pełnego modelu
- Przykład: ResNet lub VGG do klasyfikacji własnych obrazów
- Detekcja i segmentacja obiektów
- Podstawy detekcji obiektów (Faster R-CNN, YOLO)
- Podstawy segmentacji obrazów (Mask R-CNN)
- Przygotowanie danych i anotacje (bounding box, maski)
- Trenowanie i testowanie modeli detekcji
Wymagania sprzętowe
Uczestnicy szkolenia pracują na własnych laptopach. Przed szkoleniem przesyłamy mailowo informację z instrukcją konfiguracji sprzętu (o ile wymagane). W przypadku problemów z konfiguracją pomagamy bezpośrednio przed rozpoczęciem szkolenia.
Wymagane umiejętności
Podstawowa znajomość:
- obsługi komputera i języka Python
- bibliotek NumPy, Matplotlib
- PyTorch
Rezerwacja szkolenia
Jeśli przystępujesz do szkolenia prywatnie – wypełnij jedynie obowiązkowe pola (imię, nazwisko, adres e-mail i telefon).
W przypadku gdy płatnikiem za szkolenie będzie firma – prosimy o wypełnienie wszystkich pól formularza.
Przed rezerwacją przeczytaj:
