Данный курс является практическим руководством для специалистов, которым предстоит столкнуться в рабочих задачах с методами машинного обучения. В курсе будет рассказано о формализации таких задачах и современных подходах к их решению. Большое внимание в курсе уделено практической реализации методов ML на языке Python.
Продолжительность: 6 дней, 24 академических часа.
Соотношение теории к практике 50/50
Теоретическая часть: основные понятия; классификация задач, решаемых с помощью методов машинного обучения; виды данных, понятие датасета. (1,5 часа)
Практическая часть: первичный анализ датасета, предобработка данных, сквозной пример решения задачи машинного обучения. (2,5 часа)
2. Базовые методы решения задач классификации и регрессииТеоретическая часть: определение и примеры задач классификации и регрессии. Линейные методы. Деревья решений. Проблема переобучения. Основные проблемы с данными. (1,5 часа)
Практическая часть: решение задач классификации и регрессии линейными методами и методами на основе деревьев решений. Подбор гиперпараметров. Примеры переобученных моделей. (2,5 часа)
3. Продвинутые методы решения задач классификации и регрессииТеоретическая часть: Стэкинг, бэггинг. Градиентные бустинги на примере LightGBM, xgboost, catboost. GridSearch для подбора гиперпараметров. AutoML. (1,5 часа)
Практическая часть: подбор гиперпараметров по сетке значений для базовых алгоритмов. Разбор кейсов по обучению моделей градиентного бустинга. (2,5 часа)
4. Продвинутые методы обработки данных и работа с признаковым пространствомТеоретическая часть: Тематика обучения без учителя – кластеризация, понижение размерности. Визуализация и формирование гипотез о данных. Feature Engineering и Feature extraction. (1,5 часа)
Практическая часть: примеры решения задач кластеризации и понижения размерности. Feature Engineering для улучшения качества работы ML моделей. (2,5 часа)
5. Нейронные сети для решения задач машинного обученияТеоретическая часть: нейронные сети, задачи CV, NLP. Предобученные сети, файнтюнинг. (1,5 часа)
Практическая часть: Примеры решения задач классификации изображений и текстов. Применение полносвязных сетей для решения задач классификации и регрессии. Сравнение с алгоритмами бустинга. (2,5 часа)
6. Практическое руководство по реализации моделей машинного обученияТеоретическая часть: сохранение результатов экспериментов и версионирование моделей и датасетов. Воспроизводимость экспериментов. Форматы сериализации моделей и пути продуктивизации: функциональная обертка, REST API сервис. Лучшие практики. (1,5 часа)
Практическая часть: создание веб-сервиса на фреймворке FastApi. Демонстрация MLFlow и AirFlow. (2,5 часа)
Вы будете получать информацию о предстоящих мероприятиях в онлайне в выбранных категориях.
Обещаем, никакого спама! Вы сможете отписаться в любое время.