Top.Mail.Ru
8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Имплементации алгоритмов для дата-сайентистов

    Курс Имплементации алгоритмов для дата-сайентистов
    Начало курса
    24.08.2024
    Продолжительность
    3 месяца (32+ ак. часов)
    Расписание
    Сб 11:00 - 13:00
    Онлайн
    (13 мест)
    38990 записаться

    Описание курса

    Курс Data Science: имплементации алгоритмов на дата-сайентистов рассчитан на дата-саейнтистов, у которых уже есть опыт и экспертиза в области машинного обучения, но есть желание обладать навыками имплементации алгоритмов описанных в научных статьях.

    Мы обсудим, как выбрать "хорошую" статью, с которой относительно легко начать для новичка: рассмотрим типичную структуру статьи и где находится важная информация. 

    Мы дадим вам пошаговые инструкции, как подойти к реализации статьи, и поделимся знаниями, которые должны помочь вам в имплементации алгоритмов в будущем.

    В курсе по имплементации алгоритмов присутствует большая практическая часть, во время которой мы с вами реализуем ряд алгоритмов машинного обучения основываясь на научных статьях. 

    Вы начнете с наиболее простых и понятных алгоритмов классического машинного обучения, а затем перейдете к глубокому машинному обучению и напишете ряд нейросетей для компьютерного зрения и nlp.


    Кому будет полезен данный курс: 

    • Специалистам по data science и машинному обучению
    • Выпускникам нашей школы в рамках потока data science 

    Чему Вы научитесь:

    • Искать статьи заслуживающие внимания и понимать как их читать
    • Справляться с проблемами которые могут возникнуть в процессе имплементации статьи
    • Правильно интерпретировать результаты статьи
    • Писать собственные реализации уже знакомых вам алгоритмов машинного обучения и понимать как они работают внутри
    • Разбираться в современных архитектурах глубокого обучения и реализовывать их в коде
    • Решать задачи из области CV и NLP

    Требования к участникам курса:

    • Intermediate знание английского
    • Опыт в data science

    Программа

    развернуть

    1. Введение

    • Введение в написание алгоритмов по научным статьям 
    • Как выглядит типичная статья и как она структурирована? Типичная научная статья имеет определенную структуру, и мы попробуем научиться в этом разбираться.
    • Подход к реализации статьи. С какой стороны начинать разбор статьи? Куда смотреть в первую и в последнюю очередь? 
    развернуть

    2. Проблемы

    • Основные проблемы воспроизведения результатов
    • Почему наши результаты отличаются от исследований
    • Неконсистентность терминологии
    • Откуда исследователи всегда знают точное значение параметра Х?
    • Почему все вокруг так много знают?
    развернуть

    3. kNN и линейная регрессия

    • Введение в линейную регрессию и kNN.
    • Математический подход к линейной регрессии и kNN
    • Регуляризация модели и выбор гиперпараметров.
    • Разбор работы алгоритмов "под капотом"
    • Написание собственной имплементации линейной регрессии и kNN.
    развернуть

    4. Градиентный спуск и логистическая регрессия

    • Определение градиентной оптимизации и ее роль в машинном обучении.
    • Основы градиентного спуска
    • Объяснение градиентного спуска как метода поиска минимума функции.
    • Практическая реализация градиентного спуска
    • Написание кода для градиентного спуска с нуля.
    • Применение градиентного спуска к простым моделям.
    • Обзор логистической регрессии и ее применение в классификации.
    • Теоретические основы логистической регрессии
    • Разбор функции потерь и ее роли в обучении.
    • Градиентный спуск в логистической регрессии и его компоненты.
    • Регуляризация и методы оптимизации
    • Обсуждение методов регуляризации для логистической регрессии.
    • Рассмотрение различных методов оптимизации, таких как стохастический градиентный спуск.
    • Практическая реализация логистической регрессии
    развернуть

    5. Решающие деревья и случайный лес

    • Введение в решающие деревья и их роль в машинном обучении.
    • Создание функций для построения деревьев.
    • Изучение методов прунинга для оптимизации дерева.
    • Оценка эффективности дерева на тестовых данных.
    • Обзор теории алгоритма случайного леса.
    • Понимание концепции ансамблей и их преимущества.
    • Написание собственной имплементации случайного леса с использованием Python.
    развернуть

    6. XGBoost

    • Ознакомление с алгоритмом XGBoost и его ролью в машинном обучении.
    • Разбор основных концепций "под капотом".
    • Обсуждение, как параметры и настройки влияют на поведение алгоритма.
    • Примеры изменений параметров и их эффектов.
    • Практическое написание кода для алгоритма XGBoost.
    • Разбор структуры и основных компонентов алгоритма.
    • Загрузка реальных данных и применение собственной имплементации XGBoost.
    • Оценка результатов и сравнение с библиотечной версией XGBoost.
    развернуть

    7. Глубокое обучение CV

    • Обзор основных концепций и задач в CV.
    • Значение сверточных нейронных сетей в обработке изображений.
    • Теория сверточных нейросетей
    • Подробное изучение архитектуры сверточных нейросетей.
    • Разбор основных слоев и операций, используемых в сверточных сетях.
    • Рассмотрение ResNet и Unet
    • Обзор архитектур ResNet и Unet.
    • Понимание их особенностей и областей применения.
    • Практическая реализация на PyTorch
    • Написание собственных реализаций ResNet и Unet с использованием библиотеки PyTorch.
    • Кодирование архитектур сетей и обучение моделей.
    • Обучение на разных датасетах
    развернуть

    8. Генеративно-состязательные нейросети

    • Введение в глубокое обучение и генеративно-состязательные нейронные сети (GAN):
    • Обзор концепции GAN, включая генераторы и дискриминаторы.
    • Примеры практического применения GAN в различных областях.
    • Архитектура CycleGAN и её ключевые компоненты (генераторы, дискриминаторы).
    • Подготовка датасетов для обучения.
    • Обучение CycleGAN с использованием выбранного фреймворка (например, TensorFlow или PyTorch).
    • Оценка результатов обучения, включая метрики качества.
    • Демонстрация практического примера применения CycleGAN с использованием предварительно обученной модели.
    развернуть

    9. Глубокое обучение NLP

    • Обзор проблем, связанных с обработкой естественного языка (NLP).
    • Появление трансформеров как революционного подхода к NLP.
    • Основные принципы работы трансформеров и механизмы внимания.
    • Понимание, что такое Bert и как он отличается от обычных трансформеров.
    • Обзор задач NLP, которые Bert может решать (классификация, вопросно-ответные системы, распознавание именованных сущностей и др.).
    • Примеры успешных применений Bert в реальных задачах.
    • Создание кода для обучения моделей на основе трансформеров и Bert.
    • Fine-tuning предобученных моделей для конкретных задач NLP.
    • Демонстрация примеров кода, иллюстрирующих обучение и использование трансформеров и Bert.
    развернуть

    10. Работа над проектами

    Преподаватели

    Антон

    Ведущий эксперт Data Science в Neoflex

    Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

    Фото с очных занятий в СПб

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!