8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Машинное обучение для начинающих

    Курс Машинное обучение для начинающих
    Начало курса
    12.06.2024
    Продолжительность
    2,5 месяца (50+ ак. часов)
    Расписание
    Ср 19:00 - 21:00
    Сб 11:00 - 13:00
    Онлайн
    (10 мест)
    Единовременно 52990 записаться
    В рассрочку / мес26500 записаться

    Описание курса

    Курс "Машинное обучение для начинающих" рассчитан на обучение с нуля для тех, кто хочет освоить профессию ML-инженера / дата-сайнтиста, при этом не планирует погружаться в deep learning. 

    На начальном этапе все участники получат стартовые знания по Python для того, чтобы успешно справиться с обучением и пройти его до конца.

    На курсе мы рассмотрим различные типы задач машинного обучения, включая классификацию, регрессию, кластеризацию и обнаружение выбросов. Вы также познакомимся с основными алгоритмами машинного обучения, такими как линейная регрессия, метод опорных векторов, деревья решений, случайные леса и ансамбли. 

    Будут рассмотрены различные подходы к оценке моделей и выбору подходящих метрик для оценки качества модели.

    Будем решать задачи и строить модели на основе реальных данных, что поможет лучше понять, как применять машинное обучение на практике.


    Кому будет полезен данный курс: 

    • Новичкам в ИТ
    • Аналитикам, чтобы расти и лучше понимать коллег
    • Python-разработчикам, кто хочет перейти в ML или DS
    • Всем ИТ-специалистам, кому необходимы знания и навыки в объёме курса

    Чему Вы научитесь:

    • Использовать Python в ML
    • Использовать современные библиотеки для анализа данных и линейной алгебры
    • Использовать на практике теорию вероятностей и знания статистики
    • Понимать процессы протекающие в машинном обучении используя математический анализ
    • Проводить разведочный анализ данных и инжиниринг данных
    • Использовать как самые простые и ординарные алгоритмы машинного обучения, так и сложные
    • Решать задачи из реальной жизни
    • Не бояться проходить собеседования при поиске работы

    Инструменты и технологии, которые будем использовать на курсе:

    • Python
    • Jupyter Notebook
    • Git и Github
    • pandas
    • numpy
    • sklearn
    • matplotlib и seaborn
    • pytorch

    Требования к участникам курса:

    • Elementary знание английского
    • Хорошее знание школьной программы по математике

    Программа

    развернуть

    1. Введение в Python

    • История языка, его применение и особенности.
    • Установка Python и основные инструменты разработки: Anaconda, Jupyter Notebook, PyCharm.
    • Синтаксис языка: переменные, типы данных, операторы, функции.
    • Условные конструкции и циклы: if-else, for, while.
    • Структуры данных: списки, кортежи, множества, словари.
    • Работа с файлами и директориями: чтение, запись, перемещение и удаление.
    • Обработка исключений: try-except.
    • Модули и пакеты: создание, импорт и использование.
    • ООП в Python: классы, объекты, наследование.
    развернуть

    2. Линейная алгебра, numpy и pandas

    • Введение в линейную алгебру
    • Определения и основные понятия
    • Системы линейных уравнений
    • Матрицы и операции с матрицами
    • Работа с библиотекой NumPy:
    • Создание массивов NumPy
    • Операции над массивами
    • Индексирование и срезы массивов
    • Функции для работы с массивами
    • Работа с библиотекой Pandas
    • Введение в Pandas и структуры данных
    • Создание DataFrame и Series
    • Обработка и очистка данных
    • Сводные таблицы и агрегирование данных
    • Применение линейной алгебры в машинном обучении:
    • Работа с данными с помощью NumPy и Pandas
    развернуть

    3. Введение в статистику и теорию вероятностей

    • Определение понятий статистики и вероятности
    • Общие принципы статистической обработки данных
    • Основные принципы теории вероятностей
    • Описательная статистика
    • Расчет основных характеристик данных: среднее, медиана, мода, дисперсия, стандартное отклонение
    • Вероятность
    • Определение понятия вероятности
    • Расчет вероятности событий
    • Условная вероятность и формула Байеса
    • Распределения вероятностей: дискретные и непрерывные
    • Гипотезы и их проверка
    • Уровень значимости и p-value
    • Корреляционный анализ
    • Корреляция и коэффициент корреляции
    • Построение корреляционной матрицы
    развернуть

    4. Математический анализ

    • Введение в математический анализ
    • Основные понятия математического анализа: функции, пределы, производные, интегралы.
    • Пределы и непрерывность: определение предела функции, свойства пределов функций, непрерывность функции и ее свойства.
    • Производные и дифференцирование: определение производной функции, правила дифференцирования, геометрический смысл производной.
    • Практические задания: решение простых задач по математическому анализу и линейной алгебре с помощью Python и библиотеки NumPy
    развернуть

    5. Градиентная оптимизация

    • Введение в градиентную оптимизацию
    • Что такое оптимизация и зачем она нужна
    • Основы градиентной оптимизации:
    • Что такое градиент и как он используется в оптимизации: простейший пример градиентного спуска
    • Основные методы градиентной оптимизации: градиентный спуск и стохастический градиентный спуск
    • Регуляризация в градиентной оптимизации: L1-регуляризация, L2-регуляризация
    • Применение градиентной оптимизации в машинном обучении
    • Примеры использования градиентной оптимизации в реальных задачах
    развернуть

    6. Разведочный анализ данных

    • Введение в разведочный анализ данных: определение, цели и примеры.
    • Подготовка данных: импорт, очистка, заполнение пропусков и обработка выбросов.
    • Визуализация данных: гистограммы, диаграммы рассеяния, ящики с усами, тепловые карты.
    • Описательные статистики: среднее значение, медиана, мода, стандартное отклонение.
    • Корреляционный анализ: коэффициент корреляции, матрица корреляции.
    • Предварительный анализ данных: анализ распределения признаков, обнаружение выбросов, проверка гипотез.
    • Интерактивный разведочный анализ данных: использование библиотек Python, таких как Pandas, Matplotlib и Seaborn.
    • Примеры применения разведочного анализа данных в реальных проектах.
    развернуть

    7. Введение в машинное обучение и k-Nearest Neighbors (k-NN)

    • Введение в машинное обучение: определение, цели и примеры.
    • Типы задач машинного обучения: классификация, регрессия и кластеризация.
    • Основные понятия машинного обучения: признаки, метки, обучение с учителем и без учителя.
    • Метод k-NN: определение, основные шаги и примеры.
    • Примеры использования метода k-NN в реальных проектах.
    • Разбиение выборки на обучающую и тестовую части: определение, стратегии и примеры.
    • Оценка качества модели: метрики точности, полноты, F1-меры и ROC-кривой.
    развернуть

    8. Линейная регрессия 

    • Введение в линейную регрессию: определение, цели и примеры.
    • Основные понятия линейной регрессии: зависимая и независимые переменные, коэффициенты регрессии, смещение и дисперсия.
    • Простая линейная регрессия: определение, формула и примеры.
    • Множественная линейная регрессия: определение, формула и примеры.
    • Метод наименьших квадратов: определение, формула и примеры.
    • Обучение модели линейной регрессии: определение, процесс обучения, подбор параметров модели.
    • Оценка качества модели: метрики MAE, MSE, RMSE, R2.
    • Регуляризация модели: L1, L2 регуляризация.
    • Примеры использования линейной регрессии в реальных проектах.
    развернуть

    9. Метод опорных векторов (SVM)

    • Введение в SVM: определение, цели и примеры.
    • Основные понятия SVM: гиперплоскость, опорные векторы, мягкий и жесткий отступы.
    • Линейная SVM: определение, формула и примеры.
    • Ядерная SVM: определение, формула и примеры.
    • Разбиение выборки на обучающую и тестовую: определение, стратегии и примеры.
    • Обучение модели SVM: определение, процесс обучения, подбор параметров модели.
    • Оценка качества модели: метрики точности, полноты, F-мера, ROC-кривая, AUC.
    • Примеры использования SVM в реальных проектах.
    • Регуляризация модели SVM: L1, L2 регуляризация.
    • Практические примеры и упражнения.
    развернуть

    10. Решающие деревья

    • Введение в решающие деревья: определение, цели и примеры.
    • Основные понятия решающих деревьев: узел, лист, корень, глубина дерева, информационный критерий.
    • Классификационные деревья: определение, формула и примеры.
    • Регрессионные деревья: определение, формула и примеры.
    • Процесс обучения решающего дерева: алгоритм построения дерева, критерии информативности, отбор признаков.
    • Практические примеры и упражнения.
    • Ограничения и проблемы решающих деревьев: переобучение, низкая устойчивость к шуму и выбросам.
    • Решение проблем решающих деревьев: отсечение дерева, стрижка дерева, ансамблирование.
    развернуть

    11. Ансамбли: Random Forest, XGBoost, CatBoost, LGBM

    • Введение в ансамбли: определение, цели и примеры.
    • Определение, принцип работы, алгоритм построения.
    • Преимущества и недостатки Random Forest,  XGBoost,  CatBoost,  LightGBM.
    • Сравнение алгоритмов: какой выбрать для конкретной задачи.
    • Bagging, boosting и stacking.
    • Практические примеры и упражнения.
    • Ограничения и проблемы ансамблей.
    • Решение проблем ансамблей: калибровка вероятностей, настройка параметров.
    развернуть

    12. Обучение без учителя: t-SNE, PCA, K-Means

    • Введение в обучение без учителя: определение, цели и примеры.
    • Кластеризация: определение, принцип работы, алгоритмы кластеризации.
    • Примеры задач кластеризации: сегментация покупателей, группировка новостей, идентификация образцов.
    • Размерностьностьность: определение, проблемы, методы сокращения размерности.
    • Метод главных компонент (PCA): определение, принцип работы, алгоритм, примеры применения.
    • t-SNE: определение, принцип работы, алгоритм, примеры применения.
    • K-Means: определение, принцип работы, алгоритм, примеры применения.
    • Оценка качества в обучении без учителя.
    • Недостатки и ограничения методов обучения без учителя.
    • Практические примеры решения задач с помощью обучения без учителя.
    • Обзор инструментов для работы с данными и реализации методов обучения без учителя.
    развернуть

    13. Работа над проектами

    развернуть

    14.  Разбор классических вопросов на собеседовании

    Преподаватели

    Антон

    Ведущий эксперт Data Science в Neoflex

    Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

    Фото с очных занятий в СПб

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!