8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Дата сайентист. Интенсив

    Курс Дата сайентист. Интенсив
    Начало курса
    22.05.2024
    Продолжительность
    3,5 месяца (70+ ак. часов)
    Расписание
    Ср 19:00 - 21:00
    Сб 11:00 - 13:00
    Онлайн
    (11 мест)
    Единовременно 68990 записаться
    В рассрочку / мес23000 записаться

    Описание курса

    Курс "Дата сайентист. Интенсив" ориентирован на всех, кто хочет освоить новую профессию в интенсивном формате. Начальных знаний программирования на Python не требуется, в начале у нас будет достаточно большой модуль по изучению языка программирования Python, где мы изучим достаточные для старта основы, научимся работать с Jupyter Notebook и Github.

    Программа обучения содержит большое количество практических задач на закрепление знаний, а также различных мини-проектов. 

    На практических занятиях будем знакомиться с реальными примерами и задачами из области data science и машинного обучения, используя популярные библиотеки и фреймворки, также будем решать различные задачи, начиная от базовых, таких как классификация и регрессия, до более сложных, таких как обработка естественного языка, обучение без учителя, глубокое обучение и т.д.
     
    Целью курса "Дата сайентист. Интенсив" является получение студентами знаний, навыков, а также реального опыта работы со стеком технологий, данными и алгоритмами, которые необходимы на позиции Data Scientist. 

    В конце курса разберем самые популярные вопросы на собеседованиях.


    После окончания курса Вы сможете: 

      • выбирать и применять различные алгоритмы машинного обучения в зависимости от задачи
      • работать с данными, проводить их предобработку и анализ
      • использовать библиотеки Python для решения задач машинного обучения
      • понимать основные концепции и методы линейной алгебры, статистики и теории вероятностей, необходимые для понимания работы алгоритмов машинного обучения
      • уметь решать задачи классификации, регрессии и кластеризации
      • использовать методы регуляризации и оптимизации для улучшения качества моделей
      • применять ансамблирование для повышения точности моделей
      • работать с данными изображений и использовать сверточные нейросети для решения задач компьютерного зрения
      • работать с нейросетями, использовать transfer learning, решать задачи обработки текста с помощью BERT и классического машинного обучения

    Инструменты и технологии, которые будем использовать на курсе:

      • Python
      • Jupyter Notebook
      • Git и Github
      • pandas
      • numpy
      • sklearn
      • matplotlib и seaborn
      • pytorch

    Требования к участникам курса:

      • Начальных знаний не требуется, всему будем обучать с нуля

    Программа

    развернуть

    1. Введение в DS. Основы Python

    • Установка Python и основных инструментов разработки: Anaconda, Jupyter Notebook, PyCharm.
    • Синтаксис языка: переменные, типы данных, операторы, функции.
    • Условные конструкции и циклы: if-else, for, while.
    • Структуры данных: списки, кортежи, множества, словари.
    • Работа с файлами и директориями: чтение, запись, перемещение и удаление.
    • Обработка исключений: try-except.
    • Модули и пакеты: создание, импорт и использование.
    • ООП в Python: классы, объекты, наследование.
    • Каждая тема будет сопровождаться практическими заданиями для закрепления полученных знаний и умений.
    развернуть

    2. Линейная алгебра, numpy и pandas

    • Введение в линейную алгебру
    • Определения и основные понятия
    • Системы линейных уравнений
    • Матрицы и операции с матрицами
    • Работа с библиотекой NumPy:
    • Создание массивов NumPy
    • Операции над массивами
    • Индексирование и срезы массивов
    • Функции для работы с массивами
    • Работа с библиотекой Pandas
    • Введение в Pandas и структуры данных
    • Создание DataFrame и Series
    • Обработка и очистка данных
    • Сводные таблицы и агрегирование данных
    • Применение линейной алгебры в машинном обучении:
    • Работа с данными с помощью NumPy и Pandas
    развернуть

    3. Введение в статистику и теорию вероятностей

    • Определение понятий статистики и вероятности
    • Общие принципы статистической обработки данных
    • Основные принципы теории вероятностей
    • Описательная статистика
    • Расчет основных характеристик данных: среднее, медиана, мода, дисперсия, стандартное отклонение
    • Вероятность
    • Определение понятия вероятности
    • Расчет вероятности событий
    • Условная вероятность и формула Байеса
    • Распределения вероятностей: дискретные и непрерывные
    • Гипотезы и их проверка
    • Уровень значимости и p-value
    • Корреляционный анализ
    • Корреляция и коэффициент корреляции
    • Построение корреляционной матрицы
    развернуть

    4. Математический анализ

    • Введение в математический анализ
    • Основные понятия математического анализа: функции, пределы, производные, интегралы.
    • Пределы и непрерывность: определение предела функции, свойства пределов функций, непрерывность функции и ее свойства.
    • Производные и дифференцирование: определение производной функции, правила дифференцирования, геометрический смысл производной.
    • Практические задания: решение простых задач по математическому анализу и линейной алгебре с помощью Python и библиотеки NumPy
    развернуть

    5. Градиентная оптимизация

    • Введение в градиентную оптимизацию
    • Что такое оптимизация и зачем она нужна
    • Основы градиентной оптимизации:
    • Что такое градиент и как он используется в оптимизации: простейший пример градиентного спуска
    • Основные методы градиентной оптимизации: градиентный спуск и стохастический градиентный спуск
    • Регуляризация в градиентной оптимизации: L1-регуляризация, L2-регуляризация
    • Применение градиентной оптимизации в машинном обучении
    • Примеры использования градиентной оптимизации в реальных задачах
    развернуть

    6. Разведочный анализ данных

    • Введение в разведочный анализ данных: определение, цели и примеры.
      • Подготовка данных: импорт, очистка, заполнение пропусков и обработка выбросов.
        • Визуализация данных: гистограммы, диаграммы рассеяния, ящики с усами, тепловые карты.
          • Описательные статистики: среднее значение, медиана, мода, стандартное отклонение.
            • Корреляционный анализ: коэффициент корреляции, матрица корреляции.
              • Предварительный анализ данных: анализ распределения признаков, обнаружение выбросов, проверка гипотез.
                • Интерактивный разведочный анализ данных: использование библиотек Python, таких как Pandas, Matplotlib и Seaborn.
                  • Примеры применения разведочного анализа данных в реальных проектах.
                  развернуть

                  7. Введение в машинное обучение и k-Nearest Neighbors (k-NN)

                  • Введение в машинное обучение: определение, цели и примеры.
                  • Типы задач машинного обучения: классификация, регрессия и кластеризация.
                  • Основные понятия машинного обучения: признаки, метки, обучение с учителем и без учителя.
                  • Метод k-NN: определение, основные шаги и примеры.
                  • Примеры использования метода k-NN в реальных проектах.
                  • Разбиение выборки на обучающую и тестовую части: определение, стратегии и примеры.
                  • Оценка качества модели: метрики точности, полноты, F1-меры и ROC-кривой.
                  развернуть

                  8. Линейная регрессия 

                  • Введение в линейную регрессию: определение, цели и примеры.
                  • Основные понятия линейной регрессии: зависимая и независимые переменные, коэффициенты регрессии, смещение и дисперсия.
                  • Простая линейная регрессия: определение, формула и примеры.
                  • Множественная линейная регрессия: определение, формула и примеры.
                  • Метод наименьших квадратов: определение, формула и примеры.
                  • Обучение модели линейной регрессии: определение, процесс обучения, подбор параметров модели.
                  • Оценка качества модели: метрики MAE, MSE, RMSE, R2.
                  • Регуляризация модели: L1, L2 регуляризация.
                  • Примеры использования линейной регрессии в реальных проектах.
                  развернуть

                  9. Метод опорных векторов (SVM)

                  • Введение в SVM: определение, цели и примеры.
                  • Основные понятия SVM: гиперплоскость, опорные векторы, мягкий и жесткий отступы.
                  • Линейная SVM: определение, формула и примеры.
                  • Ядерная SVM: определение, формула и примеры.
                  • Разбиение выборки на обучающую и тестовую: определение, стратегии и примеры.
                  • Обучение модели SVM: определение, процесс обучения, подбор параметров модели.
                  • Оценка качества модели: метрики точности, полноты, F-мера, ROC-кривая, AUC.
                  • Примеры использования SVM в реальных проектах.
                  • Регуляризация модели SVM: L1, L2 регуляризация.
                  • Практические примеры и упражнения.
                  развернуть

                  10. Решающие деревья

                  • Введение в решающие деревья: определение, цели и примеры.
                  • Основные понятия решающих деревьев: узел, лист, корень, глубина дерева, информационный критерий.
                  • Классификационные деревья: определение, формула и примеры.
                  • Регрессионные деревья: определение, формула и примеры.
                  • Процесс обучения решающего дерева: алгоритм построения дерева, критерии информативности, отбор признаков.
                  • Практические примеры и упражнения.
                  • Ограничения и проблемы решающих деревьев: переобучение, низкая устойчивость к шуму и выбросам.
                  • Решение проблем решающих деревьев: отсечение дерева, стрижка дерева, ансамблирование.
                  развернуть

                  11. Ансамбли: Random Forest, XGBoost, CatBoost, LGBM

                  • Введение в ансамбли: определение, цели и примеры.
                  • Определение, принцип работы, алгоритм построения.
                  • Преимущества и недостатки Random Forest,  XGBoost,  CatBoost,  LightGBM.
                  • Сравнение алгоритмов: какой выбрать для конкретной задачи.
                  • Bagging, boosting и stacking.
                  • Практические примеры и упражнения.
                  • Ограничения и проблемы ансамблей.
                  • Решение проблем ансамблей: калибровка вероятностей, настройка параметров.
                  • Заключение и дискуссия: обсуждение наиболее интересных и важных аспектов ансамблей в машинном обучении.
                  развернуть

                  12. Обучение без учителя: t-SNE, PCA, K-Means

                  • Введение в обучение без учителя: определение, цели и примеры.
                  • Кластеризация: определение, принцип работы, алгоритмы кластеризации.
                  • Примеры задач кластеризации: сегментация покупателей, группировка новостей, идентификация образцов.
                  • Размерностьностьность: определение, проблемы, методы сокращения размерности.
                  • Метод главных компонент (PCA): определение, принцип работы, алгоритм, примеры применения.
                  • t-SNE: определение, принцип работы, алгоритм, примеры применения.
                  • K-Means: определение, принцип работы, алгоритм, примеры применения.
                  • Оценка качества в обучении без учителя.
                  • Недостатки и ограничения методов обучения без учителя.
                  • Практические примеры решения задач с помощью обучения без учителя.
                  • Обзор инструментов для работы с данными и реализации методов обучения без учителя.
                  развернуть

                  13. Введение в нейросети и PyTorch

                  • Введение в нейросети: определение, история, принцип работы.
                  • Примеры задач, решаемых с помощью нейросетей: классификация изображений, распознавание речи, машинный перевод и другие.
                  • Основные компоненты нейросети: слои, функции активации, оптимизаторы и функции потерь.
                  • Введение в PyTorch: история, основные концепции, инструменты и преимущества.
                  • Тензоры в PyTorch: определение, типы, создание и преобразование тензоров.
                  • Операции в PyTorch: математические операции, операции с тензорами, генерация случайных чисел и другие.
                  • Создание и обучение нейросетей с помощью PyTorch: создание модели, определение функции потерь, выбор оптимизатора, обучение модели, оценка результатов.
                  • Обзор других фреймворков для работы с нейросетями: TensorFlow, Keras, Theano, Caffe и другие.
                  • Написание собственной реализации нейронной сети на PyTorch.
                  • Тенденции развития нейросетевых технологий и перспективы их применения в будущем.
                  развернуть

                  14. Сверточные нейронные сети

                  • Введение в сверточные нейронные сети (CNN): определение, принцип работы и примеры применения.
                  • Архитектуры CNN: простые и глубокие модели, архитектура AlexNet, VGG, GoogLeNet, ResNet.
                  • Концепция свертки и пулинга: определение, виды свертки и пулинга, их роль в улучшении качества модели.
                  • Примеры задач, решаемых с помощью CNN: классификация изображений, распознавание лиц, обнаружение объектов и другие.
                  • Регуляризация в нейронных сетях: определение, принцип работы, L1 и L2 регуляризация.
                  • Dropout и Batch Normalization: определение, роль в регуляризации, примеры использования.
                  • Аугментация данных: определение, методы аугментации, их роль в улучшении качества модели.
                  • Обучение CNN с помощью PyTorch: создание модели, определение функции потерь, выбор оптимизатора, обучение модели, оценка результатов.
                  • Примеры решения задач с помощью CNN и PyTorch: классификация изображений с помощью CNN, распознавание лиц с помощью глубоких сверточных нейронных сетей.
                  • Тонкости использования PyTorch для обучения CNN: работа с GPU, сохранение и загрузка моделей, визуализация результатов и отладка.
                  • Обзор других фреймворков для работы с CNN: TensorFlow, Keras, Theano, Caffe и другие.
                  • Реализация своей собственной модели CNN на PyTorch.
                  • Тенденции развития CNN и перспективы их применения в будущем.
                  развернуть

                  15. Transfer Learning

                  • Введение и понятие Transfer Learning
                  • Применение Transfer Learning в различных задачах
                  • Преимущества и недостатки Transfer Learning
                  • Предобученные модели для Computer Vision
                  • Предобученные модели для Natural Language Processing
                  • Fine-tuning предобученных моделей
                  • Реализация Transfer Learning на PyTorch на практике
                  • Практические примеры Transfer Learning в различных областях (Computer Vision, NLP)
                  • Ограничения и риски Transfer Learning в реальных проектах
                  • Best practices для использования Transfer Learning
                  развернуть

                  16. Классическое NLP, эмбеддинги и BERT

                  • Введение в NLP, определение NLP и его применение
                  • Ключевые понятия: токенизация, лемматизация, стемминг, стоп-слова.
                  • Предобработка текста: очистка данных от шума и мусора; токенизация и обработка текста, извлечение признаков из текста.
                  • Векторные представления слов: one-hot encoding, embedding (Word2Vec, fastText, GloVe), Bag-of-Words (BoW), TF-IDF
                  • Рекуррентные нейронные сети (RNN)
                  • Что такое BERT и для чего его используют
                  • Архитектура BERT
                  • Обучение BERT на больших корпусах данных
                  • Примеры применения BERT в NLP.
                  • Использование BERT для классификации текстовых данных и задачи NER
                  • Возможные направления дальнейшего изучения NLP.
                  развернуть

                  17. Деплоймент

                  развернуть

                  18. Разбор классических вопросов на собеседовании

                  Сертификат после обучения
                  По окончании обучения вы получите сертификат. Нас знают и ценят работодатели, поэтому сертификат станет вашим дополнительным преимуществом при трудоустройстве в IT-компанию. 


                  Сертификат о прохождении курса мы отправим вам на почту. Вы легко сможете добавить ссылку на сертификат в резюме и подтвердить свой уровень подготовки.

                  Преподаватели

                  Руслан

                  Аналитик-разработчик в компании BIA Technologies.

                  Закончил МФТИ, работал по научным направлениям в области моделирования сложных физических процессов. 

                  Работал в нескольких крупных IT-компаниях Москвы и Санкт-Петербурга, занимался различными по размеру и сложности задачами, от генерирования картин, распределения физических величин и чат-ботов до интегрированного комплекса ГИС для картографии и разработки IaaS (Infrastructure as a Service) AWS-подобной системы предоставления облачных услуг.

                  В настоящее время работает аналитиком-разработчиком в области систем автоматического решения задач управления перевозками. Python изучал для автоматизации рутинных действий, однако впоследствии язык показал себя как крайне гибкий и мощный инструмент. Его можно применять в системах произвольной сложности, и он позволяет максимально быстро получить работающее решение.

                  "Программирование - это не школьный набор знаний и навыков, это творчество, это структурирование мышления, это удовольствие от результата. И самое главное, это не требует ни специфического оборудования, ни особых талантов. Программирование в современном мире похоже на вторую грамотность, и каждый заинтересованный способен ей обучиться." - говорит Руслан.

                  Антон

                  Ведущий эксперт Data Science в Neoflex

                  Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

                  Фото с очных занятий в СПб

                  Отзывы

                  Всего отзывов: 5
                  Курс Дата сайентист. Интенсив
                  Константин Кочелаков

                  Курс Отличный. Понравилось объяснение глубокого обучения! В изображениях прям все намного яснее стало!

                  Курс Дата сайентист. Интенсив
                  Елена Рощина

                  Очень насыщенный и подробный курс, дающий глубокое представление о предмете. Очень ценно то, что мы на практике познакомились с анализом данных, выбором и обучением моделей, метриками и оценками точности, написанием нейросетей. К недостатку курса я бы отнесла трату времени на прохождение элементарных вещей, вроде школьной математики или основ языка python, на которые не стоило тратить время, а лучше бы отдать это время основному предмету. Курс был не очень удачно спланирован так, что наиболее сложная часть пришлась на конец года, когда на работе возрастает загруженность в связи со сдачей проектов. Имело бы смысл планировать расписание так. чтоб конец курса приходился на конец января - начало февраля.

                  Курс Дата сайентист. Интенсив
                  Светлана Зорина

                  Курс очень интересный, понравилось всё: и сам материал, и то как преподаватель вёл курс. Возможно, хотелось бы больше занятий про нейросети (мне не хватило). А также, не уверена, но возможно было бы лучше, если домашки были бы меньше, но чаще. Например после каждого занятия (как закрепление только что пройденной темы). Но и так было хорошо, трудно, но хорошо))

                  Курс Дата сайентист. Интенсив
                  Нина Харатян

                  Понравилось общение с преподавателем, структура курса, организация и коммуникация в целом.
                  Чего не хватало лично мне, как абсолютному новичку: больше практической работы на занятии.

                  Курс Дата сайентист. Интенсив
                  Анна Честнова

                  Курс мне понравился. Было разобрано много тем, что дало широкое представление о направлении data science. Буду дальше развиваться в этой профессии. Обучение походило организовано, материалы уроков выкладывались вовремя.

                  Показать больше
                  Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
                  Учитесь с профессионалами в сфере IT-образования!