8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Data Scientist

    Курс Data Scientist
    Начало курса
    17.09.2022
    Продолжительность
    3 месяца (60+ ак. часов)
    Расписание
    Ср 19:00 - 21:00
    Сб 11:00 - 13:00
    Онлайн
    (13 мест)
    48990 записаться
    свернуть

    Описание курса

    Курс Data Scientist ориентирован на всех, кто хочет освоить новую профессию в интенсивном формате. Начальных знаний программирования на Python не требуется, будем всему учиться с нуля.

    Программа обучения Data Science содержит большое количество практических задач на закрепление знаний, мини-проекты на протяжении курса, а также финальный проект, который будет "наращиваться" по ходу курса.

    Целью курса Data Scientist является понимание и умение применять на практике все необходимые технологии связанные с Data
    Science. 
    При успешном прохождении курса студент может претендовать на должность Junior Data Scientist или Junior Data Analyst.

    Каждая из тем курса содержит практические примеры, а каждое занятие сопровождается домашним заданием для закрепления материала.

    В конце курса разберем самые популярные вопросы для собеседования.


    Требования к участникам курса:

    • Начальных знаний не требуется, всему будем учиться с нуля

    свернуть

    Программа

    1. Введение. Терминология.

    • Рассмотрение различных ролей в AI-team и их навыков.
    • Различия/Сходства программирования и науки о данных.
    • Цикл разработки AI продукта.
    • Полезные ресурсы.

    2. Python + Git 

    • Основы Python
    • Основные библиотеки для дата саинтиста 
    • Закрепляем
    • Решаем задачки
    • JupyterLab + MarkDown

    3. Математика для DS

    • Математический анализ (derivatives, integrals)
    • Линейная алгебра (matrix vector operations, eigenvalues, eigenvectors, and combinatorics).
    • Теория вероятностей (distributions, conditional probabilities, independence, Bayes theorem, correlation, covariation).
    • Статистика (hypothesis testing, bias/variance tradeoffs, mean, variance, and mode, p-value, confidence interval).
    • Обработка данных для аналитика
      • Сводные таблицы группировка
      • Математические функции (min/max/argmin/argmax...).
      • Математика для анализа данных (preprocessing, visualization,EDA).
      • Проведения предобработки данных на примере реальной задачи

    4. Data Engineering

    • Подготовка данных для обучения (feature engineering).
    • Способы сбора/поиска данных для обучения.
    • Анализ данных (в том числе визуализация).
      • matplotlib
      • seaborn
    • Анализ того, что получилось на графиках (среднее медиана)
    • Что такое ETL?
    • Базы данных
      • SQL (на примере MySQL)
      • NoSQL (на примере MongoDB)
    • Знакомство с экосистемой Hadoop
    • Знакомство с Apache Spark | Apache Hive

    5. Modeling

    • Метод максимального правдоподобия
    • Классическая задача регрессии
      • Linear Regression
    • Переобучение и недообучение. Методы борьбы с ними
      • Lasso/Ridge regression
    • Классическая задача классификации 
      • Logistic Regression
    • Основные виды моделей (бустинг бэггинг)
      • Методы Баггинга
        • Decision Trees
        • Random Forest
      • Методы бустинга и популярные библиотеки
        • XGBoost
        • LightGBM
    • Остальные популярные методы
      • Support Vector Machines (SVM)
      • Методы беггинга
      • Naive Bayes Classifier
    • Задача кластеризации
      • K-means
      • Иерархическая кластеризация
      • EM-Алгоритм
      • DBSCAN
    • Задача снижения размерности 
      • Principal Component Analysis (PCA)
      • t-SNE

    6. Deep Learning

      • Структура и принцип работы полносвязных нейронных сетей
      • Персептрон
      • Функции активации, критерии качества работы НС
      • Популярные библиотеки для нейронных сетей
      • Типы:
        • Deep Neural Networks (DNNs) | Feed Forward Networks (FFNNs)
        • Исследование полезных подходов в нейронных сетях
        • Back propagation( метод обратного распространения ошибки)
        • Dropout
        • Batch Normalization
        • Recurrent Neural Network (RNN)
        • Long Short Term Memory (LSTM)
        • Convolutional Neural Network (CNN)
    • Пакеты/Фреймворки для работы
    • Methods to train (initialization, regularization, optimization, and transfer learning).
    • Анализ результатов моделей, рекомендации.

    7. Infrastructure & Deployment

    • Что такое рефакторинг. Основные подходы.
    • Unit & Functional tests
    • Обзор AWS, Azure и аналогов.
    • CI / CD
    • Docker
    • Подготовка к деплойменту

    8. Разбор классических вопросов на собеседовании

    свернуть

    Преподаватель

    Никита

    Data Scientist в Магнит

    Закончил Бакалавриат и Магистратуру на факультете вычислительной математики и кибернетики (ВМК) в ННГУ
    За время профессиональной деятельности прошёл путь от стажёра до специалиста мидл+. 
    В настоящее время работаю Data Scientist в компании Магнит, занимаюсь детектированием проблем с товаром. 

    Вера

    Аспирант (PhD) в CERN

    Закончила бакалавриат и магистратуру физического факультета НГУ. 
    С младших курсов начала заниматься анализом данных физических экспериментов, и решила дальше развиваться в этой области. 

    Получила ещё одну магистерскую степень, в этот раз по data science, во французском ВУЗе. 

    В настоящее время ведёт научную деятельность, разрабатывая эффективные алгоритмы обработки данных для задач компьютерного зрения.

    Руслан

    Аналитик-разработчик в компании BIA Technologies.

    Закончил МФТИ, работал по научным направлениям в области моделирования сложных физических процессов. 

    Работал в нескольких крупных IT-компаниях Москвы и Санкт-Петербурга, занимался различными по размеру и сложности задачами, от генерирования картин, распределения физических величин и чат-ботов до интегрированного комплекса ГИС для картографии и разработки IaaS (Infrastructure as a Service) AWS-подобной системы предоставления облачных услуг.

    В настоящее время работает аналитиком-разработчиком в области систем автоматического решения задач управления перевозками. Python изучал для автоматизации рутинных действий, однако впоследствии язык показал себя как крайне гибкий и мощный инструмент. Его можно применять в системах произвольной сложности, и он позволяет максимально быстро получить работающее решение.

    "Программирование - это не школьный набор знаний и навыков, это творчество, это структурирование мышления, это удовольствие от результата. И самое главное, это не требует ни специфического оборудования, ни особых талантов. Программирование в современном мире похоже на вторую грамотность, и каждый заинтересованный способен ей обучиться." - говорит Руслан.
    свернуть

    Фотографии

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!