8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Data Scientist

    Курс Data Scientist
    Начало курса
    20.11.2021
    Продолжительность
    4,5 месяца (60+ ак. часов)
    Расписание
    5 первых занятий: 
    Вс 12:00 - 14:30

    далее либо:
    Вс 12:00 - 14:30

    либо 
    Сб 12:00 - 14:30
    Онлайн
    (10 мест)
    48990 записаться
    свернуть

    Описание курса

    Курс Data Scientist ориентирован на начинающих разработчиков, знакомых с основами разработки на Python.
    Программа обучения Data Science содержит большое количество практических задач на закрепление знаний, а также мини-проекты на протяжении курса.

    Целью курса Data Scientist является понимание и умение применять на практике все необходимые технологии связанные с Data
    Science. 
    При успешном прохождении курса студент может претендовать на должность Junior Data Scientist или Junior Data Analyst.

    Каждая из тем курса содержит практические примеры, а каждое занятие сопровождается домашним заданием для закрепления материала.

    В конце курса разберем самые популярные вопросы для собеседования.


    Требования к участникам курса:

    • Начальные знания Python (нужно знать, что такое методы/функции/import/pip; не обязательно знать, вопросы связанные с разработкой классов, декораторов, лямбда-выражений, генераторов и т.п.). То есть первые 3-4 занятия из курса Python. Уровень 1.
    • Умение пользоваться системами контроля версий (Github | Gitlab | Bitbucket и т.п.)
    • Знание английского для понимания базовых слов (A2-B1). Или желание быстро расширить словарный запас (по желанию предоставляется “словарик” начинающего разработчика).

    свернуть

    Программа

    1. Введение. Терминология.

    • Рассмотрение различных ролей в AI-team и их навыков.
    • Различия/Сходства программирования и науки о данных.
    • Цикл разработки AI продукта.
    • Полезные ресурсы.

    2. Python + Git 

    • Вспоминаем
    • Закрепляем
    • Решаем задачки
    • JupyterLab + MarkDown

    3. Математика для DS

    • Статистика (hypothesis testing, bias/variance tradeoffs, mean, variance, and mode).
    • Теория вероятностей (distributions, conditional probabilities, independence, Bayes theorem).
    • Математический анализ (derivatives, integrals)
    • Линейная алгебра (matrix vector operations, eigenvalues, eigenvectors, and combinatorics).
    • Математические функции (min/max/argmin/argmax...).
    • Математика для анализа данных (preprocessing, visualization and metrics such as accuracy, R-squared, residuals, precision, and recall).

    4. Data Engineering

    • Подготовка данных для обучения (feature engineering).
    • Способы сбора/поиска данных для обучения.
    • Анализ данных (в том числе визуализация).
      • matplotlib
      • seaborn
    • Анализ того, что получилось на графиках (корреляция, среднее...).
    • Что такое ETL?
    • Базы данных
      • SQL (на примере MySQL)
      • NoSQL (на примере MongoDB)
    • Знакомство с экосистемой Hadoop
    • Знакомство с Apache Spark | Apache Hive

    5. Modeling

    • ML (Classic models)
      • Типы:
        • Logistic Regression
        • Linear Regression
        • Decision Trees
        • Random Forest
        • XGBoost
        • Support Vector Machines (SVM)
        • K-means
        • K-Nearest Neighbors (K-NNs)
        • Principal Component Analysis (PCA)
        • Naive Bayes Classifier
        • Lasso/Ridge regression
      • Пакеты/Фреймворки для работы
      • Methods to train (initialization, optimization, regularization, and hyperparameter tuning).
      • Анализ результатов моделей, рекомендации.
    • Deep Learning
      • Типы:
        • Deep Neural Networks (DNNs) | Feed Forward Networks (FFNNs)
        • Recurrent Neural Network (RNN)
        • Long Short Term Memory (LSTM)
        • Convolutional Neural Network (CNN)
      • Пакеты/Фреймворки для работы
      • Methods to train (initialization, regularization, optimization, and transfer learning).
      • Анализ результатов моделей, рекомендации.

    6. Infrastructure & Deployment

    • Что такое рефакторинг. Основные подходы.
    • Unit & Functional tests
    • Базовые понятия GPU / CUDA
    • Обзор AWS, Azure и аналогов.
    • CI / CD
    • Docker
    • Preparing files (usually model architecture and parameters) for deployment

    7. Разбор классических вопросов на собеседовании

    свернуть

    Преподаватель

    Максим

    Руководитель отдела разработки, эксперт, консультант, доцент МГУ имени М.В. Ломоносова.

    В своей профессиональной деятельности прошёл путь от простого разработчика до руководителя отдела разработки. 
    Работал, как на аутсорсе так и in house, занимался консультированием и разработкой в сфере нейронных сетей, искусственного интеллекта и машинного обучения.

    В данный момент руковожу отделом разработки и преподаю в МГУ имени М.В. Ломоносова.

    Вера

    Аспирант (PhD) в CERN

    Закончила бакалавриат и магистратуру физического факультета НГУ. 
    С младших курсов начала заниматься анализом данных физических экспериментов, и решила дальше развиваться в этой области. 

    Получила ещё одну магистерскую степень, в этот раз по data science, во французском ВУЗе. 

    В настоящее время ведёт научную деятельность, разрабатывая эффективные алгоритмы обработки данных для задач компьютерного зрения.
    свернуть

    Фотографии

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!