8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Data Scientist

    Курс Data Scientist
    Начало курса
    30.01.2021
    Продолжительность
    4,5 месяца (60+ ак. часов)
    Расписание
    Сб 11:00 - 13:30
    Онлайн
    (2 места)
    25900 записаться
    свернуть

    Описание курса

    Курс Data Scientist ориентирован на начинающих разработчиков, знакомых с основами разработки на Python.
    Программа обучения Data Science содержит большое количество практических задач на закрепление знаний, а также мини-проекты на протяжении курса.

    Целью курса Data Scientist является понимание и умение применять на практике все необходимые технологии связанные с Data
    Science. 
    При успешном прохождении курса студент может претендовать на должность Junior Data Scientist или Junior Data Analyst.

    Каждая из тем курса содержит практические примеры, а каждое занятие сопровождается домашним заданием для закрепления материала.

    В конце курса разберем самые популярные вопросы для собеседования.


    Требования к участникам курса:

    • Начальные знания Python (нужно знать, что такое методы/функции/import/pip; не обязательно знать, вопросы связанные с разработкой классов, декораторов, лямбда-выражений, генераторов и т.п.). То есть первые 3-4 занятия из курса Python. Уровень 1.
    • Умение пользоваться системами контроля версий (Github | Gitlab | Bitbucket и т.п.)
    • Знание английского для понимания базовых слов (A2-B1). Или желание быстро расширить словарный запас (по желанию предоставляется “словарик” начинающего разработчика).

    свернуть

    Программа

    1. Введение. Терминология.

    • Рассмотрение различных ролей в AI-team и их навыков.
    • Различия/Сходства программирования и науки о данных.
    • Цикл разработки AI продукта.
    • Полезные ресурсы.

    2. Python + Git 

    • Вспоминаем
    • Закрепляем
    • Решаем задачки

    3. JupyterLab + MarkDown

    4. Data Engineering

    • Подготовка данных для обучения (feature engineering).
    • Способы сбора/поиска данных для обучения.
    • Анализ данных (в том числе визуализация).
    • Что такое ETL?
    • Базы данных
      • SQL (на примере MySQL).
      • NoSQL (на примере MongoDB).
    • Обзор терминов: Hadoop, Spark, Hive.

    5. Modeling

    • ML (Classic models)
      • Типы:
        • Logistic Regression
        • Linear Regression
        • Decision Trees
        • Random Forest
        • XGBoost
        • Support Vector Machines (SVM)
        • K-means
        • K-Nearest Neighbors (K-NNs)
        • Principal Component Analysis (PCA)
        • Naive Bayes Classifier
        • Lasso/Ridge regression
      • Пакеты/Фреймворки для работы
      • Methods to train (initialization, optimization, regularization, and hyperparameter tuning).
      • Анализ результатов моделей, рекомендации.
    • Deep Learning
      • Типы:
        • Deep Neural Networks (DNNs) | Feed Forward Networks (FFNNs)
        • Recurrent Neural Network (RNN)
        • Long Short Term Memory (LSTM)
        • Convolutional Neural Network (CNN)
      • Пакеты/Фреймворки для работы
      • Methods to train (initialization, regularization, optimization, and transfer learning).
      • Анализ результатов моделей, рекомендации.
    • Математика для DS (базовые знания, ничего страшного :) )
      • Статистика (hypothesis testing, bias/variance tradeoffs, mean, variance, and mode).
      • Теория вероятностей (distributions, conditional probabilities, independence, Bayes theorem).
      • Математический анализ (derivatives, integrals)
      • Линейная алгебра (matrix vector operations, eigenvalues, eigenvectors, and combinatorics).
      • Математические функции (min/max/argmin/argmax...).
      • Математика для анализа данных (preprocessing, visualization and metrics such as
      • accuracy, R-squared, residuals, precision, and recall).
    • Обзор языка R.

    6. Deployment

    • Что такое рефакторинг. Основные подходы.
    • Обзор AWS, Azure и аналогов.
    • Preparing files (usually model architecture and parameters) for deployment.

    7. Business Analysis

    • Визуализация
      • Tableau
      • matplotlib
      • seaborn
    • Анализ того, что получилось на графиках (корреляция, среднее...).

    8. Infrastructure

    • Базовые понятия GPU / CUDA
    • Docker + Linux terminal.
    • A/B testing
    • Unit & Functional tests
    • Классические алгоритмы и структуры данных (О-большое, понятие оптимизации).

    9. Разбор классических вопросов на собеседовании


    свернуть

    Преподаватель

    Ирина

    Старший разработчик в компании МТС ИИ (Искусственный Интеллект)

    Закончила бакалавриат и магистратуру в СПбГЭТУ (ЛЭТИ) по специальности “Информатика и вычислительная техника”.

    Опыт разработки более 6 лет. За это время работала с различными языками программирования и операционными системами, но основными всегда были C++ и Python.

    Начинала с программирования микроконтроллеров и десктопных приложений на Qt. Несколько лет назад начала развиваться в сфере распознавания речи (в компании Центр Речевых Технологий).
    На данный момент участвует в разработке умной колонки МТС. 

    “Разработчиком может быть каждый! Главное не отступать перед трудностями, шаг за шагом продвигаясь к своей цели. Программирование - это постоянное развитие, а развитие без труда невозможно, но результат всегда стоит того. Я верю, что у вас все получится!”
    свернуть

    Фотографии

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!