8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Обучение Data Science – Курс Data Scientist в СПб | Level Up

    Курс Data Scientist

    Курс Data Scientist
    Начало курса
    08.02.2023
    Продолжительность
    3 месяца (50+ ак. часов)
    Расписание
    Ср 19:00 - 21:00
    Сб 11:00 - 13:00
    Онлайн
    (12 мест)
    Единовременно 56990 записаться
    В рассрочку / мес20350 записаться

    Описание курса

    Курс "Data Scientist" ориентирован на всех, кто хочет освоить новую профессию в интенсивном формате. Начальных знаний программирования на Python не требуется, всему обучаем с нуля.

    Программа обучения Data Science содержит большое количество практических задач на закрепление знаний, а также различных мини-проектов. Финальный проект будет "наращиваться" по ходу курса.

    Целью курса "Data Scientist" является понимание и умение применять на практике все необходимые технологии связанные с Data Science. 

    При успешном прохождении курса студент может претендовать на должность Junior Data Scientist или Junior Data Analyst.

    Каждая из тем курса содержит практические примеры, а каждое занятие сопровождается домашним заданием для закрепления материала.

    В конце курса разберем самые популярные вопросы для собеседования.


    Требования к участникам курса:

    • Начальных знаний не требуется, всему будем обучать с нуля

    Программа

    развернуть

    1. Введение в DS. Терминология. Настройка окружения

    • История развития Data Science
    • DS | ML | AI, различие понятий, что куда входит, как пересекается
    • Карта навыков и компетенций Дата-сайнтиста
    • Примеры применения Data Science в современном мире
    • Задачи в различных сферах для DS. Цикл модели. Роли в команде
    • Домашнее задание: Настройка окружения (Python + Jupyter)
    • Дополнительные ссылки + лит-ра
    развернуть

    2. Python + Jupyter + Git

    • Проверяем настройку окружения
    • Основы Python
    • Основные библиотеки для дата саинтиста 
    • Закрепляем
    • Решаем задачки
    • Знакомство с GitHub
    • Домашнее задание
    развернуть

    3. Математика для DS

    • Математический анализ (derivatives, integrals)
    • Линейная алгебра (matrix vector operations, eigenvalues, eigenvectors, and combinatorics).
    • Теория вероятностей (distributions, conditional probabilities, independence, Bayes theorem, correlation, covariation).
    • Статистика (hypothesis testing, bias/variance tradeoffs, mean, variance, and mode, p-value, confidence interval).
    • Обработка данных для аналитика
      • Сводные таблицы группировка
      • Математические функции (min/max/argmin/argmax...).
      • Математика для анализа данных (preprocessing, visualization,EDA).
      • Проведения предобработки данных на примере реальной задачи
    • Домашнее задание
    развернуть

    4. Data Engineering и БД

    • Подготовка данных для обучения (feature engineering).
    • Способы сбора/поиска данных для обучения.
    • Анализ данных (в том числе визуализация).
      • matplotlib
      • seaborn
    • Анализ того, что получилось на графиках (среднее медиана)
    • Базы данных
      • SQL (на примере MySQL)
      • NoSQL (на примере MongoDB)
    • Ознакомительно: Hadoop | Apache Spark | Apache Hive
    • Домашнее задание
    развернуть

    5. Modeling

    • Метод максимального правдоподобия
    • Классическая задача регрессии
      • Linear Regression
    • Переобучение и недообучение. Методы борьбы с ними
      • Lasso/Ridge regression
    • Классическая задача классификации 
      • Logistic Regression
    • Основные виды моделей (бустинг бэггинг)
      • Методы Баггинга
        • Decision Trees
        • Random Forest
      • Методы бустинга и популярные библиотеки
        • XGBoost
        • LightGBM
    • Остальные популярные методы
      • Support Vector Machines (SVM)
      • Методы беггинга
      • Naive Bayes Classifier
    • Задача кластеризации
      • K-means
      • Иерархическая кластеризация
      • EM-Алгоритм
      • DBSCAN
    • Задача снижения размерности 
      • Principal Component Analysis (PCA)
      • t-SNE
    • Домашнее задание
    развернуть

    6. Deep Learning

      • Структура и принцип работы полносвязных нейронных сетей
      • Персептрон
      • Функции активации, критерии качества работы НС
      • Популярные библиотеки для нейронных сетей
      • Типы:
        • Deep Neural Networks (DNNs) | Feed Forward Networks (FFNNs)
        • Исследование полезных подходов в нейронных сетях
        • Back propagation( метод обратного распространения ошибки)
        • Dropout
        • Batch Normalization
        • Recurrent Neural Network (RNN)
        • Long Short Term Memory (LSTM)
        • Convolutional Neural Network (CNN)
    • Пакеты/Фреймворки для работы
    • Methods to train (initialization, regularization, optimization, and transfer learning).
    • Анализ результатов моделей, рекомендации.
    • Домашнее задание
    развернуть

    7. Infrastructure & Deployment

    • Что такое рефакторинг. Основные подходы.
    • Unit & Functional tests
    • Обзор AWS, Azure и аналогов.
    • CI / CD
    • Docker
    • Подготовка к деплойменту
    • Домашнее задание
    развернуть

    8. Разбор классических вопросов на собеседовании

    Сертификат после обучения
    По окончании обучения вы получите сертификат. Нас знают и ценят работодатели, поэтому сертификат станет вашим дополнительным преимуществом при трудоустройстве в IT-компанию. 


    Сертификат о прохождении курса мы отправим вам на почту. Вы легко сможете добавить ссылку на сертификат в резюме и подтвердить свой уровень подготовки.

    Преподаватели

    Антон

    Ведущий эксперт Data Science в Neoflex

    Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

    Руслан

    Аналитик-разработчик в компании BIA Technologies.

    Закончил МФТИ, работал по научным направлениям в области моделирования сложных физических процессов. 

    Работал в нескольких крупных IT-компаниях Москвы и Санкт-Петербурга, занимался различными по размеру и сложности задачами, от генерирования картин, распределения физических величин и чат-ботов до интегрированного комплекса ГИС для картографии и разработки IaaS (Infrastructure as a Service) AWS-подобной системы предоставления облачных услуг.

    В настоящее время работает аналитиком-разработчиком в области систем автоматического решения задач управления перевозками. Python изучал для автоматизации рутинных действий, однако впоследствии язык показал себя как крайне гибкий и мощный инструмент. Его можно применять в системах произвольной сложности, и он позволяет максимально быстро получить работающее решение.

    "Программирование - это не школьный набор знаний и навыков, это творчество, это структурирование мышления, это удовольствие от результата. И самое главное, это не требует ни специфического оборудования, ни особых талантов. Программирование в современном мире похоже на вторую грамотность, и каждый заинтересованный способен ей обучиться." - говорит Руслан.

    Фото с очных занятий в СПб

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!