Top.Mail.Ru
8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Курс Python для анализа данных

    Курс Аналитик данных

    Курс Аналитик данных
    Начало курса
    26.11.2024
    Продолжительность
    3,5 месяца (80 ак. часов)
    Расписание
    Вт 19:00 - 21:30
    Пт 19:00 - 21:30

    или

    Ср 19:00 - 21:30
    Сб 11:00 - 13:30
    Онлайн
    (10 мест)
    Единовременно 70000 записаться
    В рассрочку / 10 мес7000 записаться
    Также доступна рассрочка на 4, 6 и 10 месяцев.

    Описание курса

    Курс"Аналитик данных" - это интенсивный курс обучения всем аспектам роли аналитика данных в команде, основанный на требованиях работодателей и актуальном стеке технологий и инструментов.


    Для кого подойдёт данный курс:

    • для новичков, желающих освоить профессию "Аналитик данных" или "Продуктовый аналитик"
    • для всех кто уже работает в сфере аналитики данных, и хочет повысить свой уровень каких-то аспектах или структурировать свои знания

    Требования к участникам:

    Мы расширили курс, включили такие темы, как Python, Git и основы мат. статистики и теорвера, и теперь никаких начальных требований к участникам нет, будем всему учиться с нуля.

    Программа

    развернуть

    Python для работы с данными

    • Установка Python и основные инструменты разработки: Anaconda, Jupyter Notebook, PyCharm.
    • Синтаксис языка: переменные, типы данных, операторы, функции.
    • Условные конструкции и циклы: if-else, for, while.
    • Структуры данных: списки, кортежи, множества, словари.
    • Работа с файлами и директориями: чтение, запись, перемещение и удаление.
    • Обработка исключений: try-except.
    • Модули и пакеты: создание, импорт и использование.
    • ООП в Python: классы, объекты, наследование. 
    • Линейная алгебра. Вспоминаем
    • Работа с библиотекой NumPy:
    • Создание массивов NumPy
    • Операции над массивами
    • Индексирование и срезы массивов
    • Функции для работы с массивами
    • Работа с библиотекой Pandas
    • Введение в Pandas и структуры данных
    • Создание DataFrame и Series
    • Обработка и очистка данных
    • Сводные таблицы и агрегирование данных
    • Применение линейной алгебры в машинном обучении
    • Работа с данными с помощью NumPy и Pandas
    развернуть

    Git

    • Определение командной строки и ее роли.
    • Основные команды (cd, ls, mkdir, rm, cp, mv).
    • Системы контроля версий   
    • Концепции системы контроля версий.
    • Основные команды (init, add, commit, status, log).
    • Работа с удаленными репозиториями (clone, remote, push, pull).
    развернуть

    Теория вероятностей и статистика 

    • Определение понятий статистики и вероятности
    • Общие принципы статистической обработки данных
    • Основные принципы теории вероятностей
    • Описательная статистика
    • Расчет основных характеристик данных: среднее, медиана, мода, дисперсия, стандартное отклонение
    • Вероятность
    • Определение понятия вероятности
    • Расчет вероятности событий
    • Условная вероятность и формула Байеса
    • Распределения вероятностей: дискретные и непрерывные
    • Гипотезы и их проверка
    • Уровень значимости и p-value
    • Корреляционный анализ
    • Корреляция и коэффициент корреляции
    • Построение корреляционной матрицы
    развернуть

    А/В-тесты 

    • Введение в A/B тестирование
    • Определение A/B тестирования и его цели.
    • Основные термины: контрольная группа, тестовая группа, конверсия, p-значение и т. д.
    • Примеры успешных A/B тестов и их влияние на бизнес.
    • Определение целей теста и выбор метрик успеха.
    • Разработка гипотез и создание вариаций страницы/продукта.
    • Размер выборки и его расчеты для достижения статистической значимости.
    • Статистический анализ результатов: t-тест, z-тест и др.
    • Интерпретация показателей: p-значение, доверительные интервалы.
    • Принятие решений на основе результатов теста: внедрение изменений, отклонение или повторное тестирование.
    • Практические задания и кейсы для закрепления материала.
    • Обзор инструментов для проведения A/B тестирования
    развернуть

    Визуализация данных:

    • Основные принципы визуализации данных
    • Знакомство с библиотеками Matplotlib и Seaborn
    • Построение первых графиков: scatter plot, line plot, bar plot
    • Загрузка и предварительная обработка данных для визуализации
    • Очистка и преобразование данных
    • Разведочный анализ данных
    • Настройка осей и меток
    • Добавление заголовков и подписей
    • Использование различных цветов и стилей
    • Создание множественных графиков
    • Использование различных типов диаграмм: pie chart, histogram, box plot
    • Настройка внешнего вида графиков
    • Использование Seaborn для создания более сложных и красивых графиков
    • Работа с категориальными данными
    • Использование статистических графиков
    • Создание собственного проекта визуализации данных
    • Презентация результатов и обсуждение лучших практик
    развернуть

    SQL

    • Знакомство с языком SQL
    • Создание баз данных и таблиц
    • Операторы SELECT, INSERT, UPDATE, DELETE
    • Основные функции SQL (COUNT, SUM, AVG, MAX, MIN)
    • Операторы WHERE и AND/OR
    • Сортировка данных с помощью ORDER BY
    • Использование DISTINCT для удаления дубликатов
    • Использование оператора IN и BETWEEN для фильтрации данных
    • Практические задания
    • Использование оператора JOIN для объединения таблиц
    • Внутренние, внешние, левые и правые соединения
    • Использование подзапросов
    • Практические задания на объединение таблиц
    • Использование оператора GROUP BY для группировки данных
    • Использование агрегатных функций с GROUP BY
    • Фильтрация групп данных с помощью оператора HAVING
    • Практические проекты для применения изученных навыков
    развернуть

    Развитие продукта 

    • Определение продуктового видения и его роль в развитии продукта.
    • Понимание бизнес-анализа и его влияние на принятие решений в компании.
    • Формирование продуктового видения
    • Исследование рынка и аудитории продукта.
    • Выявление потребностей пользователей и определение ключевых функциональных требований.
    • Роль продакт-менеджера в продуктовом развитии.
    • Как аналитику данных работать в тесном сотрудничестве с продакт-менеджерами.
    • Использование данных для развития бизнеса
    • Сбор и анализ данных о продукте и пользовательском поведении.
    • Применение данных для выявления возможностей для улучшения продукта и достижения бизнес-целей.
    • Организация работы команд в IT-продуктах
    • Методологии управления продуктами: Agile, Scrum, Kanban.
    • Работа в команде аналитиков данных в рамках IT-продукта: роли, процессы, коммуникация.
    развернуть

    Продуктовая аналитика 

    • Значение аналитики данных для бизнеса
    • Основные принципы анализа данных и их применение в бизнесе
    • Как объяснить ценность аналитики данных бизнесу
    • Понимание потребностей пользователей продукта
    • Методы и техники определения потребностей пользователей
    • Сегментация пользователей и её значение для продуктового развития
    • Практические кейсы по определению потребностей пользователей и сегментации
    • Основы юнит-экономики и её роль в анализе данных
    • Выбор и расчёт ключевых продуктовых метрик
    • Практические задания по расчёту юнит-экономики и метрик
    развернуть

    Airflow

    • Обзор задач, которые можно автоматизировать с помощью Airflow.
    • Основные понятия и термины: DAGs (Directed Acyclic Graphs), Operators, Tasks, Executors.
    • Установка и настройка Airflow.
    • Создание первого DAG:
    • Определение DAG и его структура.
    • Использование Operators для определения задач.
    • Конфигурация и планирование DAGs.
    • Определение зависимостей между задачами.
    • Использование контроля выполнения (execution_date) для управления временем задач.
    • Планирование и мониторинг:
    • Использование планировщика (Scheduler) для автоматического выполнения задач по расписанию.
    • Мониторинг выполнения задач через веб-интерфейс Airflow.
    • Создание собственных операторов для выполнения специфических задач.
    • Использование переменных и шаблонов для динамической конфигурации DAGs.
    • Передача параметров между задачами.
    • Масштабирование и оптимизация
    • Конфигурация и использование различных Executor'ов для оптимизации выполнения задач.
    • Работа с очередями и параллельным выполнением задач.
    развернуть

    Работа над курсовым проектом

    развернуть

    Подготовка к собеседованию

    Сертификат после обучения
    По окончании обучения вы получите сертификат. Нас знают и ценят работодатели, поэтому сертификат станет вашим дополнительным преимуществом при трудоустройстве в IT-компанию. 


    Сертификат о прохождении курса мы отправим вам на почту. Вы легко сможете добавить ссылку на сертификат в резюме и подтвердить свой уровень подготовки.

    Преподаватели

    Антон

    Ведущий эксперт Data Science в Neoflex

    Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

    Фото с очных занятий в СПб

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!