8 812 320 13 03
  • Новости
  • Расписание
  • Курсы
  • Организациям
  • Контакты
  • Перезвоните мне

    Курс Python для анализа данных

    Курс Аналитик данных на Python. Интенсив

    Курс Аналитик данных на Python. Интенсив
    Начало курса
    26.09.2023
    Продолжительность
    1,5 месяца (48 ак. часов)
    Расписание
    Вт 19:00 - 22:00
    Пт 19:00 - 22:00

    Онлайн
    (13 мест)
    25990 записаться

    Описание курса

    Курс "Аналитик данных на Python. Интенсив" рассчитан на участников, владеющих навыками программирования на Python и подходит для всех, кому в профессиональной деятельности в той или иной мере необходимы навыки работы с данными. 
    Данный курс аналитик данных на python не подходит для обучения с нуля, без знания основ программирования.

    В последние годы язык программирования Python становится более востребованным и популярным по нескольким причинам:

    • множество уже готовых удобных библиотек и фреймворков делает этот язык №1 в сфере обработки данных для научных вычислений
    • Python для анализа данных используется многими большими компаниями такими, как , Yandex, Google, Facebook, Uber и другими
    • простота синтаксиса и освоения позволяют новичкам быстро научиться программировать и решать достаточно сложные задачи

    Требования к участникам курса:

    • Начальные знания Python (см. курс Python. Старт)
    • Умение пользоваться системами контроля версий (Github | Gitlab | Bitbucket и т.п.)
    • Знание английского для понимания базовых слов (A2-B1). Или желание быстро расширить словарный запас (по желанию предоставляется “словарик” начинающего разработчика).

    Программа

    развернуть

    Анализ табличных данных стандартными средствами Python

    • Стандартные типы коллекций (списки, словари и т.д.) и приемы эффективной работы с ними
    • Чтение и запись  csv и tsv файлов
    • Обработка Excel файлов с помощью OpenPyXL.
    • Практика: анализ источника данных "Климат городов России"
    • ДЗ: решение задач биоинформатики (4 шт).
    развернуть

    Использование SQL для анализа и манипулирования данными

    • Определение СУБД. Немного теории (нормальные формы)
    • Операторы SQL.
    • Python Database API Specification - для работы с любой СУБД
    • Примеры работы со встраиваемой СУБД SQLite
    • Практика: создание реляционных таблиц из источника данных "Климат городов России" и выполнение аналитических запросов
    развернуть

    NumPy как средство обработки данных

    • Ndarray - объект многомерного массива
    • Математические и статистические операции
    • Файловый ввод/вывод массивов
    • Немного линейной алгебры
    • Генерация случайных чисел.
    • Практика: анализ двумерного массива
    развернуть

    Сбор и подготовка данных. Работа с XML, HTML и JSON. Автоматизация сбора данных

    • Библиотека beautifulsoup для разбора HTML файлов
    • Форматы структурированных данных JSON и XML. Примеры практической работы. 
    • Использование Splinter для автоматизации сбора данных   
    • Практика: получение данных от веб-сервисов прогноза погоды и расчет обобщенных показателей
    развернуть

    Визуализация данных в Python: matplotlib, plotly, bokeh

    • API библиотеки matplotlib
    • Линейные и столбчатые диаграммы
    • Гистограммы и графики плотности
    • Визуализация данных на карте
    • Построение интерактивных диаграмм с помощью plotly и bokeh
    развернуть

    Библиотека pandas. Базовая функциональность

    • Арифметические операции и выравнивание данных
    • Редукция и вычисление описательных характеристик
    • Обработка отсутствующих данных
    • Практика: работа с набором данных рейтинга фильмов
    развернуть

    Переформатирование данных с помощью pandas

    • Комбинирование и слияние наборов данных
    • Изменение формы и поворот
    • Устранение дубликатов и прочие преобразования данных
    • Практика: работа с набором данных рейтинга фильмов
    развернуть

    Аггрегирование данных и групповые операции

    • Группировка с помощью функций
    • Группировка по уровням индекса
    • Аггрегирование данных
    • Групповые операци и ипреобразования
    • Сводные таблицы
    развернуть

    Введение в машинное обучение. Модели, задачи классификации и библиотека SciKit

    • Обзор задач машинного обучения и библиотек для их решения
    • Построение классификаторов
    • Методы кластеризации
    • Практика: пример кластеризации сообщений
    развернуть

    Дополнительные возможности и библиотеки

    • Дополнительные возможности NumPy и Pandas
    • Обзор интересных сторонних библиотек
    • Решение практических задач
    • Выборочное повторение пройденного материала
    развернуть

    Работа над проектом

    развернуть

    Подготовка к собеседованию

    Сертификат после обучения
    По окончании обучения вы получите сертификат. Нас знают и ценят работодатели, поэтому сертификат станет вашим дополнительным преимуществом при трудоустройстве в IT-компанию. 


    Сертификат о прохождении курса мы отправим вам на почту. Вы легко сможете добавить ссылку на сертификат в резюме и подтвердить свой уровень подготовки.

    Преподаватели

    Руслан

    Аналитик-разработчик в компании BIA Technologies.

    Закончил МФТИ, работал по научным направлениям в области моделирования сложных физических процессов. 

    Работал в нескольких крупных IT-компаниях Москвы и Санкт-Петербурга, занимался различными по размеру и сложности задачами, от генерирования картин, распределения физических величин и чат-ботов до интегрированного комплекса ГИС для картографии и разработки IaaS (Infrastructure as a Service) AWS-подобной системы предоставления облачных услуг.

    В настоящее время работает аналитиком-разработчиком в области систем автоматического решения задач управления перевозками. Python изучал для автоматизации рутинных действий, однако впоследствии язык показал себя как крайне гибкий и мощный инструмент. Его можно применять в системах произвольной сложности, и он позволяет максимально быстро получить работающее решение.

    "Программирование - это не школьный набор знаний и навыков, это творчество, это структурирование мышления, это удовольствие от результата. И самое главное, это не требует ни специфического оборудования, ни особых талантов. Программирование в современном мире похоже на вторую грамотность, и каждый заинтересованный способен ей обучиться." - говорит Руслан.

    Антон

    Ведущий эксперт Data Science в Neoflex

    Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

    Фото с очных занятий в СПб

    Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
    Учитесь с профессионалами в сфере IT-образования!