Обучение Data Science – Курс Data Scientist в СПб | Level Up

Курс NLP для дата-сайентистов

Начало курса: 18.09.2024
Продолжительность: 1 месяц (20+ ак. часов)
Расписание: Ср 19:00 - 21:00

Сб 11:00 - 13:00

Онлайн (14 мест)	Единовременно 25990	записаться
	В рассрочку / 4 мес6497	записаться
Также доступна рассрочка на 4, 6 и 10 месяцев.

Описание курса

Курс "NLP для дата-саейнтистов" рассчитан на дата-сайентистов которые уже владеют классическими алгоритмами и машинным обучением, но хотят освоить область data science связанную с языковым моделированием.

В этом курсе вы получите фундаментальные знания о NLP, начиная с базовых принципов подготовки корпуса к анализу и до продвинутых технологий глубокого обучения. Вы изучите как с помощью математики можно строить языковые модели, а с помощью линейной алгебры передавать семантический смысл слов.

Наш курс предлагает комбинацию теоретических знаний и практических упражнений. Вы получите доступ к актуальным материалам, примерам кода и проектам, которые помогут вам усвоить и применить концепции NLP в реальном мире.

Кому будет полезен данный курс:

Датасаентистам, которые уже имеют опыт в области классических алгоритмов и хотят расширить свои знания в конкретной области
Выпускникам школы LevelUP по курсу Data Scientist. Интенсив

Чему Вы научитесь:

Правильно ставить задачу и находить актуальное решение
Важным техникам предобработки текста, включая токенизацию, стемминг и удаление шума
Векторным представлениям слов, таким как Word2Vec, GloVe и BERT
Использовать мощные модели рекуррентных нейронных сетей (RNN) и LSTM, которые позволяют улавливать зависимости в последовательностях данных
Исследовать современные методы, такие как модель BERT, позволяющие открывать новые горизонты в понимании и генерации естественного языка
Практически применять полученные знания в реальных задачах, включая классификацию текстовых данных и распознавание именованных сущностей (NER)

Инструменты и технологии, которые будем использовать на курсе:

Python
Jupyter Notebook
Git и Github
pandas
numpy
sklearn
matplotlib и seaborn
pytorch

Требования к участникам курса:

Elementary знание английского
Знание классического машинного обучения и теоретической базы

Программа

развернуть

1. Введение в обработку естественного языка (NLP)

развернуть

2. Подготовка текстов и векторные представления слов

развернуть

3. Векторные представления слов: эмбеддинги (Word2Vec, fastText, GloVe) и Bag-of-Words (BoW)

развернуть

4. Задача и решение Named Entity Recognition (NER) с использованием условных случайных полей (CRF)

развернуть

9. Разбор классических вопросов на собеседовании

Преподаватели

Задать вопрос

Антон

Ведущий эксперт Data Science в Neoflex

Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.