Обучение Data Science – Курс Data Scientist в СПб | Level Up
Курс NLP для дата-сайентистов
- Начало курса
-
18.09.2024
- Продолжительность
- 1 месяц (20+ ак. часов)
- Расписание
-
Ср 19:00 - 21:00Сб 11:00 - 13:00
Онлайн (14 мест) |
Единовременно 25990 | записаться |
В рассрочку / 10 мес2599 | записаться | |
Также доступна рассрочка на 4, 6 и 10 месяцев. |
Описание курса
Курс "NLP для дата-саейнтистов" рассчитан на дата-сайентистов которые уже владеют классическими алгоритмами и машинным обучением, но хотят освоить область data science связанную с языковым моделированием.
В этом курсе вы получите фундаментальные знания о NLP, начиная с базовых принципов подготовки корпуса к анализу и до продвинутых технологий глубокого обучения. Вы изучите как с помощью математики можно строить языковые модели, а с помощью линейной алгебры передавать семантический смысл слов.
Наш курс предлагает комбинацию теоретических знаний и практических упражнений. Вы получите доступ к актуальным материалам, примерам кода и проектам, которые помогут вам усвоить и применить концепции NLP в реальном мире.
Кому будет полезен данный курс:
- Датасаентистам, которые уже имеют опыт в области классических алгоритмов и хотят расширить свои знания в конкретной области
- Выпускникам школы LevelUP по курсу Data Scientist. Интенсив
Чему Вы научитесь:
-
Правильно ставить задачу и находить актуальное решение
- Важным техникам предобработки текста, включая токенизацию, стемминг и удаление шума
- Векторным представлениям слов, таким как Word2Vec, GloVe и BERT
- Использовать мощные модели рекуррентных нейронных сетей (RNN) и LSTM, которые позволяют улавливать зависимости в последовательностях данных
- Исследовать современные методы, такие как модель BERT, позволяющие открывать новые горизонты в понимании и генерации естественного языка
- Практически применять полученные знания в реальных задачах, включая классификацию текстовых данных и распознавание именованных сущностей (NER)
Инструменты и технологии, которые будем использовать на курсе:
- Python
- Jupyter Notebook
- Git и Github
- pandas
- numpy
- sklearn
- matplotlib и seaborn
- pytorch
Требования к участникам курса:
-
Elementary знание английского
- Знание классического машинного обучения и теоретической базы
Программа
развернуть
1. Введение в обработку естественного языка (NLP)
развернуть
2. Подготовка текстов и векторные представления слов
развернуть
3. Векторные представления слов: эмбеддинги (Word2Vec, fastText, GloVe) и Bag-of-Words (BoW)
развернуть
4. Задача и решение Named Entity Recognition (NER) с использованием условных случайных полей (CRF)
развернуть
5. Рекуррентные нейронные сети
развернуть
6. LSTM (Long Short-Term Memory)
развернуть
7. BERT (Bidirectional Encoder Representations from Transformers)
развернуть
8. Работа над проектами
развернуть
9. Разбор классических вопросов на собеседовании
Преподаватели
Антон
Ведущий эксперт Data Science в Neoflex
Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.
Фото с очных занятий в СПб
Курсы программирования, тестирования, мобильных и веб-технологий от Level UP!
Учитесь с профессионалами в сфере IT-образования!