Автоматизація парсингу сайтів на Python
В эру машинного обучения информация становится нефтью 21го века. Проекты, связанные со сбором и анализом данных, выходят на первые позиции в глобальных компаниях и в стартапах.
Как собирать и обрабатывать информацию? В зависимости от целей проекта данные могут собираться абсолютно разные. На вебинаре мы рассмотрим один из наиболее распространенных подходов – парсинг сайтов.
Мы возьмем один из популярных сайтов с рабочими вакансиями и на его примере разберем библиотеки для парсинга веб-сайтов, библиотеки для работы с запросами. Разберем виды популярных баз данных и поймем где и какую нужно использовать.
План вебинара:
- Что такое парсинг веб-сайтов.
- Библиотеки для парсинга веб-сайтов.
- Библиотеки для работы с сетью.
- Написание кода парсеров.
- SQL и NoSQL - при каких задачах, какой тип используется.
- Написание кода менеджеров баз данных.
Целевая аудитория:
Данный вебинар будет полезен для людей, понимающих синтаксис языка Python и принципы объектно-ориентированного программирования, перед которыми стоит задача автоматизации сбора данных посредством парсинга сайтов.