Автоматизація парсингу сайтів на Python
В эру машинного обучения информация становится нефтью 21го века. Проекты, связанные со сбором и анализом данных, выходят на первые позиции в глобальных компаниях и в стартапах.
Как собирать и обрабатывать информацию? В зависимости от целей проекта данные могут собираться абсолютно разные. На вебинаре мы рассмотрим один из наиболее распространенных подходов – парсинг сайтов.
Мы возьмем один из популярных сайтов с рабочими вакансиями и на его примере разберем библиотеки для парсинга веб-сайтов, библиотеки для работы с запросами. Разберем виды популярных баз данных и поймем где и какую нужно использовать.
План вебинара:
- Что такое парсинг веб-сайтов.
- Библиотеки для парсинга веб-сайтов.
- Библиотеки для работы с сетью.
- Написание кода парсеров.
- SQL и NoSQL - при каких задачах, какой тип используется.
- Написание кода менеджеров баз данных.
Целевая аудитория:
Данный вебинар будет полезен для людей, понимающих синтаксис языка Python и принципы объектно-ориентированного программирования, перед которыми стоит задача автоматизации сбора данных посредством парсинга сайтов.
01.01.1960
120
997
01.01.1960
120
1176
01.01.1960
120
2510
01.01.1960
120
2710
01.01.1960
120
1329
01.01.1960
120
965
01.01.1960
120
1822
01.01.1960
120
2648
01.01.1960
120
5312
01.01.1960
120
2106
01.01.1960
120
2528
01.01.1960
120
1635