Автоматизація парсингу сайтів на Python
В эру машинного обучения информация становится нефтью 21го века. Проекты, связанные со сбором и анализом данных, выходят на первые позиции в глобальных компаниях и в стартапах.
Как собирать и обрабатывать информацию? В зависимости от целей проекта данные могут собираться абсолютно разные. На вебинаре мы рассмотрим один из наиболее распространенных подходов – парсинг сайтов.
Мы возьмем один из популярных сайтов с рабочими вакансиями и на его примере разберем библиотеки для парсинга веб-сайтов, библиотеки для работы с запросами. Разберем виды популярных баз данных и поймем где и какую нужно использовать.
План вебинара:
- Что такое парсинг веб-сайтов.
- Библиотеки для парсинга веб-сайтов.
- Библиотеки для работы с сетью.
- Написание кода парсеров.
- SQL и NoSQL - при каких задачах, какой тип используется.
- Написание кода менеджеров баз данных.
Целевая аудитория:
Данный вебинар будет полезен для людей, понимающих синтаксис языка Python и принципы объектно-ориентированного программирования, перед которыми стоит задача автоматизации сбора данных посредством парсинга сайтов.
01.01.1960
120
1490
01.01.1960
120
1082
01.01.1960
120
1333
01.01.1960
120
2996
01.01.1960
120
2841
01.01.1960
120
1400
01.01.1960
120
972
01.01.1960
120
1840
01.01.1960
120
2672
01.01.1960
120
5632
01.01.1960
120
2176
01.01.1960
120
2534