На своєму вебінарі Web Scraping я люблю говорити, що Web Scraping не є чарівною таблеткою на всі випадки життя. Але є завдання, де за допомогою скрейпінгу сорсер та IT рекрутер зможуть полегшити собі життя та зробити все набагато швидшим.
Тому важливо насамперед виходити з поставленого завдання, потім подумати за допомогою якого ресурсу (джерела) його можна вирішити і потім вибирати інструмент для скрейпінгу.
У цій статті поділюсь трьома кейсами, які ми та наші учасники школи вирішували за допомогою Web Scraping. Але насправді таких кейсів у рекрутингу набагато більше.
Кейс 1. Зібрати емейли для розсилки
Найпростіший спосіб – використовувати інструмент Email extractor Ірини Шамаєвої. Він швидко в один клік копіює в буфер обміну всі пошти на сторінці і далі вставляє у таблицю. Одного разу таким чином я вивантажила 500 пошт за 5 хвилин.
Де можна використовувати:
- Github
- X-ray запити (наприклад: site:linkedin.com/in "gmail.com" "Java developer" Ukraine)
- TurboHiring
Для того щоб не переходити на кожну сторінку вибірки окремо, можна використовувати один із інструментів (які під час скролінгу з'єднують результати в одну довгу сторінку):
Якщо крім пошт вам також потрібні імена та додаткова інформація, спробуйте використати Instant Data Scraper чи Data Miner.
Кейс 2. Вивантажити одним списком учасників груп та івентів
Де можна використовувати:
- Групи у Facebook
- Meetup
- Групи в LinkedIn
- Slack
Для Facebook відмінно працює DIG. Тільки врахуйте, що у івентах він вивантажує лише людей, яких FB вам показує, тобто друзів. Тому для івентів його зручно використовувати тільки у випадку, якщо ви їх організовуєте.
Але в групах, де список учасників відкритий, можна вивантажити всіх.
Для Meetup я люблю використовувати Spider. Він легкий у використанні, просто підсвічуєте та вибираєте потрібні дані для вивантаження.
Кейс 3. Автоматизувати якесь рутинне завдання для соціальних мереж
Що ми робили:
- автоматично приймали запити у друзі у Linkedin;
- автоматично надсилали запити до LinkedIn з метою розширення контактів.
Для цих цілей ідеально підходить PhantomBuster – мій улюблений інструмент, точніше store з інструментами. У ньому ви можете знайти все, що завгодно для різних цілей та ресурсів.
Якщо вам потрібно попрацювати з великими обсягами даних або автоматизувати свої повторювані дії, подивіться на ці інструменти. Вони однозначно полегшать вам життя та заощадять трохи часу.
Дізнатися більше про інструменти та подивитися вебінари з Web Scraping можна на курсі "Сорсер: де ще пошукати?" у EvoTalents.School.