• Розмітка веб сайтів (Дата Лейбелінг)

    Потрібна людина, яка не боїться визначати селектори на html сторінках. Потрібно буде визначити з html сторінки css селектори, які вказують на конкретні елементи сторінки для списку із ~1000 сайтів. Для цього завдання вистачить базового розуміння html, css (досвід не обов'язковий, але буде великим плюсом), та посидючості / послідовності.

    Опис завдання:

    - для кожного сайту, зазначеного у таблиці, необхідно вказати:

    1. в пагінаційних сторінках визначити тип пагінації
    2. визначити чи дані підтягуються на сторінку динамічно чи статично при завантаженні основної сторінки
    3. визначити пагінаційні селектори
    4. на контентних сторінках витягнути селектори контенту

    Для тих сайтів, які не відкриваються, використовувати VPN

    Після виконання таблиці та перевірки заповнення невалідні результати по певних сайтах можуть бути повернуті на доопрацювання.

    Будь ласка, вкажіть оплату та час за 1 розібраний сайт. Для зручності, можете орієнтуватися на перше завдання у приблизно 1000 сайтів.

    Вимоги до кандидата(ки):

    1. Вміння виконувати ручну роботу
    2. Досвід у веб скрейпінгу / веб розробці буде перевагою
    3. Розуміння html / css буде перевагою
    4. Згода виконати тестове завдання - розібрати перші 10 сайтів (тестове завдання однакове для всіх та доступне за публічним посиланням: https://docs.google.com/spreadsheets/d/1anjl4oD2wHzWyw_Es_4g1mByFg9lvhDjQYAvtrnL0Js/edit?usp=sharing)
    5. Згода пройти навчання (невеликий урок-інструкцію із рекомендаціями роботи)

    Умови роботи:

    1. Середньострокова співпраця (1-3 міс.)
    2. Оплата по факту виконаної роботи (за кожен розібраний сайт. Можемо зафіксувати задачу на 500-1000 сайтів)
    3. Робота через сейф
    4. Роботу необхідно виконати вручну, без використання gpt та інших моделей, задля точності результатів
    Будь ласка, перед відправкою завдання, коротко опишіть свій досвід по роботі із html, css, чи ви базово розумієте принцип роботи веб селекторів і як їх визначати, використовуючи дебаг панель браузера

Наверх