[Парсинг]Сбор аудитории | BLB - Big little Business

[Парсинг]Сбор аудитории

Sordus

Специалист
05.01.2023
32
33
18
В этой теме постараюсь рассказать информацию по поводу сбора аудитории, а также работа с этой аудиторией + некоторые возможные проблемы для инвайта этой аудитории.
Спарсить определенную группу, довольно просто. Достаточно посмотреть официальное видео от разработчиков Telegram Expert. Но есть некоторые проблемы, с которыми вы можете столкнуться.


  • При инвайте определенной аудитории могут возникнуть трудности. Аккаунты могут получать флудвайты на 1-5 пользователе и вы можете посчитать, что группа в муте, но это не так (Стоит попробовать несколько доноров, чтобы проверить точно, заспамленные пользователи или группа в муте). По моим тестам, бывают проблемные группы для парсинга. Что это за группы? Это группы, откуда часто парсят аудиторию и инвайтят ее. Аккаунт который попадает на таких юзеров заспамленных, получает флудвайт.
    Заспамленные юзеры по моим прогнозам это те, которых часто инвайтят, а они жалуются и выходят.
  • Так же по моим тестам, заспамленных юзеров больше в маленьких группах для парсинга. Желательно парсить группы 5к+ юзеров.
  • По тестам еще было выявлено, что аккаунты получают флудвайты на заспамленных юзерерах всегда по разному. Чем больше таких юзеров, тем быстрей аккаунт получит флудвайт. К примеру парсил группу, где на 1-5 пользователе получал флудвайт, а бывают юзеры не особо заспамленные, аккаунты поулчают флудвайт на 15-20 человеках.
  • Так же бывают группы для парсинга где тяжелая аудитория, где большинство пользователей имеет приватность. Чем больше пользователей с приватностью, тем больше шансов, что аккаунт получит флудвайт.
Еще по тестам было выявлено, отдельная благодарность за тесты michael (https://blb.team/members/michael.8247/). Лучше всего инвайтятся пользователи, у которых есть заполненный столбец в базе time. Это пользователи у которых открыта информация, когда последний раз они были в сети.

1049770575_.png.4f90473552ceb7ae9defbf96278d97fb.png

Вообще инвайтятся пользователи которые и не имеют этих данных (time), которые скрыли свои данные, когда были в сети последний раз, но шансов больше, что их не получится успешно заинвайтить, а аккаунт получит флудвайт.

Чтобы очистить группу от проблемных пользователей которую мы спарсили мы можем воспользоваться модулем в софте.(Подмечаю, что не всегда требуется это делать, только с проблемной аудиторией, с которой возникают проблемы во время инвайта, мы можем исключить немного проблемных пользователей этим методом, чтобы уменьшить вероятность получения аккаунтами флудвайта. В самых проблемных группах, где большая часть аудитории уже заспамленная, это не поможет)

Переходим к модулю Сбор аудитории - Очистка баз.
Выбираем галочку принудительно исключить статусы.

  • Исключаем из базы пользователей которые онлайн - такие пользователи могут сразу отправить жалобу и аккаунт получит спамблок. Я обычно исключаю их, чтобы по возможности не получить спаблок, а дать аккаунту полностью отработать. Деалю это, с тяжелой аудиторией.
  • Оставляем UserStatusOffline, не исключаем их.
  • UserStatusRecently - это пользователи, которые не имеют данных time в таблице. Исключаем их, так как они закрыли доступ к информации, когда были в сети.
  • LastWeek, LastMonth, Empty убираем по желанию, но лучше конечно исключить их, так как пользователи не активные в телеграм, а вы их только спамите. От них больше шансов получить жалобу.
  • 786645841_.png.635fdf439c544532d3c94266fe9f42af.png
 
  • Like
Реакции: ZIALOT

Ruslan18

Неофит
18.11.2023
1
0
1
Пользуется кто-нибудь Гео парсером ? может кто нибудь подсказать как собрать массово много геоточек микрорайна, района города на сайте Яндекс Карты?