VK Posts Parser
VK Posts Parser - шаблон для парсинга/граббинга постов со стен сообществ и/или профилей в ВК.
С помощью этого шаблоны можно:
- Отбирать посты по множеству различных фильтров
- Собрать подробную информацию о различных параметрах постов (CSV)
- Выкачивать посты целиком или их отдельные элементы
- SMM-специалистам
- Контент-менеджерам и тем кто ведет свои сообщества в различных соцсетях
- Рекламщикам, маркетологам, аналитикам
- Дорвейщикам, арбитражникам, сеошникам
- Тем кому просто нужно скачать содержимое постов со стены или их отдельные элементы к себе на ПК
Результат работы шаблона
Результат состоит из двух составляющих:
1) CSV (Excel) файл с прошедшими все фильтры постами и их параметрами. Создается всегда.
2) Папки с выкаченными постами или их отдельными элементами. Какие конкретно элементы выкачивать вы задаете самостоятельно во входных настройках
Пример CSV файла с результатом парсинга. Таблица слишком широкая и не умещается на один экран, поэтому прикрепляю 2 скриншота (второй после скрола вправо).
Расшифровка столбцов CSV файла:
URL - это URL адрес конкретного поста в ВК.
timestamp - время публикации поста в формате Unix (количество секунд, прошедших с полуночи 1 января 1970 года). Чем свежее пост, тем больше эта цифра. Колонка удобна для сортировки постов по дате публикации.
datetime - время публикации поста в привычном нам формате ДД.ММ.ГГГГ ЧЧ:ММ ... при фильтрации данных в Excel удобно выделять определенные годы / месяцы / дни.
type - может иметь значение post или repost
likes - количество лайков (отметок нравится)
reposts - количество репостов
comments - количество комментариев
views - количество просмотров
images - количество картинок
video_total - общее количество видео в посте
video_youtube - количество видео с YoutTube
video_vimeo - количество видео с Vimeo
video_rutube - количество видео с RuTube
video_coub - количество видео с Coub
audio - количество аудиозаписей
doc_total - общее количество документов
doc_gif - количество документов GIF
doc_word - количество документов Word
doc_excel - количество документов Excel
doc_pdf - количество документов PDF
doc_ppt - колчичество документов PPT (Power Point)
doc_psd - количество документов PSD (PhotoShop)
text_len - количество симоволов текста
int_links - ( no/yes) - наличие внутренних ссылок
ext_links - ( no/yes) - наличие внешних ссылок
is_ads - помечен ли пост как реклама ( 1 - да | 0 - нет )
is_article - является ли пост ссылкой на статью (1 - да | 0 - нет)
can_comment - можно ли комментировать пост (1 - да | 0 - нет)
can_repost - можно ли репостнуть пост (1 - да | 0 - нет)
signer_id - идентификатор автора, если запись была опубликована от имени сообщества и подписана пользователем;
Важно
Шаблон работает именно с постами, статьи он не грабит! Во-первых, статья это вообще отдельная сущность, а не пост в привычном понимании этого слова. Когда Вы на какой-либо стене видите пост со ссылкой/кнопкой "Читать", то это именно то чем кажется - пост с прикрепленной ссылкой на статью, а не сама статья. Именно так он и грабится как пост состоящий из ссылки на статью. Во-вторых, ВК так и не выкатил API для работы со статьями, хотя уже давно обещали.
Таким образом, запретив в фильтрах внутренние ссылки, вы исключите все посты ссылающиеся на статьи! Так же это можно сделать в Excel, отфильтровав по полю is_article
Еще немного про шаблон
- Работает по POST/GET запросах без использования браузера, для получения данных использует VK API
- Умеет работать с прокси (хотя в большинстве случаев можно обойтись и без них)
- Может работать в многопотоке (хотя я рекомендую работать в 1 поток)
- Умеет работать с антикапча-сервисами antigate (anti-captcha) и rucaptcha + есть возможность разгадывать капчу вручную или через CapMonster2. Сразу хочу сказать что встретить капчу при таком виде парсинга - это еще ой как нужно постараться ;-)
- Каждый поток использует ВСЕ имеющиеся аккаунты ВК, они меняются при каждом новом обращении к API ... это позволяет парсить действительно крупные сообщества.
- Для работы нужны аккаунты ВК и возможно прокси. Для небольших сообществ хватит и 1 аккаунта без прокси, но если парсить нужно крупные сообщества, то желательно иметь несколько акков ВК! Я, например, использую 4-5 аккаунтов без прокси, хватает для парсинга практически любых сообществ.
- Написан целиком на C#
- Шаблон привязывается к вашей лицензии ZennoPoster.
- Шаблон закрыт от редактирования и имеет права только на выполнение.
- Шаблон будет работать на версиях ZP от 5.10.2.0
- Шаблон после покупки нельзя переоформить на другой email/id т.е вы не можете его перепродать или передать кому-то еще
- У меня нет манибэка! Если после покупки шаблона он вдруг по какой-либо причине стал вам не нужен, тема под которую вы хотели его использовать умерла или не оправдала себя, вы вдруг поняли что в интернете денег нет, то все эти аргументы не принимаются!
$10 или в рублях по курсу ЦБ
Апдейты / обновления
Багфиксы и обновления бесплатные.
Контакты
* Email: profitbunker(собака)gmail.com
* Skype: profitbunker ( имя в скайпе webguru )
* Telegram: @profitbunker
p.s Skype практически всегда находятся в невидимом режиме т.ч пишите не обращая внимания на показываемый оффлайн статус.
Если есть возможность, то отвечаю сразу, если нет, то как только такая возможность появится. Поэтому не нужно отдельно писать "привет", "как дела?", "есть вопрос" и ждать ответа ... сразу пишите что Вы с форума smm-profi по поводу VK Posts Parser и свой вопрос.
Для тех у кого нет программы ZennoPoster
Если у вас нет программы ZennoPoster и вы не хотите покупать её ради одного шаблона, могу выписать вам шаблон в ZennoBox. Это тот же ZennoPoster, но заточенный на выполнение исключительно купленных вами шаблонов и без возможности разрабатывать собственные шаблоны. ZennoBox обойдется вам в +10$ к стоимости шаблона.