Мало собрать данные по постам в паблике.
Надо понять, что с этими данными потом делать.
Например:
1) разбить посты по категориям, в зависимости от количества лайков. И пометить их в отдельном столбце.
Так можно будет посмотреть КАКОЕ СОДЕРЖИМОЕ собирает больше лайков в конкретном паблике.
2) построить график количества лайков от месяца, дня недели. Если у нас достаточно данных (за несколько лет), то можно будет узнать, есть ли коррелляция между месяцем (т.к. месяц определяет сезон, праздники, контекст поведения), днём недели (день недели тоже определяет контекст поведения) и собственно самим поведением подписчиков (лайки, комменты, репосты).
Надо понять, что с этими данными потом делать.
Например:
1) разбить посты по категориям, в зависимости от количества лайков. И пометить их в отдельном столбце.
Так можно будет посмотреть КАКОЕ СОДЕРЖИМОЕ собирает больше лайков в конкретном паблике.
2) построить график количества лайков от месяца, дня недели. Если у нас достаточно данных (за несколько лет), то можно будет узнать, есть ли коррелляция между месяцем (т.к. месяц определяет сезон, праздники, контекст поведения), днём недели (день недели тоже определяет контекст поведения) и собственно самим поведением подписчиков (лайки, комменты, репосты).
Что получилось с функциями парсинга можно посмотреть тут — https://github.com/yaroslavkorenskoy/parser-and-analytics-for-vkcom/blob/main/vk%20api%20parser%20-%20wall%20get.ipynb
Без аналитики. Просто сбор и отображение.
Без аналитики. Просто сбор и отображение.
GitHub
parser-and-analytics-for-vkcom/vk api parser - wall get.ipynb at main · iaroslav-korenskoi/parser-and-analytics-for-vkcom
Get data from vk.com with API requests, interact with data via Pandas, draw graphs, export data into Excel sheets and PowerPoint presentations - iaroslav-korenskoi/parser-and-analytics-for-vkcom
🔥Оооооо, какая красота получилась в аналитике!
Очень интересные наблюдения. Ща покажу.
Очень интересные наблюдения. Ща покажу.
Паблик ведёт деятельность непрерывно и активно с 2017 года.
В паблике 148 843 подписчиков на данный момент, и около 7 тысяч постов.
В паблике 148 843 подписчиков на данный момент, и около 7 тысяч постов.
🔥И что интересно — посмотрите на график лайков и репостов. Они совпадают. Логично, пост выложили, набежали, полайкали, и отрепостили сразу.
А вот комменты...
Смотрите, пик комментов не совпадает с пиками лайков и репостов.
Либо по вторникам публикуют посты, которые заточены под механику комментирования. Очень хочется подумать, что по вторникам народ пробивает на "по-болтать". Но причина скорее всего скучная и рациональная.
Можно разложить посты по дням и по годам, посмотреть, сохраняется ли такой же тренд каждый год, или это последние два года так повлияли (т.к. паблик за последние два года вырос с 50 тыс до 150 тыс подписчиков. На сотку. Или даже больше).
А вот комменты...
Смотрите, пик комментов не совпадает с пиками лайков и репостов.
Либо по вторникам публикуют посты, которые заточены под механику комментирования. Очень хочется подумать, что по вторникам народ пробивает на "по-болтать". Но причина скорее всего скучная и рациональная.
Можно разложить посты по дням и по годам, посмотреть, сохраняется ли такой же тренд каждый год, или это последние два года так повлияли (т.к. паблик за последние два года вырос с 50 тыс до 150 тыс подписчиков. На сотку. Или даже больше).
Новая модификация скрипта — теперь он может собирать любое количество пабликов, заданное в константе. Пока это просто короткий скрипт, в функцию не завёрнут, но уже работает исправно.
Также добавил сбор from_id, чтобы можно было сортировать посты на "опубликованные от имени паблика" и "опубликованные в паблике, но с указанием авторства", чтобы можно было собрать статистику по авторам контента.
И, например, определить самых активных, или самых залайканых (хороших) авторов.
Вообще, сегодня отдохнул немного, а то в прошлые дни плотно впахал, но сильно не расслаблялся. Практиковался в ф-строках, и компрехеншенах. Т.к. на курсах про них было сказано коротко, и без толкового разбора практического применения. А мне указали, что в коде можно часть кода переписать именно на дикт-компрехеншены.
Также добавил сбор from_id, чтобы можно было сортировать посты на "опубликованные от имени паблика" и "опубликованные в паблике, но с указанием авторства", чтобы можно было собрать статистику по авторам контента.
И, например, определить самых активных, или самых залайканых (хороших) авторов.
Вообще, сегодня отдохнул немного, а то в прошлые дни плотно впахал, но сильно не расслаблялся. Практиковался в ф-строках, и компрехеншенах. Т.к. на курсах про них было сказано коротко, и без толкового разбора практического применения. А мне указали, что в коде можно часть кода переписать именно на дикт-компрехеншены.
НЕ ЗНАЮ как это получилось, но парсер вытащил то, что не должен был вытащить 😂
Я вытащил пост, который создан РАНЬШЕ самого раннего поста (на текущий момент) в паблике.
При этом настройка 'owner' стоит. Т.е. АПИ должен отдавать только опубликованные на стене в настоящий момент.
Магия блять. Переписал на компрехеншены блять.
Я вытащил пост, который создан РАНЬШЕ самого раннего поста (на текущий момент) в паблике.
При этом настройка 'owner' стоит. Т.е. АПИ должен отдавать только опубликованные на стене в настоящий момент.
Магия блять. Переписал на компрехеншены блять.
Блять, ВК АПИ чтоль глючит????
Теперь вместо 181 поста, мне вообще вернула функция 9. Именно не функция распарсинга, а функция СБОРА всех постов с ВК.
А я её ВООБЩЕ НЕ МЕНЯЛ.
БЛять магия не иначе.
Дебажу дальше.
Теперь вместо 181 поста, мне вообще вернула функция 9. Именно не функция распарсинга, а функция СБОРА всех постов с ВК.
А я её ВООБЩЕ НЕ МЕНЯЛ.
БЛять магия не иначе.
Дебажу дальше.
Функция которая достаёт все посты, возвращает объект (список постов), на этот объект ссылается переменная all_posts.
В следующей инструкции, я циклом разбираю этот объект-список на отдельные объекты-посты.
И тут, ВНЕЗАПНО, последний элемент списка становится другим. И даже не один, а последние ДВА поста становятся другими.
КАК ЭТО ВОЗМОЖНО?
Если других запросов я не делал к серверу. Откуда эти другие данные подсосались???
В следующей инструкции, я циклом разбираю этот объект-список на отдельные объекты-посты.
И тут, ВНЕЗАПНО, последний элемент списка становится другим. И даже не один, а последние ДВА поста становятся другими.
КАК ЭТО ВОЗМОЖНО?
Если других запросов я не делал к серверу. Откуда эти другие данные подсосались???