Data Diggers
11 subscribers
83 photos
1 file
80 links
Канал об источниках открытых данных, поиске, сборе, обработке, инструментах и сопутствующих рисках.

собрать данные: @sergeymu
сотрудничество: @sergeymu
поддержать: https://www.donationalerts.com/r/datadiggers
Download Telegram
Супер полезная и удобная табличка со всеми крутыми нейронками для разных задач. Сохраняем, чтобы не потерять.

Подписаться — Data Diggers
В середине апреля в Госдуму внесли законопроект, который предусматривает штрафы за отсутствие маркировки интернет-рекламы — вплоть до 500-700 тысяч рублей. Это касается в том числе интеграций, которые компании закупают у блогеров.

Куда и что вносить, чтобы в будущем не нарваться на штрафы, рассказало агентство MOAB: со скриншотами из личного кабинета ОРД

vc.ru/marketing/668610 — сообщает канал vc.ru

#всемсидеть

Подписаться — Data Diggers
Открытые данные Минкультуры РФ (opendata.mkrf.ru)

Хорошо спроектированный и профессиональный движок для публикации открытых данных и для работы с данными в принципе. При том что там опубликовано всего 62 набора данных, но это данные относительно большого объёма, доступные по API, в разных форматах и с визуализацией. Очень хочется чтобы Минкультуры РФ не потеряло его, потому что то что я знаю так то что после кадровых преобразований в Минкультуры уже неизвестно кто им занимается. Ещё жаль что ни одного внедрения этого движка кроме как на сайте Минкультуры нет.

Платформа поставки данных ФНС России (vpd.nalog.gov.ru)

Это не открытые данные идеологически, но это инициатива по предоставлению чувствительных данных, как ещё говорят data sharing. Я слышал много положительных отзывов от людей в региональной власти в РФ о том что жаль что у других ФОИВов нет подобного или что они не предоставляют свои данные также через такую платформу.


История финансовой системы (https://minfin.gov.ru/ru/ministry/historylib/common/finance/fin_history)

Большая коллекция книг исторических бюджетов и других материалов опубликованных Минфином России в разделе у себя на сайте. Что важно - многие документы ещё Российской Империи и СССР. Полезно для тех кто изучает территорий входящих и входивших в эту местность. Активно используется многими историками. За многое Минфину РФ спасибо не скажешь, а за это конкретно спасибо.

Госрасходы (spending.gov.ru)

Здесь немного бесстыдной рекламы проектам к которые я когда-то создавал. Проект создан на базе госконтрактов, данных по госпрограммам, госпроектам и многим другим данным относящимся к госфинансам и расходам/доходам гос-ва. После того как я ушёл снова заниматься коммерческими и общественными проектами им уже несколько лет занимается Ольга Пархимович (@ahminfin), она изредка пишет про открытость госфинансов и открытые данные.

#bestpractices #russia #government #opendata #data — сообщает канал Ivan Begtin

Подписаться — Data Diggers
#Нефтянка
🛢 Росстат перестал публиковать данные о добыче нефти в РФ — сообщает канал Сигналы РЦБ

🔴 Подписаться — Data Diggers
https://youtu.be/mBoX_JCKZTE

Свежий курс от freeCodeCamp.org по фреймворку для скрайпинга и парсинга сайтов Scrapy

Подписаться — Data Diggers
Правительство РФ распорядилось приостановить до 1 апреля 2024 года публикацию статистики по добыче нефти, газа и конденсата — сообщает канал ТАСС

Подписаться — Data Diggers
Ещё один любопытный open source продукт Evidence [1] на сей раз для изменения подхода к Business Intelligence. Вместо того чтобы делать графики и сопровождающий текст к каком-либо веб интерфейсе, подход BI-as-a-code, а то есть ты пишешь код в Markdown и он преобразуется в текст и графики.

Причём всё это в маркдауне описывается как код графиков и SQL запросы. Запросы движок умеет делать ко всем популярным SQL движкам и CSV файлам.

В основе всё та же бизнес модель: открытый код для локальной работы и облачный сервис за деньги.

Мне нравится сама идея, Markdown кажется вполне подходящей основой для такого продукта и, учитывая что сам продукт под MIT лицензией, я бы не удивился что кто-то из BI игроков и рядом с ним может захотеть к своему продукту такое добавить.

Плюс это очень удобная штука для команд с инхаус разработкой, когда надо приделать аналитику с визуализацией для себя, а времени и желания на внедрение BI продукта нет.

Ссылки:
[1] https://evidence.dev

— сообщает канал Ivan Begtin

Подписаться — Data Diggers
Средний возраст населения России к 2100 году: прогноз

— сообщает канал Statist | Финансы и бизнес

Подписаться — Data Diggers
Всемирный банк начинает работу над проектом по оценке условий для ведения бизнеса Business Ready, который призван заменить ежегодный доклад Doing Business, отмененный в сентябре 2021 года из-за информации о нарушениях.

В опубликованном аудиторском докладе по данной программе говорилось, что сотрудники ВБ допускали различные нарушения при составлении рейтинга Doing Business, в частности показатели Китая, ОАЭ и Саудовской Аравии в нем были завышены, а Азербайджана были занижены.

В 2019 году РФ в этом рейтинге поднялась на 3 позиции и заняла 28-е место. При этом, как нам сообщил в октябре 2019 года исполнительный директор банка от РФ Роман Маршавин, место России в рейтинге Doing Business ВБ потенциально выше 28-го, так как банк учитывает не все реализуемые в стране реформы. РФ предлагала усовершенствовать методику подсчета, эти предложения банком изучались — сообщает канал ТАСС

Подписаться — Data Diggers
Опубликованы сведения организаций о суммах доходов и расходов за 2022 год, а также сведения о спецрежимах, применяемых налогоплательщиками
http://www.nalog.gov.ru/rn77/news/activities_fts/13444668/ — сообщает канал Федеральная Налоговая Служба России

Подписаться — Data Diggers
Forwarded from DD Moderator News
За чертой бедности впервые оказалось меньше 10% россиян — сообщает канал РБК
Планы иностранных компаний по дальнейшей работе в России — сообщает канал Рука рынка

Подписаться — Data Diggers
Доля малоимущих в России сократилась до рекордных 9,8% (14,3 миллиона человек).

С 1992 года показатель ни разу не опускался ниже 10%, пишет РБК.

Подписаться — Data Diggers
Forwarded from Russian OSINT
🤖Эксперты NewsGuard предупреждают об опасности развития нового поколения "контент-ферм", которые создаются при помощи ИИ

В апреле компания NewsGuard обнаружила 49 сайтов в сети интернет, которые почти полностью были написаны 🤖программами искусственного интеллекта. На подобных ресурсах размещаются низкосортные статьи в большом количестве в стиле "кликбейт" для оптимизации доходов от рекламы. Анализ показал, что сайты вероятно используют языковые модели по типу GPT для имитации "человечности", при этом фейковый или низкокачественный контент пишется с помощью ИИ на английском, китайском, чешском, французском, португальском, тагальском и тайском языках.

Контент генерируются в больших объемах - ✍️100 статей в сутки на самые различные темы, включая политику, здоровье, развлечения, финансы и технологии. Почти во всех материалах используется однообразный язык и повторяющиеся фразы, что свидетельствует о признаках использования искусственного интеллекта. Сайты создаются для получения дохода от алгоритмического размещения рекламы, считают эксперты.

🧠"Новое поколение контент-ферм уже на подходе", - бьют тревогу специалисты

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
РОЗНИЧНАЯ ТОРГОВЛЯ: РЕАЛЬНЫЙ ОБОРОТ В 1-М КВ БЫЛ НА 7.3% НИЖЕ ДОКРИЗИСНОГО УРОВНЯ

Статистика за март:

• В номинальном выражении: -2.9% vs 1.0% гг в феврале; за 1К23: 0.3% гг
• В реальном выражении: -5.1% vs -9.0% гг; за 1К23: -7.3% vs -9.6% гг в 4К22
• Продовольственная розница (в реальном): -3.0% vs -3.5% гг; за 1К23: -3.3% vs -3.9% гг в 4К22
• Непродовольственная розница (в реальном): -7.0% vs -13.6% гг; за 1К23: -10.6% vs -14.5% гг в 4К22

Росстат повысил оценку по рознице за 2022г с -6.7 до -6.5%. В 1К23 показатели «год к году» остаются в глубоком минусе. За скользящий год (последние 12 мес) падение составило -9.0% в сравнении с предыдущими 12 мес; в реальном выражении оборот в рознице опустился ниже уровня 2011г (левый граф).

Но надо отметить, что в 1-м кв ситуация выглядела лучше по сравнению с 4-м кв. Сезонно-сглаженный индекс двигался вверх все 3 месяца и, по-видимому, продолжил рост в апреле. Из-за провальной базы прошлого года в апреле ждём реальный рост: 7-7.5% гг — сообщает канал MMI

Подписаться — Data Diggers
ПОТРЕБИТЕЛЬСКИЙ СПРОС В МАРТЕ: ДИНАМИКА ЛУЧШЕ ПРОГНОЗОВ

Индекс потребительских расходов мы рассчитываем, как сумму оборота розницы, платных услуг и общепита. Дефлируя этот индекс на ИПЦ и получаем Индекс реальных расходов населения

Потребительские расходы в реальном выражении в марте: -1.7% гг VS -5.4% гг в феврале. Это чуть лучше, чем мы оценивали, по данным Сбериндекса (-2.0% гг). За 1К23 спад составил -3.9% гг. Из-за пересмотра вверх данных по рознице и общепиту провал реальных потребительских расходов в 2022г составил -3.8% (ранее мы оценивали: -4.1%). В апреле, судя по Сбериндексу, рост расходов мог составить 7-8% гг. Резкий выход в плюс – это не только эффект базы, но и быстрый рост на протяжении 1-го кв (правый граф), продолжившийся, по-видимому, и в апреле.

Столь быстрое восстановление потребительского спроса, как его рисует Росстат, слабо согласуется с подавленной инфляционной картиной, как в продовольственной, так и в непродовольственной рознице — сообщает канал MMI

Подписаться — Data Diggers
🚩Red flags в социологии

Социологические исследования помогают лучше понять общество и отследить динамику мнений. Однако не всем опросам можно доверять.

Мы уже рассказывали о манипуляциях в СМИ и о важности опросных формулировок. В этот раз собрали для вас «красные флаги» в социологии — тревожные звоночки, которые должны насторожить при изучении данных исследований.

А каким исследованиям доверяете вы? 🤔