Forwarded from Ivan Begtin (Ivan Begtin)
Для тех кто интересуется разного рода международной таксономией, новая версия internacia-db управляемого справочника по странам и международным блокам в виде открытого репозитория приведенного к формату дата-продукта.
В новом релизе 1.5.0 по совокупности изменений:
- число стран/территорий расширено до 256 и теперь включает записи по непризнанным территориям вроде Приднестровья, Абхазии и тд.
- добавлены новые международные блоки которых теперь 1070, типы международных блоков по прежнему: экономические блоки, международные соглашения, межгосударственные организации и фонды, экономические группы стран (по классификация Всемирного банка и другим) и так далее. Всего более 86 типов международных группировок стран
- добавлена лицензия для данных которая CC-BY и provenance (происхождение) по отдельным полям данных в карточках записей.
- многие карточки включают обновленные метаданные: описания, официальные названия, сведения о странах участниках, статус участия и так далее.
Все данные опубликованы в форматах Parquet, YAML, JSON lines и в виде базы DuckDB.
Для чего нужна эта база?
1. Для обогащения данных при работе с любыми данными имеющими геопривязку к стране или международному блоку
2. Для задач визуализации данных, например, статистики в привязке к странам и международным блокам
3. Для сравнения стран и международных блоков
И тому подобных задач. Этот дата-продукт можно сравнить с pycountry пакетом для Python со справочником стран, но он больше, шире, детальнее и включает данные по международным блокам.
#opendata #dataproducts #data
В новом релизе 1.5.0 по совокупности изменений:
- число стран/территорий расширено до 256 и теперь включает записи по непризнанным территориям вроде Приднестровья, Абхазии и тд.
- добавлены новые международные блоки которых теперь 1070, типы международных блоков по прежнему: экономические блоки, международные соглашения, межгосударственные организации и фонды, экономические группы стран (по классификация Всемирного банка и другим) и так далее. Всего более 86 типов международных группировок стран
- добавлена лицензия для данных которая CC-BY и provenance (происхождение) по отдельным полям данных в карточках записей.
- многие карточки включают обновленные метаданные: описания, официальные названия, сведения о странах участниках, статус участия и так далее.
Все данные опубликованы в форматах Parquet, YAML, JSON lines и в виде базы DuckDB.
Для чего нужна эта база?
1. Для обогащения данных при работе с любыми данными имеющими геопривязку к стране или международному блоку
2. Для задач визуализации данных, например, статистики в привязке к странам и международным блокам
3. Для сравнения стран и международных блоков
И тому подобных задач. Этот дата-продукт можно сравнить с pycountry пакетом для Python со справочником стран, но он больше, шире, детальнее и включает данные по международным блокам.
#opendata #dataproducts #data
GitHub
GitHub - datenoio/internacia-db: Public registry of the intergovernmental organizations, country groups and countries. Available…
Public registry of the intergovernmental organizations, country groups and countries. Available as JSONl, Parquet, YAML and DuckDB database datasets - datenoio/internacia-db
Forwarded from Ivan Begtin (Ivan Begtin)
Подборка ссылок про данные, технологии и не только:
- Running local models is good now - автор пишет что, внезапно, но разработка ПО с помощью локальных моделей стала реалистичной. Она приводит в пример новую LLM Gemma-4-12b-qat достаточно компактную чтобы работать на ноутбуке с 64GB памяти и достаточно эффективную чтобы решать задачи работы с кодом.
- SpaceX to acquire Cursor for $60B in stock если кратко то компания AnySphere создателей среды разработки Cursor теперь куплена SpaceX. Я бы сказал что если Grok не начнут навязывать через Cursor, то это хорошая новость. Думаю что не будут и думаю что это не последнее приобретение SpaceX
- GenSpark - стартап/сервис-ИИ агента сравнимый с Manus. В моих тестах неожиданно хорошо показал себя на Deep Research задачах. Сервисов таких до сих пор не так уж много и можно разориться уже если тестировать их все.
- Bigset агент с открытым кодом по созданию датасетов из веб-поиска. Вбиваешь что-то вроде "AI infrastructure startups hiring backend engineers" и получаешь CSV файл на выходе. Концептуально напоминает сервис Webhound, там открытого кода нет, только SaaS. Правда и Bigset хоть и с открытым кодом, но зависит от коммерческого сервиса Tinyfish через который он делает веб поиск.
#opensource #ai #tools
- Running local models is good now - автор пишет что, внезапно, но разработка ПО с помощью локальных моделей стала реалистичной. Она приводит в пример новую LLM Gemma-4-12b-qat достаточно компактную чтобы работать на ноутбуке с 64GB памяти и достаточно эффективную чтобы решать задачи работы с кодом.
- SpaceX to acquire Cursor for $60B in stock если кратко то компания AnySphere создателей среды разработки Cursor теперь куплена SpaceX. Я бы сказал что если Grok не начнут навязывать через Cursor, то это хорошая новость. Думаю что не будут и думаю что это не последнее приобретение SpaceX
- GenSpark - стартап/сервис-ИИ агента сравнимый с Manus. В моих тестах неожиданно хорошо показал себя на Deep Research задачах. Сервисов таких до сих пор не так уж много и можно разориться уже если тестировать их все.
- Bigset агент с открытым кодом по созданию датасетов из веб-поиска. Вбиваешь что-то вроде "AI infrastructure startups hiring backend engineers" и получаешь CSV файл на выходе. Концептуально напоминает сервис Webhound, там открытого кода нет, только SaaS. Правда и Bigset хоть и с открытым кодом, но зависит от коммерческого сервиса Tinyfish через который он делает веб поиск.
#opensource #ai #tools
Vickiboykis
Running local models is good now
Local agentic coding has gotten great over the past few months
Forwarded from Ivan Begtin (Ivan Begtin)
Полезные ссылки про данные, технологии и не только:
- Digital Government Outlook 2026 обзор ОЭСР по странам ОЭСР и странам которые они мониторят о их прогрессе в части цифровой инфраструктуры. Там много разного по развитым странам, из того что стоило бы отметить так это нулевые оценки Турции по Data accessibility и крайне низкие по открытости данных в целом, общая оценка 0.06. Чему я не удивлен, потому что в Турции на редкость много порталов открытых данных отдельных регионов и отсутствует национальная инициатива. Причем очень странно почему поскольку её есть из чего собирать. По другим странам тоже много интересного, полезно почитать всем кто изучает цифровизацию гос-ва.
- Clear свежий язык разработки и спецификаций одновременно созданный специально для работы ИИ агентов. Плюсы - он простой, минусы - примерно те же, он простой. В копилку языков ориентированных на работу с LLM больше чем на людей
- Lore система контроля версий нового поколения с акцентом на хранение бинарных файлов, а не просто текстового кода. Создано внутри Epic Games и надо полагать с акцентом на их задачи, работы не только с кодом, но и большими объемами бинарных ресурсов внутри игр
- Cursor Origin преданонсированный сервис от Cursor'а в виде Git'а для агентов. Звучит как заявка на конкуренцию с Github'ом, так что любопытно, хотя и не может быть просто
#ai #opensource #government #digital
- Digital Government Outlook 2026 обзор ОЭСР по странам ОЭСР и странам которые они мониторят о их прогрессе в части цифровой инфраструктуры. Там много разного по развитым странам, из того что стоило бы отметить так это нулевые оценки Турции по Data accessibility и крайне низкие по открытости данных в целом, общая оценка 0.06. Чему я не удивлен, потому что в Турции на редкость много порталов открытых данных отдельных регионов и отсутствует национальная инициатива. Причем очень странно почему поскольку её есть из чего собирать. По другим странам тоже много интересного, полезно почитать всем кто изучает цифровизацию гос-ва.
- Clear свежий язык разработки и спецификаций одновременно созданный специально для работы ИИ агентов. Плюсы - он простой, минусы - примерно те же, он простой. В копилку языков ориентированных на работу с LLM больше чем на людей
- Lore система контроля версий нового поколения с акцентом на хранение бинарных файлов, а не просто текстового кода. Создано внутри Epic Games и надо полагать с акцентом на их задачи, работы не только с кодом, но и большими объемами бинарных ресурсов внутри игр
- Cursor Origin преданонсированный сервис от Cursor'а в виде Git'а для агентов. Звучит как заявка на конкуренцию с Github'ом, так что любопытно, хотя и не может быть просто
#ai #opensource #government #digital
OECD
Digital Government Outlook 2026
Governments today face a growing disconnect between rising expectations for speed, adaptability and responsiveness, and institutional systems that have not kept pace. Digital technologies and data are no longer optional enablers; they have become core infrastructure…
Forwarded from Ivan Begtin (Ivan Begtin)
Probably аналитический инструмент для работы с данными локально на своем компьютере. На вход получает датасет в одном из популярных форматов и далее позволяет в режиме чата делать к нему запросы. Позиционируется как local-first продукт где данные не загружаются в облако и облака используются только для вызовов к LLM.
Умеет делать графики и простой анализ данных.
Что нравится:
- неожиданно стабильно работает и многое может для относительно молодого продукта
- удобный и работоспособный интерфейс
Что не нравится:
- закрытый код, для меня open source вариант всегда приоритетнее
- нет режима local-only, скорее всего из-за бизнес модели подписки и кредитов
- непрозрачная работа с облачными LLM. Нет BYOK, нет поддержки локальных LLM сервисов для работы с командной строки, непонятно какая LLM используется в облаке и непонятно какой объем данных передается
- нет общедоступной информации о разработчике на сайте
Впрочем стартап этот совсем свежий, они только-только подняли $9 миллионов на Seed раунде и надо за ними внимательно понаблюдать.
#data #datatools #ai
Умеет делать графики и простой анализ данных.
Что нравится:
- неожиданно стабильно работает и многое может для относительно молодого продукта
- удобный и работоспособный интерфейс
Что не нравится:
- закрытый код, для меня open source вариант всегда приоритетнее
- нет режима local-only, скорее всего из-за бизнес модели подписки и кредитов
- непрозрачная работа с облачными LLM. Нет BYOK, нет поддержки локальных LLM сервисов для работы с командной строки, непонятно какая LLM используется в облаке и непонятно какой объем данных передается
- нет общедоступной информации о разработчике на сайте
Впрочем стартап этот совсем свежий, они только-только подняли $9 миллионов на Seed раунде и надо за ними внимательно понаблюдать.
#data #datatools #ai
Forwarded from Ivan Begtin (Ivan Begtin)
Новая популярная "игрушка" сервис In the weights по поиску себя или кого-угодно еще в ведущих LLM моделях.
Выглядит забавно, с одной стороны, а с другой косвенная демонстрация применимости LLM в OSINT задачах и что, к примеру, "законы о забвении" и все подобное по удалению результатов поиска будет слабо применимо к LLM, как минимум еще долгое время.
#funny #ai
Выглядит забавно, с одной стороны, а с другой косвенная демонстрация применимости LLM в OSINT задачах и что, к примеру, "законы о забвении" и все подобное по удалению результатов поиска будет слабо применимо к LLM, как минимум еще долгое время.
#funny #ai
Forwarded from Библиотека программиста
🎥 До открытого урока — несколько дней. Подготовили небольшую подборку материалов от нашего спикера Дмитрия Юдина.
Дмитрий руководит AI/ML-направлением в Сloud․ru и развивает Evolution AI Factory — среду для работы с GenAI: от инфраструктуры обучения LLM до внедрения интеллектуальных агентов.
С чего начать:
📺 AI-инструменты для разработчиков — как код, автотесты и ассистенты меняют рутину инженера.
📺 AI-эволюция бизнеса в эпоху генеративных моделей — агентные системы в реальных продуктах.
📺 Разработка мертва? — дискуссия о будущем профессии и роли AI в ней.
📖 Применение LLM в бизнесе — статья Дмитрия о практике внедрения и роли облака.
Одна из ключевых тем Дмитрия — практическое применение агентных систем и их ограничения.
Именно об этом — бесплатный урок 18 июня в 19:00: «Мультиагентные системы: почему большинство архитектур переусложнены» 🔥
🎁 Для участников подготовили промокод на скидку 10 000 ₽ на курс «Разработка ИИ-агентов».
👉 Успей занять место на открытом уроке
Дмитрий руководит AI/ML-направлением в Сloud․ru и развивает Evolution AI Factory — среду для работы с GenAI: от инфраструктуры обучения LLM до внедрения интеллектуальных агентов.
С чего начать:
📺 AI-инструменты для разработчиков — как код, автотесты и ассистенты меняют рутину инженера.
📺 AI-эволюция бизнеса в эпоху генеративных моделей — агентные системы в реальных продуктах.
📺 Разработка мертва? — дискуссия о будущем профессии и роли AI в ней.
📖 Применение LLM в бизнесе — статья Дмитрия о практике внедрения и роли облака.
Одна из ключевых тем Дмитрия — практическое применение агентных систем и их ограничения.
Именно об этом — бесплатный урок 18 июня в 19:00: «Мультиагентные системы: почему большинство архитектур переусложнены» 🔥
🎁 Для участников подготовили промокод на скидку 10 000 ₽ на курс «Разработка ИИ-агентов».
👉 Успей занять место на открытом уроке
Forwarded from Библиотека программиста
🧬 Компания Mimulus предлагает хранить данные в ДНК
Стартап представил Glacier Storage Card — карту размером с банковскую, внутри которой данные записаны в молекулы ДНК.
Заявленные характеристики выглядят как научная фантастика:
Чтобы записать данные, их нужно загрузить в Mimulus. Через некоторое время компания отправит вам карту с ДНК. А для восстановления карту придётся отправить обратно — файлы обещают вернуть в течение 48 часов.
Записали бы свой архив на ДНК❓
🤔— звучит как будущее
🌚 — пока слишком экзотично
🐸 Библиотека программиста
#news
Стартап представил Glacier Storage Card — карту размером с банковскую, внутри которой данные записаны в молекулы ДНК.
Заявленные характеристики выглядят как научная фантастика:
▪️ до 1 Эбайт данных на карту
▪️ срок хранения до 10 000 лет
▪️ не требует питания
▪️ не боится вирусов и шифровальщиков
Чтобы записать данные, их нужно загрузить в Mimulus. Через некоторое время компания отправит вам карту с ДНК. А для восстановления карту придётся отправить обратно — файлы обещают вернуть в течение 48 часов.
Записали бы свой архив на ДНК
🤔— звучит как будущее
🌚 — пока слишком экзотично
#news
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста
В 2015 году инженер Google Kelsey Hightower создал проект nocode, который полностью состоит из… отсутствия кода.
Лучший способ написать безопасное и надёжное приложение — ничего не писать и нигде не разворачивать.
В репозитории нет исходников, нет сборки и нет релизов. Зато есть десятки тысяч звёзд и тысячи форков 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста
Яндекс выложил в опенсорс YaFF — zero-copy формат для Protobuf, который в некоторых сервисах позволил снизить потребление CPU на 10–20%.
Меньше десериализации — больше ресурсов на полезную работу
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста
Для сравнения: в 2025 году их было около 1 млрд
Рост оказался настолько резким, что Microsoft пришлось привлекать мощности AWS, хотя последние годы GitHub активно переводили на Azure.
🔥 — Copilot окупается
😁 — Зато ревью стало больше
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста
🤖 Используешь AI для написания кода? В Яндексе покажут, как применять AI для реальных задач разработки.
23 июня в 19:00 совместно с Яндексом проведём открытый урок «AI-инструменты в разработке: как писать код быстрее с помощью ассистентов».
Спикер — Ольга Лукьянова, руководитель команды поиска и навигации по коду в SourceCraft. Более 18 лет развивала инструменты для разработчиков в JetBrains и руководила разработкой IDE в Huawei.
Что получишь на уроке:
— поймёшь, как использовать AI-ассистентов и облачных агентов в работе;
— научишься быстрее разбираться в новых проектах и кодовой базе;
— узнаешь, какие задачи стоит отдавать AI и как получать качественный результат;
— увидишь полный workflow работы с AI: от постановки задачи до код-ревью.
На уроке — живой разбор реального проекта с кодом. Ольга покажет промпты из рабочих сценариев и ответит на ваши вопросы в Q&A.
⚠️ Количество мест ограничено
🗓️ Когда: 23 июня, 19:00 (МСК)
👉 Занять место на открытом уроке
23 июня в 19:00 совместно с Яндексом проведём открытый урок «AI-инструменты в разработке: как писать код быстрее с помощью ассистентов».
Спикер — Ольга Лукьянова, руководитель команды поиска и навигации по коду в SourceCraft. Более 18 лет развивала инструменты для разработчиков в JetBrains и руководила разработкой IDE в Huawei.
Что получишь на уроке:
— поймёшь, как использовать AI-ассистентов и облачных агентов в работе;
— научишься быстрее разбираться в новых проектах и кодовой базе;
— узнаешь, какие задачи стоит отдавать AI и как получать качественный результат;
— увидишь полный workflow работы с AI: от постановки задачи до код-ревью.
На уроке — живой разбор реального проекта с кодом. Ольга покажет промпты из рабочих сценариев и ответит на ваши вопросы в Q&A.
⚠️ Количество мест ограничено
🗓️ Когда: 23 июня, 19:00 (МСК)
👉 Занять место на открытом уроке
Forwarded from Библиотека программиста
Какой и когда из них нужен?
Держите компактную шпаргалку по основным React Hooks с примерами и пояснениями.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Библиотека программиста
🤖 Мы тут подготовили небольшую игру по ИИ-агентам
В ней нужно собрать AI-агента на LangGraph: выбрать узлы, пройти развилки и запустить собственный workflow.
Никакой теории — сразу практика. Можно наглядно увидеть, как работают агентные системы, проверьте свои знания или показать другим как это всё работает 🔥
🎁 За прохождение получите персональную скидку на курс. Чем больше баллов наберете — тем больше будет скидка.
Плюс сейчас действует предложение: покупаешь 1 курс, получаешь еще 2 любых в подарок. Для этого надо будет оставить заявку на сайте академии после прохождения игры.
🚀 Собрать своего AI-агента
В ней нужно собрать AI-агента на LangGraph: выбрать узлы, пройти развилки и запустить собственный workflow.
Никакой теории — сразу практика. Можно наглядно увидеть, как работают агентные системы, проверьте свои знания или показать другим как это всё работает 🔥
🎁 За прохождение получите персональную скидку на курс. Чем больше баллов наберете — тем больше будет скидка.
Плюс сейчас действует предложение: покупаешь 1 курс, получаешь еще 2 любых в подарок. Для этого надо будет оставить заявку на сайте академии после прохождения игры.
🚀 Собрать своего AI-агента
Forwarded from Библиотека программиста
22 лекции по алгоритмам, структурам данных, языку C, веб-разработке и другим фундаментальным темам Computer Science.
Многие разработчики считают CS50 одним из лучших курсов для построения сильной базы. После него гораздо проще изучать новые языки и технологии.
Please open Telegram to view this post
VIEW IN TELEGRAM
Как я строил трактор(RAG) для клумбы, а клумбы не оказалось #habr
https://habr.com/ru/articles/1049344/
Tags: RAG, llm, ии-агент
Author: Front-Den
https://habr.com/ru/articles/1049344/
Tags: RAG, llm, ии-агент
Author: Front-Den
Хабр
Как я строил трактор(RAG) для клумбы, а клумбы не оказалось
Зачем и для кого статья? Для тех, кто хочет сделать своего ИИ-помощника, удобный поисковик. Кому интересна тема RAG в целом. Кто хочет понять, как это всё работает изнутри, на живом примере, а не на...
Проект, от которого все отказались, за полгода принёс +234% выручки. Секрет: я перестал делать вид, что работа идёт #habr
https://habr.com/ru/articles/1049354/
Tags: управление проектами, project management, time and materials, портфель проектов, регламент взаимодействия, SharePoint СЭД, работа с заказчиком, антикризисное управление, кейс PM, AS IS - TO BE
Author: outmilker
https://habr.com/ru/articles/1049354/
Tags: управление проектами, project management, time and materials, портфель проектов, регламент взаимодействия, SharePoint СЭД, работа с заказчиком, антикризисное управление, кейс PM, AS IS - TO BE
Author: outmilker
Хабр
Проект, от которого все отказались, за полгода принёс +234% выручки. Секрет: я не стал делать вид, что работа сама идёт
Кейс: как я зашёл в 5 «мёртвых» T&M-проектов, которые никто не хотел вести, и превратил их в портфель на 1,5 года с ростом выручки в 5–6 раз Оглавление Ситуация: 5 проектов, от которых все...
GitHub не умирает — но AI-агенты уже строят себе другой GitHub #habr
https://habr.com/ru/articles/1049358/
Tags: Git, GitHub, AI-агенты, Cursor, Zed, контроль версий, DevOps
Author: opium
https://habr.com/ru/articles/1049358/
Tags: Git, GitHub, AI-агенты, Cursor, Zed, контроль версий, DevOps
Author: opium
Хабр
GitHub не умирает — но AI-агенты уже строят себе другой GitHub
Представьте обычный день в команде, которая всерьёз пустила AI-агентов в разработку. Пять агентов одновременно правят код в пяти ветках. К обеду — двадцать веток, очередь pull request’ов,...
Сладкие оковы вайб- к̶о̶д̶и̶н̶г̶а̶ инжиниринга [часть 2] #habr
https://habr.com/ru/companies/bothub/articles/1048224/
Tags: агенты, агентское программирование, llm, cline, vscode, vscode extension, c++
Author: rsashka (BotHub)
https://habr.com/ru/companies/bothub/articles/1048224/
Tags: агенты, агентское программирование, llm, cline, vscode, vscode extension, c++
Author: rsashka (BotHub)
Хабр
Сладкие оковы вайб- к̶о̶д̶и̶н̶г̶а̶ инжиниринга [часть 2]
Это вторая статья об использовании LLM в проекте разработки компилятора языка программирования как транспилятора в код на C++. Я продолжаю историю и хочу рассказать о своих наблюдениях и впечатлениях...