Код в мешке
248 subscribers
9.02K photos
1.59K videos
2.11K files
42.3K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Forwarded from Ivan Begtin (Hovannes Begtin)
В качестве регулярных напоминаний в основе поисковика Dateno реестр почти всех существующих каталогов с данными. Этих каталогов много, более 10 тысяч и большая их часть - это каталоги геоданных, вторые по количеству - порталы открытых данных и далее научные репозитории, базы индикаторов и так далее.

Ценность этого репозитория не только в том что он помогает индексировать датасеты, но и в том что он позволяет понять национальным пр-вам и их уполномоченным органам какие данные можно было бы собирать на едином/центральном портале.

Кроме того этот реестр - это подсказка для тех кто ищет данные по своей стране и возможность находить, в том числе, те данные которые пока ещё не проиндексированы в Dateno.

#opendata #dateno #datasets #datadiscovery
Forwarded from Ivan Begtin (Ivan Begtin)
Для тех кто любит исследовать данные, любопытный open source проект с непереводимым, но благозвучным названием huey который внутри использует DuckDB-WASM, а на вход разные дата файлы - parquet, csv, json и др. и позволяет их исследовать прямо в браузере. Можно отнести его к категории data exploration tool, их всё больше, все немного разные и безусловно иногда необходимые.

Из минусов:
- не поддерживает CSV файлы с кодировками отличными от utf8
- не всегда умеет распознавать структуру файлов

Из плюсов:
- всё локально в браузере

#opensource #datatools #duckdb
Forwarded from Ivan Begtin (Ivan Begtin)
Свежая научная статья как дополнительное подтверждение того что начинающие разработчики всё менее востребованы, а опытные разработчики востребованы всё более. В выводах в статье ещё есть упоминание о том что более всего это бьёт по выпускникам ВУЗов средней руки, а вот лучшие и наиболее слабые затрагивает в меньшей степени.

Всё это про рынок труда в США, конечно же.

#ai #jobs #it
Forwarded from Ivan Begtin (Ivan Begtin)
GlobalBuildingAtlas набор данных по всем зданиям в мире, общим объёмом в 36 терабайт. Опубликован в апреле 2025 г. , доступен для полной выгрузки и как сервис WFS. Под лицензией CC-BY-NC 3.0 (свободное использование для некоммерческих целей)

#opendata #datasets #geodata
Forwarded from Ivan Begtin (Ivan Begtin)
В Южной Корее правительство планирует в ближайшее время опубликовать 15 особо ценных наборов данных для обучения ИИ и корпоративной поддержки. Первые данные необходимы для обучения ИИ агентов, например, в области LegalTech, вторые для типовых задач решаемых корпорациями и для которых нужны государственные данные. Обещают безопасное открытое раскрытие данных с заменой персональных данных на синтетические.

Всего же в Южной Корее опубликовано более 100 тысяч наборов данных и открытых API на национальном портале www.data.go.kr

В Корее есть совершенно чёткий акцент на данные востребованные бизнесом и на коммуникацию с бизнесом заинтересованном в данных и этой стратегии там придерживаются довольно давно.

#opendata #korea #datasets
Forwarded from Ivan Begtin (Ivan Begtin)
Perplexity анонсировали новое API для поиска https://www.perplexity.ai/hub/blog/introducing-the-perplexity-search-api надо потестить ибо больше API для поиска - это полезно и нужно.

#api #ai #websearch
Forwarded from Ivan Begtin (Ivan Begtin)
Полезный текст The End of the User Interface? о том что интерфейс чат-ботов и ИИ агентов сжирает все остальные интерфейсы пользователей и о будущем специалистов по UI/UX. Рассуждения полезны, а многочисленные ссылки на другие публикации ещё полезнее.

Я тоже размышлял на эту тему и мне такой подход к пользовательскому интерфейсу скорее не нравится. Хотя ИИ агенты умеет давать структурированные ответы, но не всегда работа через естественный язык удобнее чего-либо другого. К примеру, использование ИИ как персональных ассистентов удобно в одних задачах и неудобно в других. К, примеру, когда нужно описаться от конкретной рассылки в почте то можно использовать запрос естественным языком. А если надо отписаться от нескольких десятков и с ручным выбором рассылок, то естественный язык не годится.

Тут вопрос как скоро появятся динамический интерфейсы под разные задачи и насколько будут удобны они.

#thoughts #ui #ux
Forwarded from Ivan Begtin (Ivan Begtin)
Стартап с каталогами данных OpenDatSoft превратился на днях в компанию Huwise, а свой продукт теперь позиционируют как data product marketplace. Продукт у них довольно любопытный, структурированное храненилище данных с возможностью получения данных через API и в разнообразных форматах: JSON, CSV, Parquet, GeoJSON и др. Плюс довольно неплохой эксплорер данных с наглядным их просмотром и анализом. Часть внедрений этого каталога были внутрикорпоративные или в режиме компания + её партнёры, но не как каталоги открытых данных. Возможно они почувствовали что на корпоративном рынке денег больше и он выгоднее чем продолжать охватывать муниципалитеты и конкурировать за это с ArcGIS с их ArcGIS Hub.

В любом случае это сдвиг с бизнес модели порталов открытых данных в дата каталоги/дата маркетплейсы для корпоративных задач. В 2022 году они привлекли $25 миллионов инвестиций, а в общей сложности за 10 лет $35 миллионов, на свой SaaS продукт. Интересно как он будет меняться дальше, но чем больше он отходит от открытости тем он менее интересен, поскольку есть альтернативы с открытым кодом.

#opendata #startups #datacatalogs
Forwarded from Ivan Begtin (Ivan Begtin)
Sim, ещё один любопытный продукт оркестратор потоков данных со встроенной работой с промптами. Доступен под свободной лицензией Apache 2.0, имеет встроенное ИИ и сделан по архитектуре local-first и может использоваться без облачных сервисов, а для ИИ можно связать с Ollama.

Выглядит интересно для задач с минимальной дата инженерией и как альтернатива n8n.

#opensource #dataengineering #ai #datatools
Forwarded from Цифровой Журнал | IT, Neiroseti
Найден сервис, предоставляющий одноразовые номера — Receive SMS

Мобильные 12 стран на различных континентах, СМС-коды приходят прямо на сайт. Также есть временные электронные почты.

Почувствовать себя шпионом можно тут.
Forwarded from Нейродвиж
Бухгалтеры могут спать спокойно: исследователи проверили, как LLM справляются с типичными финансовыми задачами.

Они создали бенчмаркинг с реальными кейсами малого и среднего бизнеса за годы деятельности — счета, расчеты, перерасчеты.

С задачами за первые месяцы LLM справляются прекрасно, но дальше контекстное окно начинает подкидывать приколы: ошибки множатся, ИИ не могут свести дебет с кредитом, придумывают переводы. Другими словами: делают что угодно, лишь бы суммы сошлись.

Например, когда в Claude не сходились цифры, он просто искал в истории транзакции на необходимую сумму и записывал их повторно 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Десятки топовых тулз для программистов — забирайте универсальный сервис IT-Tool

Спецы собрали всё — калькуляторы, парсеры, конвертеры, чекеры, дешифраторы и шифраторы, генераторы. Инструменты работают локально и (!) бесплатно.

Пользуемся тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Мощный сервис для улучшения промтов — PrompTessor

Это не просто генератор подсказок, а ваш личный учитель промпт-инжиниринга: он ставит задачи, подсвечивает ошибки в запросах и предлагает улучшения.

Бесплатно учимся здесь.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Скачиваем любой контент без лимитов

Media Downloader поможет вытащить всё:

— плейлисты с YouTube, музыку.
— субтитры, обложки и списки таймкодов.
— прямые трансляции.
— сайты целиком.
— книги и торренты.

Поддерживает многопотоковую загрузку, работает даже на Windows 7, на русском языке.

Забираем тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Anthropic выпустили бесплатный гайд, который поможет выжать из нейронки все соки

Внутри доступно разбирают принципы работы с контекстом и системными промптами, роли и правильную подачу — со схемами и примерами.

Забираем тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM