Код в мешке
248 subscribers
9.02K photos
1.59K videos
2.11K files
42.3K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Forwarded from Ivan Begtin (Hovannes Begtin)
В качестве регулярных напоминаний в основе поисковика Dateno реестр почти всех существующих каталогов с данными. Этих каталогов много, более 10 тысяч и большая их часть - это каталоги геоданных, вторые по количеству - порталы открытых данных и далее научные репозитории, базы индикаторов и так далее.

Ценность этого репозитория не только в том что он помогает индексировать датасеты, но и в том что он позволяет понять национальным пр-вам и их уполномоченным органам какие данные можно было бы собирать на едином/центральном портале.

Кроме того этот реестр - это подсказка для тех кто ищет данные по своей стране и возможность находить, в том числе, те данные которые пока ещё не проиндексированы в Dateno.

#opendata #dateno #datasets #datadiscovery
Forwarded from Ivan Begtin (Ivan Begtin)
Для тех кто любит исследовать данные, любопытный open source проект с непереводимым, но благозвучным названием huey который внутри использует DuckDB-WASM, а на вход разные дата файлы - parquet, csv, json и др. и позволяет их исследовать прямо в браузере. Можно отнести его к категории data exploration tool, их всё больше, все немного разные и безусловно иногда необходимые.

Из минусов:
- не поддерживает CSV файлы с кодировками отличными от utf8
- не всегда умеет распознавать структуру файлов

Из плюсов:
- всё локально в браузере

#opensource #datatools #duckdb
Forwarded from Ivan Begtin (Ivan Begtin)
Свежая научная статья как дополнительное подтверждение того что начинающие разработчики всё менее востребованы, а опытные разработчики востребованы всё более. В выводах в статье ещё есть упоминание о том что более всего это бьёт по выпускникам ВУЗов средней руки, а вот лучшие и наиболее слабые затрагивает в меньшей степени.

Всё это про рынок труда в США, конечно же.

#ai #jobs #it
Forwarded from Ivan Begtin (Ivan Begtin)
GlobalBuildingAtlas набор данных по всем зданиям в мире, общим объёмом в 36 терабайт. Опубликован в апреле 2025 г. , доступен для полной выгрузки и как сервис WFS. Под лицензией CC-BY-NC 3.0 (свободное использование для некоммерческих целей)

#opendata #datasets #geodata
Forwarded from Ivan Begtin (Ivan Begtin)
В Южной Корее правительство планирует в ближайшее время опубликовать 15 особо ценных наборов данных для обучения ИИ и корпоративной поддержки. Первые данные необходимы для обучения ИИ агентов, например, в области LegalTech, вторые для типовых задач решаемых корпорациями и для которых нужны государственные данные. Обещают безопасное открытое раскрытие данных с заменой персональных данных на синтетические.

Всего же в Южной Корее опубликовано более 100 тысяч наборов данных и открытых API на национальном портале www.data.go.kr

В Корее есть совершенно чёткий акцент на данные востребованные бизнесом и на коммуникацию с бизнесом заинтересованном в данных и этой стратегии там придерживаются довольно давно.

#opendata #korea #datasets
Forwarded from Ivan Begtin (Ivan Begtin)
Perplexity анонсировали новое API для поиска https://www.perplexity.ai/hub/blog/introducing-the-perplexity-search-api надо потестить ибо больше API для поиска - это полезно и нужно.

#api #ai #websearch
Forwarded from Ivan Begtin (Ivan Begtin)
Полезный текст The End of the User Interface? о том что интерфейс чат-ботов и ИИ агентов сжирает все остальные интерфейсы пользователей и о будущем специалистов по UI/UX. Рассуждения полезны, а многочисленные ссылки на другие публикации ещё полезнее.

Я тоже размышлял на эту тему и мне такой подход к пользовательскому интерфейсу скорее не нравится. Хотя ИИ агенты умеет давать структурированные ответы, но не всегда работа через естественный язык удобнее чего-либо другого. К примеру, использование ИИ как персональных ассистентов удобно в одних задачах и неудобно в других. К, примеру, когда нужно описаться от конкретной рассылки в почте то можно использовать запрос естественным языком. А если надо отписаться от нескольких десятков и с ручным выбором рассылок, то естественный язык не годится.

Тут вопрос как скоро появятся динамический интерфейсы под разные задачи и насколько будут удобны они.

#thoughts #ui #ux
Forwarded from Ivan Begtin (Ivan Begtin)
Стартап с каталогами данных OpenDatSoft превратился на днях в компанию Huwise, а свой продукт теперь позиционируют как data product marketplace. Продукт у них довольно любопытный, структурированное храненилище данных с возможностью получения данных через API и в разнообразных форматах: JSON, CSV, Parquet, GeoJSON и др. Плюс довольно неплохой эксплорер данных с наглядным их просмотром и анализом. Часть внедрений этого каталога были внутрикорпоративные или в режиме компания + её партнёры, но не как каталоги открытых данных. Возможно они почувствовали что на корпоративном рынке денег больше и он выгоднее чем продолжать охватывать муниципалитеты и конкурировать за это с ArcGIS с их ArcGIS Hub.

В любом случае это сдвиг с бизнес модели порталов открытых данных в дата каталоги/дата маркетплейсы для корпоративных задач. В 2022 году они привлекли $25 миллионов инвестиций, а в общей сложности за 10 лет $35 миллионов, на свой SaaS продукт. Интересно как он будет меняться дальше, но чем больше он отходит от открытости тем он менее интересен, поскольку есть альтернативы с открытым кодом.

#opendata #startups #datacatalogs
Forwarded from Ivan Begtin (Ivan Begtin)
Sim, ещё один любопытный продукт оркестратор потоков данных со встроенной работой с промптами. Доступен под свободной лицензией Apache 2.0, имеет встроенное ИИ и сделан по архитектуре local-first и может использоваться без облачных сервисов, а для ИИ можно связать с Ollama.

Выглядит интересно для задач с минимальной дата инженерией и как альтернатива n8n.

#opensource #dataengineering #ai #datatools
Forwarded from Цифровой Журнал | IT, Neiroseti
Найден сервис, предоставляющий одноразовые номера — Receive SMS

Мобильные 12 стран на различных континентах, СМС-коды приходят прямо на сайт. Также есть временные электронные почты.

Почувствовать себя шпионом можно тут.
Forwarded from Нейродвиж
Бухгалтеры могут спать спокойно: исследователи проверили, как LLM справляются с типичными финансовыми задачами.

Они создали бенчмаркинг с реальными кейсами малого и среднего бизнеса за годы деятельности — счета, расчеты, перерасчеты.

С задачами за первые месяцы LLM справляются прекрасно, но дальше контекстное окно начинает подкидывать приколы: ошибки множатся, ИИ не могут свести дебет с кредитом, придумывают переводы. Другими словами: делают что угодно, лишь бы суммы сошлись.

Например, когда в Claude не сходились цифры, он просто искал в истории транзакции на необходимую сумму и записывал их повторно 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Десятки топовых тулз для программистов — забирайте универсальный сервис IT-Tool

Спецы собрали всё — калькуляторы, парсеры, конвертеры, чекеры, дешифраторы и шифраторы, генераторы. Инструменты работают локально и (!) бесплатно.

Пользуемся тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Мощный сервис для улучшения промтов — PrompTessor

Это не просто генератор подсказок, а ваш личный учитель промпт-инжиниринга: он ставит задачи, подсвечивает ошибки в запросах и предлагает улучшения.

Бесплатно учимся здесь.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Скачиваем любой контент без лимитов

Media Downloader поможет вытащить всё:

— плейлисты с YouTube, музыку.
— субтитры, обложки и списки таймкодов.
— прямые трансляции.
— сайты целиком.
— книги и торренты.

Поддерживает многопотоковую загрузку, работает даже на Windows 7, на русском языке.

Забираем тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Anthropic выпустили бесплатный гайд, который поможет выжать из нейронки все соки

Внутри доступно разбирают принципы работы с контекстом и системными промптами, роли и правильную подачу — со схемами и примерами.

Забираем тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Айтишная
Получаем одноразовый номер или почту для абуза сервисов

Receive SMS бесплатно предоставляет временные номера 12 стран мира или электронную почту. Коды приходят прямо на сайт.

Пользуемся тут.

📢Айтишная
Please open Telegram to view this post
VIEW IN TELEGRAM