Код в мешке
249 subscribers
9.08K photos
1.6K videos
2.11K files
42.7K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Агенты и Агентная экономика #habr
https://habr.com/ru/articles/929406/
Tags: искусственный интеллект, агентная экономика, ии-агенты, ии-ассистенты, mcp, llm
Author: alfredlao
[Перевод] Знакомьтесь: TCP-in-UDP #habr
https://habr.com/ru/companies/wunderfund/articles/929518/
Tags: TCP, UDP, сетевые протоколы, передача данных, eBPF
Author: mr-pickles (Wunder Fund)
Как копирайтер с ИИ делает работу быстрее в 5 раз без потери качества и не превращается в робота #habr
https://habr.com/ru/companies/timeweb/articles/929510/
Tags: timeweb_статьи, chatgpt, нейросети, копирайтинг, промты, искусственный интеллект, hr, it, claude, контент
Author: Timeweb_Cloud (Timeweb Cloud)
Лучшие нейросети для генерации изображений в 2025: обзор платных и бесплатных инструментов #habr
https://habr.com/ru/articles/929670/
Tags: нейросети, генерация изображений, создание картинок нейросетью, искусственный интеллект, openai, midjourney, flux, dall-e, kandinsky, grok
Author: Adm1ngmz
Forwarded from Киллер-фича
Нейросеть без цензуры: Venice говорит всё, что думает. В отличие от ChatGPT, Deepseek и прочих приличных ребят, эта штука отвечает без фильтров — можно спрашивать что угодно, хоть самые дикие темы.

Фишки Venice:
— Работает локально — всё обрабатывается на вашем устройстве.
— Никаких логов, передачи данных или шпионства.
— Вообще никаких цензурных блоков.
— И это бесплатно. Совсем.

Пользуемся строго в исследовательских целях.

@killerfeat
Forwarded from Эксплойт
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть переведёт любое видео прямо во время просмотра — нашли идеальную тулзу для изучения языков.

OpenAI Whisper превратит любой ролик в текст, а локальная модель превратит его в субтитры на нужном языке;
— Поддерживает 100+ языков, включая русский;
— Можно сделать двойные сабы: одновременно оригинал и перевод;
— Удобно учить незнакомые фразы с помощью фичи «поиск слова»;
— Работает с любыми видео, просто вставьте ссылку;
— И всё это БЕСПЛАТНО.

Ваш личный переводчик уровня Netflix — здесь.

@exploitex
Forwarded from Ivan Begtin (Ivan Begtin)
Одна из крупнейших поисковых систем по данным в мире о которой мало кто знает - это Datacite Commons. Сервис созданный компанией Datacite специализирующейся на выдаче DOI для данных публикуемых исследователями.

Благодаря тому что при присвоении DOI каждому цифровому объекту требуется заполнить карточку с метаданными, то и индекс DOI в Datacite вырос уже до 90 миллионов записей из которых чуть менее половины, 43 миллиона - это карточки наборов данных (dataset). Ещё 15 миллионов записей тексты, около 14 миллионов физических объектов и так далее. В том числе там уже 16 тысяч data papers (статей основанных на данных).

Почти все записи в Datacite имеют привязку к организациям к которым они относятся, напрямую или через авторов, эти организации интегрированы в реестр ROR (The Research Organization Registry) хорошо известный в библиографической среде и хорошо структурированный с существенным объёмом метаданных по каждой научной организации.

Благодаря этому можно идентифицировать сколько наборов данных имеют DOI Datacite в разрезе стран.

Вот ряд цифр по некоторым постсоветским странам:
- Россия - 6806 наборов данных, большая часть от Российской академии наук
- Казахстан - 257 наборов данных, большая часть от Университета Назарбаева
- Армения - 130 наборов данных
- Узбекистан - 85 наборов данных
- Кыргызстан - 40 наборов данных

Это только те данные которые имеют прямую аффиляцию с академическими учреждениями в этих странах. Многие данные относящиеся к странам создаются в других странах. Например, исследования в США посвящённые разным российским сибирским и северным территориям или горам Центральной Азии.

Много это или мало? Это мало, с точки зрения мира, но и не полное отсутствие. Важнее почти полное отсутствие институциональной основы. Почти все эти опубликованные наборы данных загружались исследователями на открытые платформы вроде Zenodo, Dryad, Mendeley Data и зарубежные журналы.

Данные исследователей характерны тем что их востребованность весьма фрагментирована. У одного датасета могут быть сотни цитирований, но больше этого числа это уже огромная редкость. Поэтому применительно к ним не работает принцип HVD (High value datasets), нельзя определить какие-то конкретные крупные наборы данных которые должны быть доступны. Это должны быть данные из специализированной научной инфраструктуры вроде систем CLARIN для компьютерной лингвистики или ELIXIR для геномных данных, или буквально все возможные данные как результат научной деятельности.

#opendata #datasets #datadiscovery #datacite
Forwarded from Ivan Begtin (Ivan Begtin)
Полезные ссылки про данные, технологии и не только:
- DuckDB XML Extension - расширение для DuckDB для парсинга XML/HTML, пока не пробовал и интересно как он сможет съесть XML в пару пару десятков гигабайт, но выглядит полезно
- remote-jobs - репозиторий с огромным числом IT компаний имеющих вакансии для дистанционной работы. Некоторые компании remote-only, без офисов, в некоторых гибридный подход, в любом случае список полезный для тех кто ищет работу дистанционно
- Embedding User-Defined Indexes in Apache Parquet Files - для тех кто хочет поглубже разобраться с тем что такое Parquet, разбор реализации специализированного индекса внутри Parquet файлов.
- Rethinking CLI interfaces for AI у автора рефлексия о переосмыслении подхода к созданию и развитию утилит командной строки в контексте MCP и LLM. Текст довольно короткий, но здравый
- Edit перевыпуск древнего редактора Edit для MS-DOS переписанного на Rust под множество платформ. Для тех кого пробивает на ностальгию, но у меня лично по Edit'у никакой ностальгии не осталось, он мне не нравился ещё тогда;)

#opensource #ai #datatools