Код в мешке
249 subscribers
9.08K photos
1.6K videos
2.11K files
42.7K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Агенты и Агентная экономика #habr
https://habr.com/ru/articles/929406/
Tags: искусственный интеллект, агентная экономика, ии-агенты, ии-ассистенты, mcp, llm
Author: alfredlao
[Перевод] Знакомьтесь: TCP-in-UDP #habr
https://habr.com/ru/companies/wunderfund/articles/929518/
Tags: TCP, UDP, сетевые протоколы, передача данных, eBPF
Author: mr-pickles (Wunder Fund)
Как копирайтер с ИИ делает работу быстрее в 5 раз без потери качества и не превращается в робота #habr
https://habr.com/ru/companies/timeweb/articles/929510/
Tags: timeweb_статьи, chatgpt, нейросети, копирайтинг, промты, искусственный интеллект, hr, it, claude, контент
Author: Timeweb_Cloud (Timeweb Cloud)
Лучшие нейросети для генерации изображений в 2025: обзор платных и бесплатных инструментов #habr
https://habr.com/ru/articles/929670/
Tags: нейросети, генерация изображений, создание картинок нейросетью, искусственный интеллект, openai, midjourney, flux, dall-e, kandinsky, grok
Author: Adm1ngmz
Forwarded from Киллер-фича
Нейросеть без цензуры: Venice говорит всё, что думает. В отличие от ChatGPT, Deepseek и прочих приличных ребят, эта штука отвечает без фильтров — можно спрашивать что угодно, хоть самые дикие темы.

Фишки Venice:
— Работает локально — всё обрабатывается на вашем устройстве.
— Никаких логов, передачи данных или шпионства.
— Вообще никаких цензурных блоков.
— И это бесплатно. Совсем.

Пользуемся строго в исследовательских целях.

@killerfeat
Forwarded from Эксплойт
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть переведёт любое видео прямо во время просмотра — нашли идеальную тулзу для изучения языков.

OpenAI Whisper превратит любой ролик в текст, а локальная модель превратит его в субтитры на нужном языке;
— Поддерживает 100+ языков, включая русский;
— Можно сделать двойные сабы: одновременно оригинал и перевод;
— Удобно учить незнакомые фразы с помощью фичи «поиск слова»;
— Работает с любыми видео, просто вставьте ссылку;
— И всё это БЕСПЛАТНО.

Ваш личный переводчик уровня Netflix — здесь.

@exploitex
Forwarded from Ivan Begtin (Ivan Begtin)
Одна из крупнейших поисковых систем по данным в мире о которой мало кто знает - это Datacite Commons. Сервис созданный компанией Datacite специализирующейся на выдаче DOI для данных публикуемых исследователями.

Благодаря тому что при присвоении DOI каждому цифровому объекту требуется заполнить карточку с метаданными, то и индекс DOI в Datacite вырос уже до 90 миллионов записей из которых чуть менее половины, 43 миллиона - это карточки наборов данных (dataset). Ещё 15 миллионов записей тексты, около 14 миллионов физических объектов и так далее. В том числе там уже 16 тысяч data papers (статей основанных на данных).

Почти все записи в Datacite имеют привязку к организациям к которым они относятся, напрямую или через авторов, эти организации интегрированы в реестр ROR (The Research Organization Registry) хорошо известный в библиографической среде и хорошо структурированный с существенным объёмом метаданных по каждой научной организации.

Благодаря этому можно идентифицировать сколько наборов данных имеют DOI Datacite в разрезе стран.

Вот ряд цифр по некоторым постсоветским странам:
- Россия - 6806 наборов данных, большая часть от Российской академии наук
- Казахстан - 257 наборов данных, большая часть от Университета Назарбаева
- Армения - 130 наборов данных
- Узбекистан - 85 наборов данных
- Кыргызстан - 40 наборов данных

Это только те данные которые имеют прямую аффиляцию с академическими учреждениями в этих странах. Многие данные относящиеся к странам создаются в других странах. Например, исследования в США посвящённые разным российским сибирским и северным территориям или горам Центральной Азии.

Много это или мало? Это мало, с точки зрения мира, но и не полное отсутствие. Важнее почти полное отсутствие институциональной основы. Почти все эти опубликованные наборы данных загружались исследователями на открытые платформы вроде Zenodo, Dryad, Mendeley Data и зарубежные журналы.

Данные исследователей характерны тем что их востребованность весьма фрагментирована. У одного датасета могут быть сотни цитирований, но больше этого числа это уже огромная редкость. Поэтому применительно к ним не работает принцип HVD (High value datasets), нельзя определить какие-то конкретные крупные наборы данных которые должны быть доступны. Это должны быть данные из специализированной научной инфраструктуры вроде систем CLARIN для компьютерной лингвистики или ELIXIR для геномных данных, или буквально все возможные данные как результат научной деятельности.

#opendata #datasets #datadiscovery #datacite