Технозаметки Малышева
8.27K subscribers
3.74K photos
1.4K videos
40 files
3.92K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Вот вы спрашиваете, чего я так топлю за Claude.
решил повторить пример выше и вот.
Ну как с ним разговаривать, если он такой умный, что сразу скипает диалог и переходит к итогу.

#Claude
———
@tsingular
👍16🔥1
Этот мир сошёл с ума.

GPU 🤝 женские сумочки

http://gpupurse.com/

Ловля ИТшников на приманку. :)

#GPU #мода
------
@tsingular
🔥10😁8👍2
HivisionIDPhotos: AI-инструмент для фото на документы

Новый open-source проект в тренде на GitHub.
HivisionIDPhotos - локально сгенерит профессиональные фото на документы с помощью ИИ.

Ключевые особенности:
• Работает даже на CPU
• есть Веб-интерфейс Gradio и API
• Использует ONNX и OpenCV
• Поднимается в Docker
• Поддерживает различные операции обработки изображений

Инструмент создает локальную веб-страницу для удобства.

Теперь каждый сможет сделать фото на паспорт, не выходя из дома. Фотоателье уходят в прошлое! 📸🏠

#HivisionIDPhotos #фотонадокументы #фотоателье
-------
@tsingular
👍31
🌐Digest полезных материалов по ML
🤖Benchmarking of AI Agents

Тема AI-агентов сегодня становится актуальна как никогда. Копнула в сторону их оценки и собрала подборку материалов по бенмаркингу агентов.

1⃣Статья на Medium по введению в агентов
2⃣HumanEval и ruHumanEval - классика бенчмаркинга по оценки способностей моделей писать программный код
3⃣WebArena (статья) платформа для имитации работы Агента в Web среде. Пользователи могут создавать имитацию собственных сред, использовать реализованные на платформе инструменты оценки и тестировать модели на готовых задачах интегрированного в платформу бенчмарка.
4⃣AgentBench - самый популярный бенчмарк для оценки агентов. Позволяет оценивать модели на основе Chain-of-Thought в средах 8 типов, разделенных на три категории (Code-, Web- и Game-Grounded). Для оценки используются автоматические метрики (Success Rate, F1, Game Progress и т. п.), а общий скор получается усреднением метрик по всем задачам.
5⃣LLMArena - Арена для агентов, где модели соревнуются между собой в 7 игровых средах разного формата (командные игры, соревнования, настолки и т. п.), заданный с помощью текстового описания в виде набора из трех промптов (System prompt, Observation prompts, Action prompt). Рейтинг моделей строится по скиллам, оцениваемых с помощью TrueSkill.
6⃣AppWorld - бенчмарк, где агент выступает в роли виртуального ассистента, помогающего виртуальным пользователям выполнять повседневные дела через приложения (составить плейлист для тренировки, заказать пиццу, заплатить другу через splitwise и т. п.). Авторы заморочились и создали с помощью ChatGPT мини сообщество из 107 человек, полностью расписав информации о них в приложении так, чтобы весь граф общения согласовывался между людьми (если Петя записан к тренеру Васе, то у Васе стоит слот на тренировку с Петей в календаре)
7⃣AI Agent That Matter — большой обзор по бенчмаркингу агентов, авторы которого рассматривают вызовы при оценке агентов и среди них выделяют следующие 5:
AI agent evaluations must be cost-controlled.
Jointly optimizing accuracy and cost can yield better agent design.
Model developers and downstream developers have distinct benchmarking needs.
Agent benchmarks enable shortcuts.
Agent evaluations lack standardization and reproducibility.
Как итог они приходят к выводу, что при оценке агентов важно критично оценивать не только основную метрику, но и стоимость инференса, и оптимизировать эти величины совместно. Помимо этого, чтобы избежать читинга со стороны моделей важно, чтобы тест отличался по распределению/задачам/доменам от обучающих данных, а оценка на бенчмарке была максимально стандартизирована.

@mashkka_ds

#usefullinks #ml_на_пальцах #полезныематериалы #aiagents
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍31
Оживление фото выходит на совершенно фантастический уровень под конец года.

Новые примеры от
https://loopyavatar.github.io/
https://www.hedra.com/
и
https://rendernet.ai/

Ключевые фишки Loopy - эмоциональные жесты и естественная мимика.
Причём оживают не только фото людей, но и статуи и мультяшные персонажи.

#Loopy #Hedra #RendernetAI #AvatarAnimation
———
@tsingular
🔥38🤯14🎉8👀7🤔4🏆3👍2❤‍🔥1👏1
Reflection 70B: новый лидер открытых ИИ-моделей (нет :))

Компания HyperWrite ( https://x.com/mattshumer_ ) презентовала Reflection 70B - новую открытую LLM.
Основана на Llama 3.1-70B Instruct, но с добавлением механизма самооценки и самокоррекции (Reflection).

Уникальность Reflection 70B заключается в способности распознавать и исправлять собственные ошибки благодаря методу "reflection tuning".

Модель демонстрирует превосходство над аналогами в тестах и готовится к интеграции в основной продукт HyperWrite.

В планах компании - выпуск еще более мощной версии Reflection 405B.

Больше мощных открыток! Где на это видеокарт только взять?!

Error: The model mattshumer/Reflection-Llama-3.1-70B is too large to be loaded automatically (282GB > 10GB). Please use Spaces

Полный размер - 282GB это примерно 12 карт 4090.
т.е. дома только в урезанном виде можно запустить.

Мне кажется даже если NVidia не будет выпускать новый камень для видеокарт, а просто выпустит что-то вроде AI Edition 4090 с 64Gb - их сметут.
Ну потому что 5 видеокарт можно как-то разместить в формате майнинг-фермы и Reflection в неё влезет тогда

Для 405B варианта понадобится 1,7Tb Видеопамяти!
Помянем.

UPD: Сам Reflection похоже оказался скамом и выливается в скандал. Детали в камментах.

Что не отменяет общей картины с требованиям моделей к железу.

#HyperWrite #ReflectionAI #OpenSourceAI
-------
@tsingular
👍11
🔥 Официально выпущен DeepSeek v2.5 238B параметров

📏 Контекстное окно 128K

🚀 Arena Hard 76,3%, оценка Alpaca 50,52%

По внутренним китайским оценкам, DeepSeek-V2.5 демонстрирует значительное улучшение показателей по сравнению с GPT-4o mini и ChatGPT-4o-последней версией (по данным GPT-4o).

Хорошие показатели в кодинге HumanEval на 89%, LiveCodeBench 41%

Доступен на Hugging Face, совместим с Transformers

📈 Улучшен показатель MT Bench: с 8,84 до 9,02

https://huggingface.co/deepseek-ai/DeepSeek-V2.5

@data_analysis_ml
👍5
Roblox создаёт ИИ для мгновенного построения 3D-миров

Платформа Roblox анонсировала разработку генеративного ИИ для создания 3D-окружений.
Инструмент позволит формировать целые локации с помощью текстовых запросов.
Технология работает через "токенизации" 3D-блоков, подобно языковым моделям.
Для обучения используются пользовательские и внешние данные.
Дополнительная ИИ-модель проверит логическую согласованность на основе 2D-информации. (карты?)

Roblox планирует сделать 3D-модель открытой для модификаций.

ОК, Roblox, построй мне карту местности, дополни последними снимками с дрона.
Только в игровых целях, конечно.

#Roblox #3D #generativeAI
-------
@tsingular
6👀3
Исследование ИИ рынка от Saphire Ventures.

Если кратко, - мы катимся в долину разочарований по Гартнеру.
Акции проходят коррекцию, много кадровых перестановок, выход новых моделей и продуктов задерживается.
При этом уровень инвестиций растёт, так что в долгосрочную перспективу вера есть.

Сам отчёт в комментарии.

#markestudy #отчет
———
@tsingular
👍5
CircuitNet: Инновационная нейросеть, воспроизводящая структуру мозга

Учёные представили CircuitNet - нейронную архитектуру, имитирующую нейронные цепи мозга.
Основа сети - Circuit Motif Unit (CMU), блок плотно связанных нейронов с обратными и латеральными соединениями.
CircuitNet превосходит популярные модели в аппроксимации функций, классификации изображений и обучении с подкреплением.
Архитектура использует меньше параметров, чем традиционные сети, сохраняя высокую эффективность.
Эксперименты показывают преимущество CircuitNet над MLP и сопоставимые результаты с ResNet, ViT и трансформерами.

Похоже на вариацию ансамбля малых моделей.
Вообще при избытке мощностей поставить на роль каждого нейрона или их группы отдельную LLM, - идея огонь!
Ну по-сути тот же самый рой 🧠💻

#CircuitNet #NeuralNetworks #BrainInspired
-------
@tsingular
❤‍🔥4👍32
IBC 2024: ИИ завоёвывает медиаиндустрию

Есть такая ежегодная конференция в Амстердаме, - IBC.
Посвящена технологиям вокруг производства телевизионного контента.
Например высокоскоростные камеры, которые работают со скоростью 1млн кадров в секунду, я видел именно там когда-то.

На следующей неделе в рамках IBC 2024 очень много всего будет посвящено практическому применению ИИ в медиасфере.
AI Tech Zone будет полностью посвящена этой теме.
ИИ уже используется для автоматизации редакторских задач, создания субтитров и контроля качества.
Компании решают проблемы интеграции и окупаемости инвестиций в ИИ.
К 2028му году ожидается рост затрат на ИИ до $13 млрд.

Как правило, около полугода после телерынка еще уходит на закупку железа, интеграцию софта и адаптацию сотрудников под новую линейку, так что где-то к весне мы увидим массовый ГенИИ на телеке. 🤖📺

#IBC #MediaIndustry #Broadcasting
-------
@tsingular
❤‍🔥3
Media is too big
VIEW IN TELEGRAM
Добавил в бота поиск.

Пользуйтесь сами, делитесь с друзьями:
@ai_gptfreebot

Бот локальный и бесплатный, потому медленный.
На вот такой поиск по примеру уходит около 2.5 минут.

#бот.
———
@tsingular
🔥15👍4
Интересно. Пользователи уже нашли лайфхак. Если кинуть в бота ссылкой на статью, то это будет первое что он полезет искать и, следовательно, может сделать саммари или перевести статью.
Или дать рекомендацию как улучшить резюме если кинуть в него ссылкой на hh.

#бот
———
@tsingular
👍9👌41🔥1