Технозаметки Малышева
8.27K subscribers
3.67K photos
1.37K videos
40 files
3.87K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
2 недели шикуем.

в  Cursor первые две недели Opus 4.5 по цене Sonnet 4.5

#Opus #Cursor
———
@tsingular
51👍1🎉1
Google обещает увеличить инфраструктуру для ИИ в 1000 раз за 5 лет

Глава подразделения инфраструктуры Амин Вахдат озвучил план удваивать серверные мощности каждые полгода.

Получается за 5-6 лет вырастут в 1000x и считают это необходимостью.
Вахдат уверен - риск недоинвестировать выше, чем переинвестировать.

Ставка делается на новые поколения TPU (7 и выше) и будущие новые модели LLM.

Т.е. модели в 1000 раз умнее/способнее сегодняшних, - это бизнесплан. Запоминаем.

#Google #TPU #Infrastructure
———
@tsingular
🔥8321
Адам Вольф, один из разработчиков CludeCode в Anthropic, пишет

Через 6 месяцев софтварным инженерам нечем будет заняться.

Уже сегодня он просто ставит задачу ClaudeCode, уходит минут на 20-30 и когда возвращается, - в большинстве случаев задача решена.

С новыми моделями мы перестанем ожидать что ИИ разраб может ошибиться, ровно так, как мы не ждём ошибки от работы компилятора.

#claudecode #dev #Claude #Anthropic
———
@tsingular
🤯886👍6🤣3😁2🗿2👏1
Microsoft экспериментирует с Agent Workspace в Windows для ИИ-агентов

Microsoft запускает экспериментальную функцию Agent Workspace - отдельные виртуальные среды в Windows, где ИИ-агенты работают параллельно с пользователем.

Каждый агент получает собственную учётную запись и десктоп, изолированные от основной сессии.

При включении админом агенты пока получают доступ к шести папкам:
Документы, Загрузки, Рабочий стол, Музыка, Изображения, Видео.

Обещают лёгкие виртуалки, которые не будут нагружать машину.
Пока в порядке тестов для участников Windows Insider.

Верните DOS :(

#Windows #Microsoft #CopilotActions #AgentWorkspace
------
@tsingular
👀7321👍1💯1
Forwarded from Machinelearning
⚡️ HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B

Tencent выложила в open-source новую модель HunyuanOCR.

Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.

Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.

Топ по бенчмаркам
860 на OCRBench среди всех моделей до 3B
94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов

🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков

Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.

Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.

📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf

@ai_machinelearning_big_data


#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥932👍1
This media is not supported in your browser
VIEW IN TELEGRAM
FLUX.2: обновление графической модели на 32B

Black Forest Labs выкатили FLUX.2 [dev] — трансформер на 32B, который генерирует, редактирует и комбинирует картинки по текстовым инструкциям.
Модель доступна на Hugging Face.

Работает локально на RTX 4090/5090 через 4-битное квантование с удалённым текстовым энкодером.

Полный размер 70+ гигов.

Поддержка в ComfyUI и Diffusers из коробки.

Короче, похоже, что если вам не критична скорость,- M3 Ultra с 512 гигами, - реально самая подходящая машина для малого бизнеса.
Таких вот моделей поднять каскад, на круг под 400Гигов и забьются.

#FLUX2 #BlackForestLabs
———
@tsingular
👍7🔥51
Вчера был очень полезный доклад по нейрографике и анимации от Ксении Галушкиной

Сегодня Ксения поделилась всеми исходниками на канале.

Презентация 700мегов, там много видео, перезалил на Dropbox

------‐quote-------------
На миро-доске вчерашние примеры с промптами и ещё десятки способов использования новой нано бананы про, которые не влезли в презентацию.
https://miro.com/app/board/uXjVJft9A8M=

Запись митапа можно посмотреть по той же ссылке, где была трансляция. Доклад с 58:00.
https://embed-cdn.mashroom.online/?hash=FxiVJsjT

Старые промпты от первой бананы тоже отлично работают.

Для некоторых задач и стилистик больше не нужно обучать лоры, потому что можно снова и снова добавлять референс персонажа, и банана сохраняет его одинаковым от кадра к кадру.

Потестировать кучу разных применений бананы в виде приложения можно здесь:
https://aistudio.google.com/apps/drive/1sEmTQCUUnVNwH1WdRP_7FraYTKw1tbmR?fullscreenApplet=true&showPreview=true&showAssistant=true

И здесь:
https://flowith.io/


Ответы на основные вопросы со вчерашней встрече:
Плейлист с базой по комфи
https://www.youtube.com/watch?v=Zko_s2LO9Wo&list=PL-pohOSaL8P9kLZP8tQ1K1QWdZEgwiBM0&index=1

3D-нейронки:
Hunyuan https://3d.hunyuan.tencent.com/
Hitem 3d https://hitem3d.ai/
Viscom для текстур, особенно хенд-пеинт https://www.vizcom.com/

Пост про 3д-ИИ генераторы, в комментах блендер-сцены, всё можно скачать себе и посмотреть:
https://t.me/Aironically/710

Установка комфи и нано бананы в фотошоп. Видео снято про первую нано банану, но в https://www.astria.ai/ вторую тоже уже добавили, так что и со второй всё будет работать.
https://t.me/Aironically/686

Главные посты канала с навигацией:
https://t.me/Aironically/619

Все видео из презентации есть в канале, часть видео была только на стриме с Янисом в практическом блоке с 15:00. Видео про комфи с 18:00:
https://www.youtube.com/watch?v=FGQJlIReiEo
-----------------

#Aironically #нейрорендер #обучение
------
@tsingular
🔥11632🙏2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Rapid Liquid Printing: 3D печать в геле за минуты

MIT Self-Assembly Lab вместе со Steelcase показали Rapid Liquid Printing — технологию, которая создает объекты прямо в гелевой суспензии.

Печатает промышленными материалами, быстро и в любом масштабе.
Можно напечатать сумку за несколько минут.

Обычная 3D-печать упирается в три проблемы: медленно, мелко, хлипкие материалы.
Здесь все наоборот — скорость как у литья, размер как у мебели, прочность как у промышленных полимеров.

Гель держит форму, пока материал застывает, никаких слоев и подпорок.
Гравитация не мешает, потому что всё плавает внутри.

Я сначала даже подумал, - нейрорендер, но нет, реально новый вид печати.

#RapidLiquidPrinting #MIT #Steelcase
------
@tsingular
167🔥62👀11👍9🤯85👏3🤣1
- Коллеги, в рамках отработки навыков работы с ИИ, теперь друг к другу обращаемся промптами.

#юмор
———
@tsingular
😁61🫡31🆒1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Суно фсё?

В потоке отличных новостей встречаются и ложки дегтя.

Warner Music Group прогнул Suno на совместное соглашение, которое попахивает шантажом.
Теперь они вроде как партнеры, но, внимание, в 2026 году Suno должна ИЗБАВИТЬСЯ от существующих моделей и выкатить новые, кастрированные, обученные на лицензионном контенте.

У меня нет слов.

“several changes to the platform, including launching new, more advanced and licensed models, the current models will be deprecated”.

А скачивание песен будет только за деньги:

«В частности, в будущем песни, созданные на бесплатном тарифе, не будут доступны для скачивания, но их можно будет воспроизводить и делиться ими».

По данным компании, пользователи платного тарифа будут иметь ограниченный ежемесячный лимит на скачивание с возможностью оплатить дополнительные скачивания.

Warner Music Group также отмыли через стартап немного денег, заставив Suno купить Songkick, платформу для поиска концертов и живой музыки (зачем?!?!).

В общем я в печали. Бабло побеждает добро.

@cgevent
21😢101👍1🤔1
Media is too big
VIEW IN TELEGRAM
Ладно, не такая уж и плохая модель Opus 4.5

за 1 час в Курсоре можно с нуля написать свой n8n

В копилку подтверждений роста доли гражданского программирования.
Написать свое будет все проще и все быстрее.


Может платный мастер-класс кому?

Записывайтесь в комментах

#dev #Opus
———
@tsingular
2🔥1992
OpenAI свернула детектор ИИ-текстов из-за низкой точности

OpenAI тихо закрыла проект по распознаванию машинного текста. Запущенный в январе 2023 классификатор правильно определял ИИ-контент только в 26% случаев.

Ещё хуже - инструмент регулярно помечал человеческие тексты как машинные. Для студентов, журналистов и профессионалов это означало реальные проблемы.

Компания признала - улучшить точность статистическими методами не получается. Теперь ставка на цифровые подписи и встроенные маркеры вместо анализа стиля.

Проблема в том, что модели становятся всё более человечными. Даже эксперты проваливают слепые тесты. И если создатели ChatGPT не могут распознать свой же текст, как это сделают регуляторы?

ЕС и FTC строят законы про прозрачность ИИ, но инструментов для проверки просто нет. Школы, редакции, платформы - все столкнулись с одной реальностью: технология обгоняет способы её контролировать.

#OpenAI #Detection #Watermarking
------
@tsingular
9🔥432💯11
Такие мультики можно и перезапускать.

Отличная идея от DJ Блокnote

#нейрорендер #мультики
------
@tsingular
🔥44👍14🤔3💯21🆒1