Технозаметки Малышева

Получаем закадровый план любой съемки.

Подаёте исходную картинку в Нанобанану и просите её восстановить окружающую обстановку.
Не мог удержаться :)
Теперь мы знаем всё про посадку на Луну.

generate a realistic behind the scene for this film scene, show me where the camera and lights are placed to film this scene, use arrows to label the name of the light, what kind of lights, light settings

(создай реалистичную закулисную сцену для этой сцены фильма, покажите мне, где расположены камера и освещение для съемки этой сцены, используйте стрелки, чтобы обозначить название освещения, тип освещения, настройки освещения)

тут еще много примеров

#Нанобанана #Луна #промпты #юмор
———
@tsingular

1😁44✍4🔥3💯1

3.17K views11:19

Технозаметки Малышева

Через 10 минут эфир MoscowAI

Кто не смог приехать,- подключайтесь,- будет интересно.

Ссылка на трансляцию

#MoscowAI #SGR
------
@tsingular

🔥12👍4⚡2❤‍🔥1🆒11

2.68K views15:51

Технозаметки Малышева

Forwarded from Data Secrets

⚡️

Иии… Anthropic выпустили Claude Opus 4.5

Это первая модель, которая пробила планку 80 на SWE bench verified. С ее 80.9% это теперь уверенная SOTA по кодингу.

Модель уже доступна в API, и, что самое приятное, цена относительно предыдущего Opus упала! Было 15$/75$, стало 5/25, ощутимое понижение.

Плюс, модель снова стала экономичнее относительно токенов: на среднем уровне ризонинга она достигает уровня Sonnet 4.5, используя на 76% меньше токенов. А при выкрученном на максимум бюджете обходит Sonnet аж на 4.3 процентных пункта (SWE bench), используя на 48% меньше токенов.

Anthropic пишут, что скормили Opus 4.5 внутренний экзамен, который они дают кандидатам при устройстве на работу. За 2 часа модель справилась с ним лучше, чем любой человек когда-либо в истории стартапа.

Что касается апдейтов в продукте:

– В Claude App добавили сжатие контекста, как в новом Codex. При достижении лимита старый контекст суммаризуется и передается в новое контекстное окно, и вы не упираетесь в конец диалога. Кроме того, теперь в десктопное приложение завезли Claude Code, и там его можно параллелить на разные задачки.

– Из беты вышли Claude для Chrome и для Excel.

– Теперь можно самостоятельно контролировать время размышлений, есть режимы low, high и medium.

🔥 www.anthropic.com/news/claude-opus-4-5

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥16⚡4❤2🏆1

2.38K views20:33

Технозаметки Малышева

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

#Opus #Anthropic #юмор
———
@tsingular

⚡4😁4👌1🏆1

2.1K views20:59

Технозаметки Малышева

Протестил Opus 4.5 венком сонетов.

На мой взгляд, - хуже, чем Gemini3, как ни странно.

Вангую скандал с докруткой метрик под бенчи.

Хотелось бы ошибаться, конечно, но в полном стихе это прям видно в каждом сонете из венка.

Он неплохо старается, по форме и по сюжету, но плывёт по рифме в содержании.

% попадания в рифму как-будто упал.

Полный венок в комментарии, как обычно.

#Opus #Сонет #тест
———
@tsingular

⚡6🤔3❤1

2.16K viewsedited 01:58

Технозаметки Малышева

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

0:16

This media is not supported in your browser

Opus 4.5 vs Gemini 3 Pro: программирование

А вот так наверное будет более наглядно.

Поставил задачу:

сделай 1 HTML файл с каруселью из карт вендоров ИИ
3D карусель.
все вендоры, а не только западные.
на месте логотипов -ссылки на их лого в интернете.
стиль Magic the gathering

И это просто абсолютный провал Opus и чистая победа Gemini 3

Смотрите сами. Тут много деталей, которые повылезали, как окончание и согласованность строк и рифмы в сонете.

Opus 4.5 просто налабал какую-то крутящуюся стену.

Gemini при этом даже вытащил некоторые ссылки на логотипы, и у него карты похожи на MtG, не наплывают друг на друга.

Ну и 3й ролик это тот же самый промпт, но в Gemini 3 Pro BUILD, - это такой облачный вайбкодер.
Тут вообще практически идеально.
С логотипами только промах, но качество приложения, - просто огонь!

Удаляем Opus, возвращаемся на Gemini 3 Pro.

Может у кого-то другой опыт, - делитесь в комментариях, но я пока свой выбор сделал.

Сами файлы тоже выкладываю в комментариях.

#Opus #Gemini
———
@tsingular

🔥8🤔5⚡2❤1👍1🤝1

3.66K views03:22

Технозаметки Малышева

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

В NotebookLM подвезли возможность создавать презентации.

Ранее туда же добавляли DeepResearch.

Получается теперь можно не выходя из NotebookLM сразу и исследование прогнать и презентацию по его результатам запилить.

Manus опасносте.

#NotebookLM #Google #презентации
------
@tsingular

✍6⚡4🔥4

2.04K views08:17

Технозаметки Малышева

2 недели шикуем.

в Cursor первые две недели Opus 4.5 по цене Sonnet 4.5

#Opus #Cursor
———
@tsingular

5⚡1👍1🎉1

2.31K views09:42

Технозаметки Малышева

Google обещает увеличить инфраструктуру для ИИ в 1000 раз за 5 лет

Глава подразделения инфраструктуры Амин Вахдат озвучил план удваивать серверные мощности каждые полгода.

Получается за 5-6 лет вырастут в 1000x и считают это необходимостью.
Вахдат уверен - риск недоинвестировать выше, чем переинвестировать.

Ставка делается на новые поколения TPU (7 и выше) и будущие новые модели LLM.

Т.е. модели в 1000 раз умнее/способнее сегодняшних, - это бизнесплан. Запоминаем.

#Google #TPU #Infrastructure
———
@tsingular

🔥832⚡1

1.94K viewsedited 09:53

Технозаметки Малышева

Адам Вольф, один из разработчиков CludeCode в Anthropic, пишет

Через 6 месяцев софтварным инженерам нечем будет заняться.

Уже сегодня он просто ставит задачу ClaudeCode, уходит минут на 20-30 и когда возвращается, - в большинстве случаев задача решена.

С новыми моделями мы перестанем ожидать что ИИ разраб может ошибиться, ровно так, как мы не ждём ошибки от работы компилятора.

#claudecode #dev #Claude #Anthropic
———
@tsingular

🤯88⚡6👍6🤣3😁2🗿2👏1

2.75K views10:01

Технозаметки Малышева

Microsoft экспериментирует с Agent Workspace в Windows для ИИ-агентов

Microsoft запускает экспериментальную функцию Agent Workspace - отдельные виртуальные среды в Windows, где ИИ-агенты работают параллельно с пользователем.

Каждый агент получает собственную учётную запись и десктоп, изолированные от основной сессии.

При включении админом агенты пока получают доступ к шести папкам:
Документы, Загрузки, Рабочий стол, Музыка, Изображения, Видео.

Обещают лёгкие виртуалки, которые не будут нагружать машину.
Пока в порядке тестов для участников Windows Insider.

Верните DOS :(

#Windows #Microsoft #CopilotActions #AgentWorkspace
------
@tsingular

👀7✍3❤2⚡1👍1💯1

1.94K views11:09

Технозаметки Малышева

Forwarded from Machinelearning

⚡️

HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B

Tencent выложила в open-source новую модель HunyuanOCR.

Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.

Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.

⚡ Топ по бенчмаркам
• 860 на OCRBench среди всех моделей до 3B
• 94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов

🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков

Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.

Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.

📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf

@ai_machinelearning_big_data

#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9⚡3❤2👍1

2.25K views12:31

Технозаметки Малышева

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

FLUX.2: обновление графической модели на 32B

Black Forest Labs выкатили FLUX.2 [dev] — трансформер на 32B, который генерирует, редактирует и комбинирует картинки по текстовым инструкциям.
Модель доступна на Hugging Face.

Работает локально на RTX 4090/5090 через 4-битное квантование с удалённым текстовым энкодером.

Полный размер 70+ гигов.

Поддержка в ComfyUI и Diffusers из коробки.

Короче, похоже, что если вам не критична скорость,- M3 Ultra с 512 гигами, - реально самая подходящая машина для малого бизнеса.
Таких вот моделей поднять каскад, на круг под 400Гигов и забьются.

#FLUX2 #BlackForestLabs
———
@tsingular

👍7🔥5❤1

2.6K viewsedited 18:00

Технозаметки Малышева

Вчера был очень полезный доклад по нейрографике и анимации от Ксении Галушкиной

Сегодня Ксения поделилась всеми исходниками на канале.

Презентация 700мегов, там много видео, перезалил на Dropbox

------‐quote-------------
На миро-доске вчерашние примеры с промптами и ещё десятки способов использования новой нано бананы про, которые не влезли в презентацию.
https://miro.com/app/board/uXjVJft9A8M=

Запись митапа можно посмотреть по той же ссылке, где была трансляция. Доклад с 58:00.
https://embed-cdn.mashroom.online/?hash=FxiVJsjT

Старые промпты от первой бананы тоже отлично работают.

Для некоторых задач и стилистик больше не нужно обучать лоры, потому что можно снова и снова добавлять референс персонажа, и банана сохраняет его одинаковым от кадра к кадру.

Потестировать кучу разных применений бананы в виде приложения можно здесь:
https://aistudio.google.com/apps/drive/1sEmTQCUUnVNwH1WdRP_7FraYTKw1tbmR?fullscreenApplet=true&showPreview=true&showAssistant=true

И здесь:
https://flowith.io/

Ответы на основные вопросы со вчерашней встрече:
Плейлист с базой по комфи
https://www.youtube.com/watch?v=Zko_s2LO9Wo&list=PL-pohOSaL8P9kLZP8tQ1K1QWdZEgwiBM0&index=1

3D-нейронки:
Hunyuan https://3d.hunyuan.tencent.com/
Hitem 3d https://hitem3d.ai/
Viscom для текстур, особенно хенд-пеинт https://www.vizcom.com/

Пост про 3д-ИИ генераторы, в комментах блендер-сцены, всё можно скачать себе и посмотреть:
https://t.me/Aironically/710

Установка комфи и нано бананы в фотошоп. Видео снято про первую нано банану, но в https://www.astria.ai/ вторую тоже уже добавили, так что и со второй всё будет работать.
https://t.me/Aironically/686

Главные посты канала с навигацией:
https://t.me/Aironically/619

Все видео из презентации есть в канале, часть видео была только на стриме с Янисом в практическом блоке с 15:00. Видео про комфи с 18:00:
https://www.youtube.com/watch?v=FGQJlIReiEo
-----------------

#Aironically #нейрорендер #обучение
------
@tsingular

🔥11✍6❤3⚡2🙏2👍1

5.12K views19:20

About

Blog

Apps

Platform