Технозаметки Малышева

💰 Банк Китая выделит 1 триллион юаней (137 миллиардов долларов) в течение 5 лет для противостояния США в гонке искусственного интеллекта.

Это прямой ответ на проект «Звездные врата».

Евросоюз: максимум, что мы можем сделать, — это выделить 10 миллиардов на ИИ регулирование.

@ai_machinelearning_big_data

#ai #news #stargate #llm

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9😁4

907 views04:38

Технозаметки Малышева

О, Гугл зашевелился. :)

Наша последняя модель Гемини с размышлениями будет:

- бесплатной
- очень мощной
- добавим поиск на этой неделе
- с большим контекстом
- 1.5 миллиарда бесплатных токенов ежедневно.

Пошла жара. DeepSeek не только сдвинул NASDAQ на 1% вниз, но и гиганты, вроде Гугла, зашевелились и стали поворачиваться к пользователю лицом.
:)

#deepseek #google
———
@tsingular

⚡20🔥8❤5

957 views04:47

Технозаметки Малышева

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

До тех пор, пока нейрорендер не сможет так чётко удерживать все детали, генерируя подобные по абсурдности ролики, считаю, он не готов :)

#рендер #танки #юмор
———
@tsingular

😁20🔥14👍2

1.02K views04:56

Технозаметки Малышева

3:09

This media is not supported in your browser

VIEW IN TELEGRAM

Presenter: Мультиагентный ИИ-создатель голосовых презентаций

Интересный проект от разработчика rsrohan99 — мультиагентная система, которая превращает создание презентаций в AI-driven процесс.

Что умеет этот фреймворк:
- Генерирует презентации по любой теме с помощью нескольких AI-агентов, которые оценивают и переписывают презентацию на этапе генерации

- Создает диаграммы через Mermaid

- Пишет скрипты рассказа для каждого слайда с таймингом выступления

- Генерирует аудио-озвучку через ElevenLabs в параллельных потоках.

- Собирает итоговое видео с озвучкой через FFmpeg

Технически проект построен на:
LlamaIndex Workflows для оркестрации мультиагентной системы
markdown-slides + reveal.js для рендера презентаций
DeckTape для экспорта в PDF

Интересно, что автор реализовал полный pipeline: от генерации контента до создания готового видео с озвучкой. Причем все опенсорс и бесплатно! 🎉

Единственное "но" — нужны API-ключи OpenAI и ElevenLabs.

В принципе OpenAI спокойно меняется на Deepseek или на локальную ollama, а озвучка тоже через апи голосовых генераторов на HuggingFace делается.
Так что можно переписать на полностью бесплатный собственный генератор презентаций.
Если у кого получится, - делитесь.

#Presenter #презентации
———
@tsingular

🔥10⚡2

997 views05:03

Технозаметки Малышева

Давос 2024: CEO больше не будут управлять только людьми

CEO Salesforce Марк Бениофф прогнозирует радикальное изменение структуры управления компаниями.
Нынешние руководители становятся последними, кто руководит исключительно человеческим персоналом.

К 2027 году ИИ-системы превзойдут людей в большинстве профессиональных областей.

41% работодателей намерены заменить часть штата автоматизированными решениями к 2030.

77% организаций готовят программы переквалификации сотрудников для взаимодействия с ИИ.

На самом деле это ещё и для CEO испытание своего рода, - научиться управлять ИИ персоналом.
Ну или нужен ЗГД под ИИ ( Chief AI Officer) :)
И это уже не как Директор по цифровой трансформации, а ближе к HR функции. Что то на стыке.
"ИИ кадры решают всё"

#Salesforce #Davos #Automation
-------
@tsingular

👍8

1.1K viewsedited 05:16

Технозаметки Малышева

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

Groq уже разместил у себя Deepseek-R1-Distill-Llama-70b

Как вам модель с рассуждениями, которая генерит ответ со скоростью 275 токенов в секунду :)

Вот это реально ниша, которая может подвинуть акции NVidia на пару пунктов вниз. ИИ асики. Тема!
Ну или NVidia начнёт их выпускать сами.
Думаю они даже могли бы купить Groq, чтобы не мучаться.

#Groq #DeepSeek
———
@tsingular

🔥13

1.13K views05:40

Технозаметки Малышева

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Дрон DJI vs Unitree собаки.
Пока в формате развлечения бой на фейерверках.

К концу года фейерверки раздадут антропоморфам. (будем надеяться, что только фейерверки, конечно, но кого мы обманываем?!)

#Unitree #DJI #Китай #дроны
———
@tsingular

🔥8👍4🤯3

2.71K views08:50

Технозаметки Малышева

DeepSeek лёг под нагрузкой.

не работает ни web ни API.

Вот это популярность.

Интересно как они будут мощности расширять. Карты для Китая то по идее запрещено завозить :)

UPD: ожил :)
UPD2: опять лёг ...

#DeepSeek #Китай
———
@tsingular

😐12👻3❤2🗿2

1.08K viewsedited 09:29

Технозаметки Малышева

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Самое прикольное в андроидах, что они эволиционируют по частям.

Вашему вниманию рука :)

Можно роботу поставить, можно собаке или дрону.

А можно так оставить.
Пусть спину чешет :)

#роботы
------
@tsingular

😁15🆒5👍4🥰1

1.16K views12:23

Технозаметки Малышева

Forwarded from Machinelearning

⚡️

Мл сообщество активно обсуждает успехи Китая и DeepSeek-R1, в частности, в гонке за доминирование на рынке ИИ.

Релиз R1 и новости об инвестировании в развитие отрасли, вызвали падение акций американских ИТ-гигантов на бирже NASDAQ.

Но помимо R1 в этом месяце разработчики из Китая выпустили еще очень много интересных моделей 🔥 Китай набирает очень серьезные обороты,

Давайте посмотрим на список самых ярких релизов из Поднебесной за январь:

LLM:
✨ InternLM3-8B-Instruct
✨ MiniMax-Text-01
✨ RWKV-7 RNN + трансформер 👀
✨ Собственно сам DeepSeek-R1
✨ Baichuan-M1-14B медицинский LLM 🩺
✨ Qwen2.5-Math-PRM от Alibaba
✨ Qwen2.5 -1M

Модели кодинга:
✨ Tare от BytedanceTalk

TTS модели синтеза и генерации речи:
✨ T2A-01-HD от MiniMax AI
✨ LLaSA

МЛЛМ:
✨ Kimi k1.5 от Moonshot AI
✨ MiniCPM-o-2_6 от OpenBMB
✨ Sa2VA-4B от ByteDanceOSS
✨ VideoLLaMA 3 от Alibaba DAMO
✨ LLaVA-Mini от Китайской академии наук

✨Hunyuan-7B от TXhunyuan
✨ Hunyuan 3D 2.0

ИИ-агенты:
✨ UI-TARS от ByteDanceOSS
✨ GLM-PC

Датасеты:
✨ Fineweb-Edu-Chinese-V2.1
✨ Multimodal_textbook от Alibaba
✨ MME-Finance от Hithink AI
✨ GameFactory от KwaiVGI

📌 Полный список Релизов

#ai #ml #digest #china #deepseek #Alibaba

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14👍8⚡3😁1

970 views16:04

Технозаметки Малышева

🔬 Janus-Pro - новый мультимодальный генератор от DeepSeek

Для понимания изображений: SigLIP-L энкодер (384x384)
Для генерации: Специализированный токенизатор с даунсемплингом 16x

Фундамент: DeepSeek-LLM-7B-base
Общая архитектура: единый трансформер для всех модальностей

Эффективное использование памяти благодаря раздельным путям обработки

💪 Где показывает превосходство:

Понимание изображений:
- Превосходит специализированные модели в задачах VQA
- Лучше справляется с абстрактными рассуждениями о визуальном контенте

Генерация:
- Качество на уровне специализированных моделей
- Более стабильное соответствие текстовым промптам

Мультизадачность:
- Свободное переключение между пониманием и генерацией
- Нет деградации производительности при смене режимов

🎯 Технические преимущества:
- Меньше конфликтов в обучении благодаря раздельным путям
- Лучшая масштабируемость архитектуры
- Более эффективное использование вычислительных ресурсов

Что особенно интересно: архитектура Janus-Pro решает фундаментальную проблему unified моделей, при этом не усложняя систему дополнительными компонентами. Это редкий случай, когда "простое решение" оказывается действительно эффективным.

🔮 Перспективы:
Судя по архитектуре, модель имеет серьезный потенциал для масштабирования. Особенно интересно будет увидеть версию на базе их 70B модели - теоретически, это может дать качественный скачок в обеих модальностях.

https://github.com/deepseek-ai/Janus
paper

Demo

АСТАНАВИТЕСЬ!!!111 Адин адин!!
Уважаемые DeepSeek, новый год через 2 дня. Идите уже отдыхать и закупать видеокарты :))))

#DeepSeek #Janus #multimodal
———
@tsingular

🔥14😁4🤯2

1.02K viewsedited 16:57

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

А вот это интересно!

Умельцы из Unsloth пожали Deepseek весом более 700 гигабайт в ~150-180

https://t.me/seeallochnaya/2273

Т.е, внимание, - это 2 DIGITS!!!

Всего $6000 и R1 будет летать у вас ДОМА! :))

Потери в качестве минимальны. В примере видно, что она по прежнему генерит рабочий код.

Статья: https://unsloth.ai/blog/deepseekr1-dynamic

Главные технические моменты:

Архитектурный подход:
Они изучили архитектуру DeepSeek R1 и обнаружили, что модель использует MoE (Mixture of Experts) слои
Первые 3 слоя модели являются полностью плотными (не MoE)
MoE слои используют общих экспертов, занимая всего 1.5% весов

Стратегия квантизации:
Применили динамическую квантизацию, используя разные уровни точности для разных слоев:

Первые 3 плотных слоя (0.5% весов) оставили в 4-6 битном представлении
MoE слои с общими экспертами (1.5% весов) оставили в 6 битах
Модули внимания MLA (<5% весов) оставили в 4-6 битах
Основную массу весов (~88%) в MoE слоях сжали до 1.58 бит

Особое внимание к down_proj слоям:
Обнаружили, что down_proj матрицы особенно чувствительны к квантизации
Это связано с архитектурой SwiGLU, где down_proj должен масштабировать большие числа
Первые 3-6 MoE down_proj матриц оставили в высокой точности

Общие технические детали:
Размер модели уменьшился с 720GB до 131GB (сокращение на 80%)
Для работы требуется минимум 20GB RAM
Оптимальная производительность достигается при сумме VRAM + RAM ≥ 80GB
Скорость генерации около 140 токенов в секунду на 2x H100 80GB

#DeepSeek #Unsloth
———
@tsingular

🔥10👍4

1.1K viewsedited 17:41

Технозаметки Малышева

Forwarded from Не баг, а фича

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Трамп: «DeepSeek — сигнал для наших компаний о необходимости срочно сосредоточиться на победе».

Только что Президент США заявил, что рассматривает DeepSeek как «позитивный» проект, но американской отрасли следует как можно скорее сделать свой ответ.

Нейросети — новое ядерное оружие.

🙂

Не баг, а фича

Please open Telegram to view this post

VIEW IN TELEGRAM

✍8🔥2🤯2👀1🤝1

1.01K views03:28

Технозаметки Малышева

DeepSeek ловко обходит санкции, Nvidia одобряет

Китайская компания DeepSeek применила нестандартный подход к разработке конкурентоспособных генеративных моделей.
Предприятие задействовало локальную версию чипа H800 (адаптированный H100) в сочетании с Test Time Scaling.
Методика позволяет системе анализировать множество вариантов ответов, значительно повышая точность результатов.
Технологический гигант Nvidia дипломатично признал достижения, подчеркнув легитимность применяемых методов.
Инновационный подход демонстрирует возможность создания передовых моделей в условиях ограничений.

Т.е. обучение и инференс на картах, которые не попадают под санкции.

#DeepSeek #Nvidia #TestTimeScaling
-------
@tsingular

🔥13✍1

1.17K viewsedited 03:41

Технозаметки Малышева

Китайский ИИ-спринт к Новому году

1. DeepSeek R1 - рассуждающая модель на уровне GPT-4, но с открытым кодом и в 25 раз дешевле.

2. Kimi.ai K1.5 (Moonshot AI / Tencent) - соперник O1 в математике и коде.

3. Doubao-1.5-pro (ByteDance) - GPT-4 уровень всего за $0.022 за миллион токенов

4. MiniMax Text-01 - монстр на 456B параметров с контекстом в 4М токенов 🔥

5. Qwen 2.5 (Alibaba) - две версии, - с миллионным контекстом и генерацией медиа ⚡️

Бонус: Банк Китая вливает $137 млрд на 5 лет - прямой ответ на американский Stargate!

Итого 5 супермощных релизов и ещё сутки впереди :)
Продолжаем наблюдение.

Хотя вроде все крупные ИТ холдинги отметились. Остались только нишевые разработчики.

#Китай
———
@tsingular

1🔥18⚡6👍4❤1

1.39K viewsedited 05:57

Технозаметки Малышева

Сохраним нетленку :)

#Китай #юмор
———
@tsingular

😁24🤣15

1.49K views09:57

Технозаметки Малышева

1:45

Media is too big

VIEW IN TELEGRAM

Перевёл для вас выступление Трампа сегодняшнее.

Можно сколько угодно говорить о том хорошая это модель или не очень.
Что, вот наши делают не хуже, просто про них никто не слышал.
Перегрет пузырь и выехал ли Китай чисто на маркетинге, - но факт есть:

Модель ИИ обсуждается, как конкурентная на уровне президентов крупнейших стран.
Как стратегическая разработка.

И к отрасли должно быть такое же отношение у всех.

#Trump #DeepSeek #ElevenLabs
———
@tsingular

🔥17💯10👍4

1.14K views11:48

About

Blog

Apps

Platform