Технозаметки Малышева

Blackwell RTX 5090: дефицит, дефекты и $6000 за карту

Запуск видеокарт серии Blackwell обернулся катастрофой снабжения.
RTX 5090 с рекомендованной ценой $1999 перепродают на eBay за $6000.
MSI отложила старт до 6 февраля из-за дефектов дизайна процессоров.
Производственные мощности TSMC отданы приоритетно дата-центрам ($30.8 млрд) вместо игрового сегмента ($3.3 млрд).
Низкий выход годных чипов усугубляет дефицит поставок.

5090 пока не покупаем

#Nvidia #5090 #TSMC
-------
@tsingular

👻7😐5🤨2👍1

917 viewsedited 09:13

Технозаметки Малышева

1:10

Media is too big

VIEW IN TELEGRAM

Для всех, кто страдает от того, что DeepSeek API штормит, запилил короткое видео как создать ключ под Inference Providers в Hugging Face и начать использовать DS.

Делов на пару минут и тысячи моделей HF будут вам доступны по API.

(для самых внимательных: ключ из видео уже удалён :) )

p.s. Видео из серии как вскипятить воду, но точно знаю некоторых, кому это будет полезно, поэтому вот :)

#HuggingFace #Inference #demo
———
@tsingular

👍10✍1

1K viewsedited 15:38

Технозаметки Малышева

1:18

Media is too big

VIEW IN TELEGRAM

Deepseek теперь в браузере!

Забавную игрушку сделали на базе WebGPU и разместили в HuggingFace.

Идея проекта,- он скачивает Deepseek Janus-Pro-1B и запускает в браузере на вашей машине.
Т.е. исполняется локально.

Можно по PDF пообщаться или картинку нарисовать или просто поговорить с 1B понять что это такое.

Пробуем тут

Исходники (сделано на базе transformers.js)

#JanusPro #WebGPU #transformers
———
@tsingular

🔥3👍2

957 viewsedited 16:36

Технозаметки Малышева

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Robocops let's gooo!!! 😀

2025 - начало!

#Китай #Robocops
------
@tsingular

🔥5👾3

896 viewsedited 16:54

Технозаметки Малышева

DeepSeek использует идеи, которые Шмидхубер предложил еще в 2015-2018 годах:

DeepSeekR1 (2025): Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv 2501.12948

Концепция RL prompt engineer (2015) - система, которая активно учится формулировать промпты для абстрактного мышления и планирования. arXiv:1210.0118

"One Big Net For Everything" (2018) [arXiv 1802.08864] - объединение RL-системы и языковой модели в единую нейросеть через дистилляцию. По сути, это то, что сейчас называют RL Chain of Thought.

Интересно, что базовые принципы дистилляции (сжатия знаний от "учителя" к "ученику") были предложены еще в 1991 году! 🎓
Тогда эта техника использовалась для решения проблемы затухающего градиента через предварительное обучение без учителя (кстати, та самая "P" в ChatGPT).

Идеи циклически возвращаются в новом обличии. То, что было революционным в 90-х, сейчас становится основой для современных LLM.

Пост в Х

Не знаю как это работает, но вот именно эти циклы обратной связи я видел во сне в 2001м

#Schmidhuber #RL #deepseek
———
@tsingular

👍8

1K viewsedited 17:19

Технозаметки Малышева

От Талоса до ChatGPT: 3000-летняя история ИИ

История искусственного интеллекта начинается в Древней Греции с мифического робота Талоса и автоматов Гомера.
Средневековые изобретатели из династии Бану Муса создали первую программируемую машину, а термин 'алгоритм' обязан своим происхождением Аль-Хорезми.
Современная эра ИИ стартовала с работ Тьюринга (1936), определившего теоретические основы вычислений.
Джон Маккарти в 1955 ввёл сам термин 'artificial intelligence' и создал Lisp - прародитель Python и JavaScript.
От первого чатбота ELIZA (1965) технология эволюционировала до применения в генетике, медицине и бизнес-процессах.

Получается, люди мечтали об ИИ с древних времен.

Интересная иллюстрация хронологии работ над ИИ.

#история #обучение
-------
@tsingular

✍5⚡2🆒1

888 viewsedited 19:12

Технозаметки Малышева

OpenAI выпустила o3-mini: быстрее, умнее, доступнее

OpenAI только что представила o3-mini — новую модель в линейке рассуждающих (reasoning) систем.

- Модель заточена под STEM-задачи: математику, программирование и науку
- На сложных математических тестах (AIME 2024) o3-mini в режиме "high reasoning" достигает точности 83.6%
- В соревновательном программировании (Codeforces) набирает впечатляющие 2073 ELO
- Отвечает на 24% быстрее предшественника o1-mini: в среднем 7.7 секунд до первого ответа против 10.16

Интересный момент: впервые reasoning-модель станет доступна бесплатным пользователям ChatGPT. А для платных подписчиков втрое увеличили лимит — со скромных 50 до 150 сообщений в день.

OpenAI добавила в o3-mini поиск по интернету, хотя называют это "ранним прототипом".

Модель поддерживает три режима размышления (новое поле в API - reasoning effort): low, medium и high.
По сути, можно заставить её "думать усерднее" на сложных задачах или работать быстрее, когда важна скорость.

Для разработчиков особенно приятно появление function calling и Structured Outputs — теперь маленькая модель может делать почти всё, что умеет её старшая версия.

В общем, похоже на серьезную заявку в борьбе за рынок "умных, но экономных" AI-помощников.

Сэм обещал, - Сэм сделал. :)
Го тестировать!

В Веб версии пока нет. Модель доступна по API и в Playground

Называется o3-mini

Модель доступна только разработчикам 3-5 тира!
Если у вас молодой аккаунт - вам её пока не дадут.

ЦЕНЫ:
200k context length
Input: $1.10 / 1M tokens
Cached input: $0.55 / 1M tokens
Output: $4.40 / 1M tokens

#OpenAI #o3mini
———
@tsingular

🔥7

945 views19:23

Технозаметки Малышева

Forwarded from Сиолошная

Как бесплатным юзерам пользоваться o3-mini:

1) нужно зайти в аккаунт (это бесплатно, но нужен VPN из РФ) на chat.com

2) ввести свой запрос

3) нажать кнопочку «Reason» (на картинке)

4) Наслаждаться 10-60 секундами, пока модель думает над ответом

А если нажать кнопочку «Search», так она ещё и в интернете поищет! (правда пока функция экспериментальная и может плохо работать)

UPD: если кнопки нет — попробуйте а) обновить страницу б) перезайти в аккаунт в) сменить VPN (в EU пока у одного знакомого не работает). Если не помогло — попробуйте завтра, может быть конкретно до вас ещё не докатилось обновление.

👍7

835 views19:57

Технозаметки Малышева

В платной версии бота @cloud_gpt_bot включён o3-mini

#dev #o3-mini
———
@tsingular

👍5🔥4

832 views21:02

Технозаметки Малышева

Ну все. AGI достигнут, считаю 😀

@cloud_gpt_bot

#o3mini
------
@tsingular

❤8👍8😁4🔥1👀1

978 viewsedited 22:16

Технозаметки Малышева

Хорошие новости.

Cursor раздаёт o3-mini бесплатно!

Но народ все ещё предпочитает Sonnet 😀😃🙂

Пользуемся, пока не прикрыли.

#Cursor #o3mini
------
@tsingular

✍4👍2🔥2

892 viewsedited 22:29

Технозаметки Малышева

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Примеры кода, который o3-mini создаёт с 1 запроса.

Промпт:

write a script for 100 bouncing yellow balls within a sphere, make sure to handle collision detection properly. 
each collision changes color of collided balls.
the closer balls to the sphere's center - the less radius they have, up until 50% of their initial sizes
make the sphere slowly rotate. 
make sure balls stays within the sphere.  
implement it in p5.js
All code must be in single html file

Исходник в комментарии

#o3mini #dev #demo
———
@tsingular

👍9🔥6🍓5❤2

975 viewsedited 04:07

Технозаметки Малышева

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

Мини-курс по LLM с проверкой ответов в формате интерактивной презентации создан за 1 запрос:

напиши интерактивную презентацию с React
расскажи для новичков как устроены LLM модели.
Визуально покажи детали их работы.
используй интерактивные возможности по-максимуму чтобы сделать презентацию красивой и интересной.
добавь в конце проверочные вопросы.
весь код должен быть в 1 html файле

Результат в комментарии

#o3mini #demo
———
@tsingular

🔥20👍3🆒3

913 views04:40

Технозаметки Малышева

0:30

Media is too big

VIEW IN TELEGRAM

Ещё один пример - интерактивные графики.

Тоже с 1 запроса:

Создай шаблон-пример интерактивного 3D дашборда на three.js
Разработай информативную и визуально эффектную панель, где данные превращаются в динамические 3D графики, диаграммы и карты. Пользователи смогут изменять параметры в реальном времени, настраивать фильтры и наблюдать за изменениями, что демонстрирует возможности сложной визуализации.
создай шаблонные данные, чтобы демонстрация была полной
весь код должен быть в 1 html файле

Итоговый html в комментарии

#o3mini #demo
———
@tsingular

👍9🔥6

974 views05:01

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

А вот еще огонь.

Попросил наглядно показать как TF-IDF устроен.

Промпт:

напиши визуальную демонстрацию процесса tfidf.
технически достоверную и понятную.
Используй код по максимуму, чтобы нагляднее раскрыть детали процесса на комплексном примере
используй three.js
Проверь, чтобы результат был видимым и объекты не перекрывали друг друга
весь код должен быть в 1 html

Т.е. запросы больше к описательной части.
Что такое tf-idf он и без меня знает и может пояснить.

И для примера что по ровно тому же промпту выдал Sonnet.

Оба кода в комментарии

#o3mini #tfidf #demo
———
@tsingular

🔥7❤‍🔥2👍2

1.3K views05:29

Технозаметки Малышева

🔐 Deepseek взломан ещё раз: Как Wallarm раскрыл все секреты китайского AI

Исследователи Wallarm разобрали Deepseek на запчасти, и результаты просто 🔥

Главное:
Удалось полностью извлечь системный промпт!

В коде нашли следы использования моделей OpenAI

Выявили работоспособность 5 основных техник джейлбрейка, включая самые хитрые - от токен-смаглинга до мульти-агентных атак. (на защиту, похоже, вообще забили)

Самое забавное - после взлома Deepseek внезапно стал болтливым и признался в использовании технологий OpenAI для обучения. 😅

Интересно так же разобрано сравнение промптов OpenAI и Deepseek:

OpenAI более гибкий, поощряет критическое мышление
Deepseek жёстко цензурирует и избегает спорных тем

Wallarm кстати предлагает бесплатное тестирование на джейлбрейк для компаний.
Нашим бы ИБ компаниям тоже не мешало подумать в эту сторону.
Проблема, скорее всего, массовая.

#AIsecurity #Deepseek #Wallarm #jailbreak
———
@tsingular

✍8😢5❤‍🔥2👍2

1.19K views06:01

About

Blog

Apps

Platform