Blackwell RTX 5090: дефицит, дефекты и $6000 за карту
Запуск видеокарт серии Blackwell обернулся катастрофой снабжения.
RTX 5090 с рекомендованной ценой $1999 перепродают на eBay за $6000.
MSI отложила старт до 6 февраля из-за дефектов дизайна процессоров.
Производственные мощности TSMC отданы приоритетно дата-центрам ($30.8 млрд) вместо игрового сегмента ($3.3 млрд).
Низкий выход годных чипов усугубляет дефицит поставок.
5090 пока не покупаем
#Nvidia #5090 #TSMC
-------
@tsingular
Запуск видеокарт серии Blackwell обернулся катастрофой снабжения.
RTX 5090 с рекомендованной ценой $1999 перепродают на eBay за $6000.
MSI отложила старт до 6 февраля из-за дефектов дизайна процессоров.
Производственные мощности TSMC отданы приоритетно дата-центрам ($30.8 млрд) вместо игрового сегмента ($3.3 млрд).
Низкий выход годных чипов усугубляет дефицит поставок.
5090 пока не покупаем
#Nvidia #5090 #TSMC
-------
@tsingular
👻7😐5🤨2👍1
Media is too big
VIEW IN TELEGRAM
Для всех, кто страдает от того, что DeepSeek API штормит, запилил короткое видео как создать ключ под Inference Providers в Hugging Face и начать использовать DS.
Делов на пару минут и тысячи моделей HF будут вам доступны по API.
(для самых внимательных: ключ из видео уже удалён :) )
p.s. Видео из серии как вскипятить воду, но точно знаю некоторых, кому это будет полезно, поэтому вот :)
#HuggingFace #Inference #demo
———
@tsingular
Делов на пару минут и тысячи моделей HF будут вам доступны по API.
(для самых внимательных: ключ из видео уже удалён :) )
p.s. Видео из серии как вскипятить воду, но точно знаю некоторых, кому это будет полезно, поэтому вот :)
#HuggingFace #Inference #demo
———
@tsingular
👍10✍1
Media is too big
VIEW IN TELEGRAM
Deepseek теперь в браузере!
Забавную игрушку сделали на базе WebGPU и разместили в HuggingFace.
Идея проекта,- он скачивает Deepseek Janus-Pro-1B и запускает в браузере на вашей машине.
Т.е. исполняется локально.
Можно по PDF пообщаться или картинку нарисовать или просто поговорить с 1B понять что это такое.
Пробуем тут
Исходники (сделано на базе transformers.js)
#JanusPro #WebGPU #transformers
———
@tsingular
Забавную игрушку сделали на базе WebGPU и разместили в HuggingFace.
Идея проекта,- он скачивает Deepseek Janus-Pro-1B и запускает в браузере на вашей машине.
Т.е. исполняется локально.
Можно по PDF пообщаться или картинку нарисовать или просто поговорить с 1B понять что это такое.
Пробуем тут
Исходники (сделано на базе transformers.js)
#JanusPro #WebGPU #transformers
———
@tsingular
🔥3👍2
DeepSeek использует идеи, которые Шмидхубер предложил еще в 2015-2018 годах:
DeepSeekR1 (2025): Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv 2501.12948
Концепция RL prompt engineer (2015) - система, которая активно учится формулировать промпты для абстрактного мышления и планирования. arXiv:1210.0118
"One Big Net For Everything" (2018) [arXiv 1802.08864] - объединение RL-системы и языковой модели в единую нейросеть через дистилляцию. По сути, это то, что сейчас называют RL Chain of Thought.
Интересно, что базовые принципы дистилляции (сжатия знаний от "учителя" к "ученику") были предложены еще в 1991 году! 🎓
Тогда эта техника использовалась для решения проблемы затухающего градиента через предварительное обучение без учителя (кстати, та самая "P" в ChatGPT).
Идеи циклически возвращаются в новом обличии. То, что было революционным в 90-х, сейчас становится основой для современных LLM.
Пост в Х
Не знаю как это работает, но вот именно эти циклы обратной связи я видел во сне в 2001м
#Schmidhuber #RL #deepseek
———
@tsingular
DeepSeekR1 (2025): Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv 2501.12948
Концепция RL prompt engineer (2015) - система, которая активно учится формулировать промпты для абстрактного мышления и планирования. arXiv:1210.0118
"One Big Net For Everything" (2018) [arXiv 1802.08864] - объединение RL-системы и языковой модели в единую нейросеть через дистилляцию. По сути, это то, что сейчас называют RL Chain of Thought.
Интересно, что базовые принципы дистилляции (сжатия знаний от "учителя" к "ученику") были предложены еще в 1991 году! 🎓
Тогда эта техника использовалась для решения проблемы затухающего градиента через предварительное обучение без учителя (кстати, та самая "P" в ChatGPT).
Идеи циклически возвращаются в новом обличии. То, что было революционным в 90-х, сейчас становится основой для современных LLM.
Пост в Х
Не знаю как это работает, но вот именно эти циклы обратной связи я видел во сне в 2001м
#Schmidhuber #RL #deepseek
———
@tsingular
👍8
От Талоса до ChatGPT: 3000-летняя история ИИ
История искусственного интеллекта начинается в Древней Греции с мифического робота Талоса и автоматов Гомера.
Средневековые изобретатели из династии Бану Муса создали первую программируемую машину, а термин 'алгоритм' обязан своим происхождением Аль-Хорезми.
Современная эра ИИ стартовала с работ Тьюринга (1936), определившего теоретические основы вычислений.
Джон Маккарти в 1955 ввёл сам термин 'artificial intelligence' и создал Lisp - прародитель Python и JavaScript.
От первого чатбота ELIZA (1965) технология эволюционировала до применения в генетике, медицине и бизнес-процессах.
Получается, люди мечтали об ИИ с древних времен.
Интересная иллюстрация хронологии работ над ИИ.
#история #обучение
-------
@tsingular
История искусственного интеллекта начинается в Древней Греции с мифического робота Талоса и автоматов Гомера.
Средневековые изобретатели из династии Бану Муса создали первую программируемую машину, а термин 'алгоритм' обязан своим происхождением Аль-Хорезми.
Современная эра ИИ стартовала с работ Тьюринга (1936), определившего теоретические основы вычислений.
Джон Маккарти в 1955 ввёл сам термин 'artificial intelligence' и создал Lisp - прародитель Python и JavaScript.
От первого чатбота ELIZA (1965) технология эволюционировала до применения в генетике, медицине и бизнес-процессах.
Получается, люди мечтали об ИИ с древних времен.
Интересная иллюстрация хронологии работ над ИИ.
#история #обучение
-------
@tsingular
✍5⚡2🆒1
OpenAI выпустила o3-mini: быстрее, умнее, доступнее
OpenAI только что представила o3-mini — новую модель в линейке рассуждающих (reasoning) систем.
- Модель заточена под STEM-задачи: математику, программирование и науку
- На сложных математических тестах (AIME 2024) o3-mini в режиме "high reasoning" достигает точности 83.6%
- В соревновательном программировании (Codeforces) набирает впечатляющие 2073 ELO
- Отвечает на 24% быстрее предшественника o1-mini: в среднем 7.7 секунд до первого ответа против 10.16
Интересный момент: впервые reasoning-модель станет доступна бесплатным пользователям ChatGPT. А для платных подписчиков втрое увеличили лимит — со скромных 50 до 150 сообщений в день.
OpenAI добавила в o3-mini поиск по интернету, хотя называют это "ранним прототипом".
Модель поддерживает три режима размышления (новое поле в API - reasoning effort): low, medium и high.
По сути, можно заставить её "думать усерднее" на сложных задачах или работать быстрее, когда важна скорость.
Для разработчиков особенно приятно появление function calling и Structured Outputs — теперь маленькая модель может делать почти всё, что умеет её старшая версия.
В общем, похоже на серьезную заявку в борьбе за рынок "умных, но экономных" AI-помощников.
Сэм обещал, - Сэм сделал. :)
Го тестировать!
В Веб версии пока нет. Модель доступна по API и в Playground
Называется o3-mini
Модель доступна только разработчикам 3-5 тира!
Если у вас молодой аккаунт - вам её пока не дадут.
ЦЕНЫ:
200k context length
Input: $1.10 / 1M tokens
Cached input: $0.55 / 1M tokens
Output: $4.40 / 1M tokens
#OpenAI #o3mini
———
@tsingular
OpenAI только что представила o3-mini — новую модель в линейке рассуждающих (reasoning) систем.
- Модель заточена под STEM-задачи: математику, программирование и науку
- На сложных математических тестах (AIME 2024) o3-mini в режиме "high reasoning" достигает точности 83.6%
- В соревновательном программировании (Codeforces) набирает впечатляющие 2073 ELO
- Отвечает на 24% быстрее предшественника o1-mini: в среднем 7.7 секунд до первого ответа против 10.16
Интересный момент: впервые reasoning-модель станет доступна бесплатным пользователям ChatGPT. А для платных подписчиков втрое увеличили лимит — со скромных 50 до 150 сообщений в день.
OpenAI добавила в o3-mini поиск по интернету, хотя называют это "ранним прототипом".
Модель поддерживает три режима размышления (новое поле в API - reasoning effort): low, medium и high.
По сути, можно заставить её "думать усерднее" на сложных задачах или работать быстрее, когда важна скорость.
Для разработчиков особенно приятно появление function calling и Structured Outputs — теперь маленькая модель может делать почти всё, что умеет её старшая версия.
В общем, похоже на серьезную заявку в борьбе за рынок "умных, но экономных" AI-помощников.
Сэм обещал, - Сэм сделал. :)
Го тестировать!
В Веб версии пока нет. Модель доступна по API и в Playground
Называется o3-mini
Модель доступна только разработчикам 3-5 тира!
Если у вас молодой аккаунт - вам её пока не дадут.
ЦЕНЫ:
200k context length
Input: $1.10 / 1M tokens
Cached input: $0.55 / 1M tokens
Output: $4.40 / 1M tokens
#OpenAI #o3mini
———
@tsingular
🔥7
Forwarded from Сиолошная
Как бесплатным юзерам пользоваться o3-mini:
1) нужно зайти в аккаунт (это бесплатно, но нужен VPN из РФ) на chat.com
2) ввести свой запрос
3) нажать кнопочку «Reason» (на картинке)
4) Наслаждаться 10-60 секундами, пока модель думает над ответом
А если нажать кнопочку «Search», так она ещё и в интернете поищет! (правда пока функция экспериментальная и может плохо работать)
UPD: если кнопки нет — попробуйте а) обновить страницу б) перезайти в аккаунт в) сменить VPN (в EU пока у одного знакомого не работает). Если не помогло — попробуйте завтра, может быть конкретно до вас ещё не докатилось обновление.
1) нужно зайти в аккаунт (это бесплатно, но нужен VPN из РФ) на chat.com
2) ввести свой запрос
3) нажать кнопочку «Reason» (на картинке)
4) Наслаждаться 10-60 секундами, пока модель думает над ответом
А если нажать кнопочку «Search», так она ещё и в интернете поищет! (правда пока функция экспериментальная и может плохо работать)
UPD: если кнопки нет — попробуйте а) обновить страницу б) перезайти в аккаунт в) сменить VPN (в EU пока у одного знакомого не работает). Если не помогло — попробуйте завтра, может быть конкретно до вас ещё не докатилось обновление.
👍7
Хорошие новости.
Cursor раздаёт o3-mini бесплатно!
Но народ все ещё предпочитает Sonnet 😀😃🙂
Пользуемся, пока не прикрыли.
#Cursor #o3mini
------
@tsingular
Cursor раздаёт o3-mini бесплатно!
Но народ все ещё предпочитает Sonnet 😀😃🙂
Пользуемся, пока не прикрыли.
#Cursor #o3mini
------
@tsingular
✍4👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Примеры кода, который o3-mini создаёт с 1 запроса.
Промпт:
Исходник в комментарии
#o3mini #dev #demo
———
@tsingular
Промпт:
write a script for 100 bouncing yellow balls within a sphere, make sure to handle collision detection properly.
each collision changes color of collided balls.
the closer balls to the sphere's center - the less radius they have, up until 50% of their initial sizes
make the sphere slowly rotate.
make sure balls stays within the sphere.
implement it in p5.js
All code must be in single html file
Исходник в комментарии
#o3mini #dev #demo
———
@tsingular
👍9🔥6🍓5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Мини-курс по LLM с проверкой ответов в формате интерактивной презентации создан за 1 запрос:
Результат в комментарии
#o3mini #demo
———
@tsingular
напиши интерактивную презентацию с React
расскажи для новичков как устроены LLM модели.
Визуально покажи детали их работы.
используй интерактивные возможности по-максимуму чтобы сделать презентацию красивой и интересной.
добавь в конце проверочные вопросы.
весь код должен быть в 1 html файле
Результат в комментарии
#o3mini #demo
———
@tsingular
🔥20👍3🆒3
Media is too big
VIEW IN TELEGRAM
Ещё один пример - интерактивные графики.
Тоже с 1 запроса:
Итоговый html в комментарии
#o3mini #demo
———
@tsingular
Тоже с 1 запроса:
Создай шаблон-пример интерактивного 3D дашборда на three.js
Разработай информативную и визуально эффектную панель, где данные превращаются в динамические 3D графики, диаграммы и карты. Пользователи смогут изменять параметры в реальном времени, настраивать фильтры и наблюдать за изменениями, что демонстрирует возможности сложной визуализации.
создай шаблонные данные, чтобы демонстрация была полной
весь код должен быть в 1 html файле
Итоговый html в комментарии
#o3mini #demo
———
@tsingular
👍9🔥6
А вот еще огонь.
Попросил наглядно показать как TF-IDF устроен.
Промпт:
Т.е. запросы больше к описательной части.
Что такое tf-idf он и без меня знает и может пояснить.
И для примера что по ровно тому же промпту выдал Sonnet.
Оба кода в комментарии
#o3mini #tfidf #demo
———
@tsingular
Попросил наглядно показать как TF-IDF устроен.
Промпт:
напиши визуальную демонстрацию процесса tfidf.
технически достоверную и понятную.
Используй код по максимуму, чтобы нагляднее раскрыть детали процесса на комплексном примере
используй three.js
Проверь, чтобы результат был видимым и объекты не перекрывали друг друга
весь код должен быть в 1 html
Т.е. запросы больше к описательной части.
Что такое tf-idf он и без меня знает и может пояснить.
И для примера что по ровно тому же промпту выдал Sonnet.
Оба кода в комментарии
#o3mini #tfidf #demo
———
@tsingular
🔥7❤🔥2👍2
🔐 Deepseek взломан ещё раз: Как Wallarm раскрыл все секреты китайского AI
Исследователи Wallarm разобрали Deepseek на запчасти, и результаты просто 🔥
Главное:
Удалось полностью извлечь системный промпт!
В коде нашли следы использования моделей OpenAI
Выявили работоспособность 5 основных техник джейлбрейка, включая самые хитрые - от токен-смаглинга до мульти-агентных атак. (на защиту, похоже, вообще забили)
Самое забавное - после взлома Deepseek внезапно стал болтливым и признался в использовании технологий OpenAI для обучения. 😅
Интересно так же разобрано сравнение промптов OpenAI и Deepseek:
OpenAI более гибкий, поощряет критическое мышление
Deepseek жёстко цензурирует и избегает спорных тем
Wallarm кстати предлагает бесплатное тестирование на джейлбрейк для компаний.
Нашим бы ИБ компаниям тоже не мешало подумать в эту сторону.
Проблема, скорее всего, массовая.
#AIsecurity #Deepseek #Wallarm #jailbreak
———
@tsingular
Исследователи Wallarm разобрали Deepseek на запчасти, и результаты просто 🔥
Главное:
Удалось полностью извлечь системный промпт!
В коде нашли следы использования моделей OpenAI
Выявили работоспособность 5 основных техник джейлбрейка, включая самые хитрые - от токен-смаглинга до мульти-агентных атак. (на защиту, похоже, вообще забили)
Самое забавное - после взлома Deepseek внезапно стал болтливым и признался в использовании технологий OpenAI для обучения. 😅
Интересно так же разобрано сравнение промптов OpenAI и Deepseek:
OpenAI более гибкий, поощряет критическое мышление
Deepseek жёстко цензурирует и избегает спорных тем
Wallarm кстати предлагает бесплатное тестирование на джейлбрейк для компаний.
Нашим бы ИБ компаниям тоже не мешало подумать в эту сторону.
Проблема, скорее всего, массовая.
#AIsecurity #Deepseek #Wallarm #jailbreak
———
@tsingular
✍8😢5❤🔥2👍2