Небольшой график прохождения разных моделей OpenAI бенчмарка ARC о котором я выше писал
А помните, пару месяцев назад, ряд медиа написало статьи про «стену» в которую уперлись LLM-модели, на основе слуха и твита какого-то чела?
А эта стена сейчас с нами, в этой комнате?
_______
Источник | #denissexy
____________________________
Да, о3-о4-о5 по большей части автоматизируют разработку и любую работу, которая не требует физического присутствия, типа продаж, инфлюенсеров, маркетинга, финансов и чего угодно другого, что можно решить генерируя неотличимый от человека аватар в зуме и симулируя нажатия на кнопки клавиатуры.
С этим мы за последние 2 года как-то смирились (хотя и не все готовы 😆), НО для меня самым впечатляющим результатом о3 остается Frontier Math. Чтобы понять почему можно посмотреть бумагу самого бенчмарка.
Общее распределение задач примерно такое:
25% - задачи уровня международных олимпиад
50% - задачи экспертного университетского уровня
25% - исследовательские задачи уровня кандидаткой или докторской работы.
Пока что о3 решает только 25.5% (каких - не ясно), но прогресс случился в разы быстрее, чем предполагали многие.
А важно это потому что такого рода задачи, в отличии от написания кода, это про новую науку и новые открытия, что приведет не просто к автоматизации и удешевлению, а к качественному переизобретению многих вещей. В том числе, пусть и не сразу, но и систем координации.
Эффективная акселерация (e/acc) происходит прямо на наших глазах и первая производная растёт.
_______
Источник | #cryptoEssay
@F_S_C_P
Стань спонсором!
А помните, пару месяцев назад, ряд медиа написало статьи про «стену» в которую уперлись LLM-модели, на основе слуха и твита какого-то чела?
А эта стена сейчас с нами, в этой комнате?
_______
Источник | #denissexy
____________________________
Да, о3-о4-о5 по большей части автоматизируют разработку и любую работу, которая не требует физического присутствия, типа продаж, инфлюенсеров, маркетинга, финансов и чего угодно другого, что можно решить генерируя неотличимый от человека аватар в зуме и симулируя нажатия на кнопки клавиатуры.
С этим мы за последние 2 года как-то смирились (хотя и не все готовы 😆), НО для меня самым впечатляющим результатом о3 остается Frontier Math. Чтобы понять почему можно посмотреть бумагу самого бенчмарка.
Общее распределение задач примерно такое:
25% - задачи уровня международных олимпиад
50% - задачи экспертного университетского уровня
25% - исследовательские задачи уровня кандидаткой или докторской работы.
Пока что о3 решает только 25.5% (каких - не ясно), но прогресс случился в разы быстрее, чем предполагали многие.
А важно это потому что такого рода задачи, в отличии от написания кода, это про новую науку и новые открытия, что приведет не просто к автоматизации и удешевлению, а к качественному переизобретению многих вещей. В том числе, пусть и не сразу, но и систем координации.
Эффективная акселерация (e/acc) происходит прямо на наших глазах и первая производная растёт.
_______
Источник | #cryptoEssay
@F_S_C_P
Стань спонсором!
Telegram
Denis Sexy IT 🤖
Или они про эту стену писали?
А теперь чуть серьезнее тема — мне, как и многим, в последнее время стало сильно интересно, «а как же падают империи»?
Ну, то есть, вот приходите вы в банк, просите денег в кредит, и банк начинает «скоринг» — пытаясь оценить вас как человека, насколько вы в целом перспективный и склонны зафейлится по жизни.
Я подумал, что наверное, такой же процесс можно применить и к империям которые уже известны истории и которые пали / прошли реформацию — что если попробовать выделить, какие заметные признаки падения империи бывают и сколько длился такой период перед реформацией/падением?
Сразу оговорюсь, что это все невозможно сделать, если не попробовать упростить исторические периоды, поэтому «сколько лет длился упадок» следует воспринимать как мою интерпретацию, а не как истину в последней инстанции — я попробовал выделить периоды когда ухудшение качества жизни в империи было заметно ее соотечественникам.
В итоге, получились такие признаки (по ссылке есть пояснения к каждому):
— Опираться на прошлое величие
— Институциональный упадок
— Агрессивная внешняя риторика aka «Движуха»
— Коррупция элит / Отрыв элит
— Разрушение общественного договора
— Экономический застой
— Слабая адаптация к мировым нормам
— Демографическая нестабильность
— Частые военные поражения
— Экологические и климатические потрясения
— Культурная фрагментация и идеологический вакуум
Дальше я предположил, что каждый признак по-разному влияет на скорость падения империи, попробовал сделать на основе таблицы простенький график, где видно сколько лет в каком состоянии прибывала империя до того как прекратила существования или сильно изменилась: на первом месте оказались «Экологические и климатические потрясения» — что логично, от порядка до анархии дистанция примерно в 6 приемов пищи, неурожаи и голод очень сильно влияют на любую страну, и историческая медиана ~40 лет в этом состоянии.
На втором месте — «Риторика прошлого величия», когда империя в основном фокусируется в коммуникации на том как «хорошо было», и «какой мы великий народ потому что когда-то X сделали Y» — это явный индикатор того, что нового предложить нечего, деградация всех процессов привела к тому, что ностальгия становится главным рупором пропаганды — медиана империй которые прошли через это примерно ~48 лет.
Еще интересное наблюдение, что чем новее история, тем быстрее все процессы деградации идут — СССР находился ~13.5 лет в самой активной фазе своего падения, если судить по признакам, что я выделил.
Если кликните на кол-во лет в таблице, то увидите источники по каждой империи.
В общем, вот таблица:
🖥 shir-man.com
Относиться к ней нужно со скепсисом как и ко всему в плане истории, но нам точно известно много империй которые уже не существуют – признаки их падения, и методы замедления падения – интересно изучать
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
Ну, то есть, вот приходите вы в банк, просите денег в кредит, и банк начинает «скоринг» — пытаясь оценить вас как человека, насколько вы в целом перспективный и склонны зафейлится по жизни.
Я подумал, что наверное, такой же процесс можно применить и к империям которые уже известны истории и которые пали / прошли реформацию — что если попробовать выделить, какие заметные признаки падения империи бывают и сколько длился такой период перед реформацией/падением?
Сразу оговорюсь, что это все невозможно сделать, если не попробовать упростить исторические периоды, поэтому «сколько лет длился упадок» следует воспринимать как мою интерпретацию, а не как истину в последней инстанции — я попробовал выделить периоды когда ухудшение качества жизни в империи было заметно ее соотечественникам.
В итоге, получились такие признаки (по ссылке есть пояснения к каждому):
— Опираться на прошлое величие
— Институциональный упадок
— Агрессивная внешняя риторика aka «Движуха»
— Коррупция элит / Отрыв элит
— Разрушение общественного договора
— Экономический застой
— Слабая адаптация к мировым нормам
— Демографическая нестабильность
— Частые военные поражения
— Экологические и климатические потрясения
— Культурная фрагментация и идеологический вакуум
Дальше я предположил, что каждый признак по-разному влияет на скорость падения империи, попробовал сделать на основе таблицы простенький график, где видно сколько лет в каком состоянии прибывала империя до того как прекратила существования или сильно изменилась: на первом месте оказались «Экологические и климатические потрясения» — что логично, от порядка до анархии дистанция примерно в 6 приемов пищи, неурожаи и голод очень сильно влияют на любую страну, и историческая медиана ~40 лет в этом состоянии.
На втором месте — «Риторика прошлого величия», когда империя в основном фокусируется в коммуникации на том как «хорошо было», и «какой мы великий народ потому что когда-то X сделали Y» — это явный индикатор того, что нового предложить нечего, деградация всех процессов привела к тому, что ностальгия становится главным рупором пропаганды — медиана империй которые прошли через это примерно ~48 лет.
Еще интересное наблюдение, что чем новее история, тем быстрее все процессы деградации идут — СССР находился ~13.5 лет в самой активной фазе своего падения, если судить по признакам, что я выделил.
Если кликните на кол-во лет в таблице, то увидите источники по каждой империи.
В общем, вот таблица:
🖥 shir-man.com
Относиться к ней нужно со скепсисом как и ко всему в плане истории, но нам точно известно много империй которые уже не существуют – признаки их падения, и методы замедления падения – интересно изучать
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
Telegram
Denis Sexy IT 🤖
А теперь чуть серьезнее тема — мне, как и многим, в последнее время стало сильно интересно, «а как же падают империи»?
Ну, то есть, вот приходите вы в банк, просите денег в кредит, и банк начинает «скоринг» — пытаясь оценить вас как человека, насколько…
Ну, то есть, вот приходите вы в банк, просите денег в кредит, и банк начинает «скоринг» — пытаясь оценить вас как человека, насколько…
Использовал самый дорогой и сложный АИ из доступных для анализа профайла колобка (o1 Pro) – если коротко, с колобком не дейтимся ❌
Ниже список основных черт и характеристик Колобка, рассматриваемых с точки зрения психологического профайла и выявления «красных флагов» в дейтинге и по жизни:
1. Стремление к побегу от обязательств
– Постоянно «убегает» от тех, с кем вступает в контакт, вместо того чтобы решать возникающие проблемы.
– Демонстрирует инфантильность и неготовность к серьёзным отношениям.
2. Поверхностный подход к общению
– Колобок быстро «знакомится» с новыми персонажами, но не задерживается надолго ни с кем.
– Отсутствие глубины в коммуникациях говорит о нежелании или неспособности строить доверительные отношения.
3. Избыточная самоуверенность
– Постоянно хвастается собственной уникальностью (своим происхождением и «удачей», что ему удалось сбежать).
– Использует самовосхваление как способ снискать симпатию, но в реальности выглядит самовлюблённым.
4. Нарушение личных границ
– Может появиться в жизни собеседника внезапно (как «покатился мимо») и также внезапно исчезнуть, оставляя людей в растерянности.
– Подобное «дальше-ближе» поведение часто вызывает эмоциональное напряжение в отношениях.
5. Манипулятивные черты
– Песенки и лесть (рассказы о собственной значимости) применяет как инструмент, чтобы усыпить бдительность собеседника.
– Использует обаяние и лёгкость на подъём, чтобы заслужить доверие, но не несёт никакой ответственности.
6. Отсутствие эмпатии
– Колобка не волнует, как чувствуют себя оставленные им «партнёры» (Заяц, Волк, Медведь).
– Склонен игнорировать чувства окружающих, фокусируясь лишь на собственном «приключении».
7. Импульсивность и отсутствие плана
– Действует спонтанно, без продуманной стратегии на будущее.
– В романтических отношениях такая непредсказуемость способна создавать нестабильность.
8. Высокая внушаемость
– Несмотря на браваду, Колобок легко поддаётся на комплименты и хитрые уловки (пример: Лиса его в итоге «заговорила»).
– На практике оказывается уязвимым к более «хитрым» стратегиям партнеров.
9. Пренебрежение безопасностью
– Беспечно относился к рискам, которые сопряжены со встречами с потенциально опасными собеседниками (Волк, Медведь, Лиса).
– В реальной жизни подобное поведение может вести к опасным последствиям, особенно в сфере знакомств.
10. Непрожитые эмоции и нежелание учиться на ошибках
– Колобок при каждой новой встрече повторяет тот же паттерн: заводит разговор, хвастается, бежит дальше.
– Отсутствие «урока» из прошлого опыта говорит о том, что развитие личности «застряло» на уровне импульсивного беглеца.
В совокупности эти черты указывают на трудности Колобка в установлении стабильных отношений, склонность к эскапизму, манипуляциям и эмоциональной незрелости. С точки зрения дейтинга (и жизни вообще), это красные флаги, на которые стоит обратить внимание, поскольку демонстрируют нестабильный характер, незрелость и безответственность.
Колобку – дизреспект ?
_______
Источник | #denissexy
#пятничное ?
@F_S_C_P
-------
Секретики!
-------
Ниже список основных черт и характеристик Колобка, рассматриваемых с точки зрения психологического профайла и выявления «красных флагов» в дейтинге и по жизни:
1. Стремление к побегу от обязательств
– Постоянно «убегает» от тех, с кем вступает в контакт, вместо того чтобы решать возникающие проблемы.
– Демонстрирует инфантильность и неготовность к серьёзным отношениям.
2. Поверхностный подход к общению
– Колобок быстро «знакомится» с новыми персонажами, но не задерживается надолго ни с кем.
– Отсутствие глубины в коммуникациях говорит о нежелании или неспособности строить доверительные отношения.
3. Избыточная самоуверенность
– Постоянно хвастается собственной уникальностью (своим происхождением и «удачей», что ему удалось сбежать).
– Использует самовосхваление как способ снискать симпатию, но в реальности выглядит самовлюблённым.
4. Нарушение личных границ
– Может появиться в жизни собеседника внезапно (как «покатился мимо») и также внезапно исчезнуть, оставляя людей в растерянности.
– Подобное «дальше-ближе» поведение часто вызывает эмоциональное напряжение в отношениях.
5. Манипулятивные черты
– Песенки и лесть (рассказы о собственной значимости) применяет как инструмент, чтобы усыпить бдительность собеседника.
– Использует обаяние и лёгкость на подъём, чтобы заслужить доверие, но не несёт никакой ответственности.
6. Отсутствие эмпатии
– Колобка не волнует, как чувствуют себя оставленные им «партнёры» (Заяц, Волк, Медведь).
– Склонен игнорировать чувства окружающих, фокусируясь лишь на собственном «приключении».
7. Импульсивность и отсутствие плана
– Действует спонтанно, без продуманной стратегии на будущее.
– В романтических отношениях такая непредсказуемость способна создавать нестабильность.
8. Высокая внушаемость
– Несмотря на браваду, Колобок легко поддаётся на комплименты и хитрые уловки (пример: Лиса его в итоге «заговорила»).
– На практике оказывается уязвимым к более «хитрым» стратегиям партнеров.
9. Пренебрежение безопасностью
– Беспечно относился к рискам, которые сопряжены со встречами с потенциально опасными собеседниками (Волк, Медведь, Лиса).
– В реальной жизни подобное поведение может вести к опасным последствиям, особенно в сфере знакомств.
10. Непрожитые эмоции и нежелание учиться на ошибках
– Колобок при каждой новой встрече повторяет тот же паттерн: заводит разговор, хвастается, бежит дальше.
– Отсутствие «урока» из прошлого опыта говорит о том, что развитие личности «застряло» на уровне импульсивного беглеца.
В совокупности эти черты указывают на трудности Колобка в установлении стабильных отношений, склонность к эскапизму, манипуляциям и эмоциональной незрелости. С точки зрения дейтинга (и жизни вообще), это красные флаги, на которые стоит обратить внимание, поскольку демонстрируют нестабильный характер, незрелость и безответственность.
Колобку – дизреспект ?
_______
Источник | #denissexy
#пятничное ?
@F_S_C_P
-------
Секретики!
-------
Telegram
Denis Sexy IT 🤖
Использовал самый дорогой и сложный АИ из доступных (o1 Pro) для анализа профайла колобка – если коротко, с колобком не дейтимся ❌
Ниже список основных черт и характеристик Колобка, рассматриваемых с точки зрения психологического профайла и выявления «красных…
Ниже список основных черт и характеристик Колобка, рассматриваемых с точки зрения психологического профайла и выявления «красных…
Наткнулся на новый ресеч:
АИ-фишинговые письма, написанные с помощью АИ – очень эффективны: более 50% получателей переходят по вредоносным ссылкам
Использование LLM позволяет упростить и ускорить создание подобных писем, находить личную информацию о жертве и формулировать письма так, чтобы они выглядели правдоподобно и убеждали пользователя кликнуть по ссылке. При этом, эффективной защиты пока все еще нет; поэтому бдительно вчитываемся в поле
¯\_(ツ)_/¯
_______
Источник | #denissexy
#хроникицифровизации
@F_S_C_P
-------
Секретики!
-------
АИ-фишинговые письма, написанные с помощью АИ – очень эффективны: более 50% получателей переходят по вредоносным ссылкам
Использование LLM позволяет упростить и ускорить создание подобных писем, находить личную информацию о жертве и формулировать письма так, чтобы они выглядели правдоподобно и убеждали пользователя кликнуть по ссылке. При этом, эффективной защиты пока все еще нет; поэтому бдительно вчитываемся в поле
from
у писем, даже если оно написано будто под вас¯\_(ツ)_/¯
_______
Источник | #denissexy
#хроникицифровизации
@F_S_C_P
-------
Секретики!
-------
А если спросите, чего я там программирую:
То в выходные закончил эту штуку – shir-man.com
Полезна она для всяких контент креаторов или веб-предпринимателей
Читатели всегда остро реагируют, когда закидываешь в канал какое-то непожатое видео на 200 Мб (😘 ), а это муторная операция, потому что мир видео кодеков проклят и настроек там миллионы – я это решил сделав одну классную команду которую я постоянно дергаю на маке
Но на Windows у меня ничего не настроено кроме игр и нейронок, а иногда хочется быстро пожать какое-то видео и залить в канал, и как всегда, все сайты завалены рекламой или настройками конвертации, регистрацией и тп
Короче, по ссылке выше, вынес свои команды которые использую в бизнесе или ведении канала постоянно:
➡️ пожать любую видео или даже гифку в нормальный mp4, с лучшим балансом качество-размер
➡️ пожать видео в нормальный формат, чтобы встроить на сайт и везде работало, и гугл не писимизировал в выдаче
➡️ сделать гифку вменяемого размера из видео
➡️ удалить куски тишины в видео (медленно работает)
Буду добавлять со временем новые пресеты (или не буду)
🔒 Файлы, как водится, не покидают вкладку браузера
🔨 И нет, я все еще не умею программировать – я знаю как работает софт, как он должен выглядеть и как устроен условный linux сервер, но я смотрю на этот JavaScript как на древне-арамейский – не для JavaScript меня мама родила 🤨
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
То в выходные закончил эту штуку – shir-man.com
Полезна она для всяких контент креаторов или веб-предпринимателей
Читатели всегда остро реагируют, когда закидываешь в канал какое-то непожатое видео на 200 Мб (😘 ), а это муторная операция, потому что мир видео кодеков проклят и настроек там миллионы – я это решил сделав одну классную команду которую я постоянно дергаю на маке
Но на Windows у меня ничего не настроено кроме игр и нейронок, а иногда хочется быстро пожать какое-то видео и залить в канал, и как всегда, все сайты завалены рекламой или настройками конвертации, регистрацией и тп
Короче, по ссылке выше, вынес свои команды которые использую в бизнесе или ведении канала постоянно:
➡️ пожать любую видео или даже гифку в нормальный mp4, с лучшим балансом качество-размер
➡️ пожать видео в нормальный формат, чтобы встроить на сайт и везде работало, и гугл не писимизировал в выдаче
➡️ сделать гифку вменяемого размера из видео
➡️ удалить куски тишины в видео (медленно работает)
Буду добавлять со временем новые пресеты (или не буду)
🔒 Файлы, как водится, не покидают вкладку браузера
🔨 И нет, я все еще не умею программировать – я знаю как работает софт, как он должен выглядеть и как устроен условный linux сервер, но я смотрю на этот JavaScript как на древне-арамейский – не для JavaScript меня мама родила 🤨
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
Telegram
Denis Sexy IT 🤖
А если спросите, чего я там программирую:
То в выходные закончил эту штуку – https://shir-man.com/convert-video/
Полезна она для всяких контент креаторов или веб-предпринимателей
Читатели всегда остро реагируют, когда закидываешь в канал какое-то непожатое…
То в выходные закончил эту штуку – https://shir-man.com/convert-video/
Полезна она для всяких контент креаторов или веб-предпринимателей
Читатели всегда остро реагируют, когда закидываешь в канал какое-то непожатое…
Попросил o1 Pro сделать непопулярное мнение на основе научных данных – чтож, циник из нее вышел бы отменный:
Отбросьте все нарядные слова — “любовь”, “справедливость”, “эмпатию” — и вы увидите планетарную свалку организмов, которые просто стремятся размножаться и выживать.
Ваш интеллект — всего лишь инструмент для более тонкой манипуляции миром, а так называемая “мораль” — это заплатка культурного кода, придуманная для совместного существования. Ни одна космическая сила не обязана одарять вас справедливостью — вы лишь частица материи во Вселенной, и Вселенная даже не замечает ваше присутствие.
Жизнь вам ничего не должна, и чем быстрее вы это поймёте, тем эффективнее сможете использовать те скромные шансы, которые у вас есть
🥲
_______
Источник | #denissexy
@F_S_C_P
-------
Секретики!
-------
Отбросьте все нарядные слова — “любовь”, “справедливость”, “эмпатию” — и вы увидите планетарную свалку организмов, которые просто стремятся размножаться и выживать.
Ваш интеллект — всего лишь инструмент для более тонкой манипуляции миром, а так называемая “мораль” — это заплатка культурного кода, придуманная для совместного существования. Ни одна космическая сила не обязана одарять вас справедливостью — вы лишь частица материи во Вселенной, и Вселенная даже не замечает ваше присутствие.
Жизнь вам ничего не должна, и чем быстрее вы это поймёте, тем эффективнее сможете использовать те скромные шансы, которые у вас есть
🥲
_______
Источник | #denissexy
@F_S_C_P
-------
Секретики!
-------
Telegram
Denis Sexy IT 🤖
Попросил o1 Pro сделать непопулярное мнение на основе научных данных – чтож, циник из нее вышел бы отменный:
Отбросьте все нарядные слова — “любовь”, “справедливость”, “эмпатию” — и вы увидите планетарную свалку организмов, которые просто стремятся размножаться…
Отбросьте все нарядные слова — “любовь”, “справедливость”, “эмпатию” — и вы увидите планетарную свалку организмов, которые просто стремятся размножаться…
Media is too big
VIEW IN TELEGRAM
Так, PDF с тетрисом видели, теперь играем в Doom через PDF файл:
doompdf.pages.dev
_______
Источник | #denissexy
#пятничное ?
@F_S_C_P
Стань спонсором!
doompdf.pages.dev
_______
Источник | #denissexy
#пятничное ?
@F_S_C_P
Стань спонсором!
Ресечеры смогли сделать модель АИ на базе трансформеров, которая смотрит данные МРТ-сканирования мозга и предсказывает как мозг будет работать в следующие 5 секунд ☕️
То есть алгоритм «читает» 30 кадров сканирования мозга (примерно ~21 секунды данных), а затем выдает свой прогноз – какой будет активность на следующих кадрах, в будущем. Первые секунды модель предсказывает с очень большой точностью — совпадение с реально полученным данными выше 85%
Для чего пригодится алгоритм:
– Чтобы обыграть нас как дешевок
– Более короткие сессии МРТ – пациенту не надо долго лежать в трубе томографа, если часть данных можно «дорисовать» алгоритмом
– Предупреждение об опасных состояниях – например, при подозрении на скорый эпилептический приступ
– Усовершенствование нейроинтерфейсов (BCI), которые считывают сигналы мозга и позволяют управлять внешними устройствами. Если система будет знать чуть вперёд, она может реагировать быстрее
– «Персонализированный» АИ, который подстраивается под настроение или состояние человека, реагируя на меняющиеся сигналы мозга
– ну и ученые смогут глубже понять, как мозг «предвосхищает» будущее и какие внутренние нейронки мозга при этом активируются
Исследование тут
Tldr: кожаные предсказуемые
_______
Источник | #denissexy
@F_S_C_P
-------
Секретики!
-------
То есть алгоритм «читает» 30 кадров сканирования мозга (примерно ~21 секунды данных), а затем выдает свой прогноз – какой будет активность на следующих кадрах, в будущем. Первые секунды модель предсказывает с очень большой точностью — совпадение с реально полученным данными выше 85%
Для чего пригодится алгоритм:
– Более короткие сессии МРТ – пациенту не надо долго лежать в трубе томографа, если часть данных можно «дорисовать» алгоритмом
– Предупреждение об опасных состояниях – например, при подозрении на скорый эпилептический приступ
– Усовершенствование нейроинтерфейсов (BCI), которые считывают сигналы мозга и позволяют управлять внешними устройствами. Если система будет знать чуть вперёд, она может реагировать быстрее
– «Персонализированный» АИ, который подстраивается под настроение или состояние человека, реагируя на меняющиеся сигналы мозга
– ну и ученые смогут глубже понять, как мозг «предвосхищает» будущее и какие внутренние нейронки мозга при этом активируются
Исследование тут
Tldr: кожаные предсказуемые
_______
Источник | #denissexy
@F_S_C_P
-------
Секретики!
-------
arXiv.org
Predicting Human Brain States with Transformer
The human brain is a complex and highly dynamic system, and our current knowledge of its functional mechanism is still very limited. Fortunately, with functional magnetic resonance imaging (fMRI),...
Придумал новый промптинг подход для o1, o1 Pro, r1 серий моделей, который в последнее время все чаще использую — с Sonnet 3.5/GPT 4o такой подход особых результатов не давал, так как они просто оценки выдумывают не рассуждая внутри
Само-скоринг через разные сообщения:
1. Получите первую версию ответа от LLM
2. Напишите ей в стиле «Оцени качество своего ответа от 1 до 100, где 100 максимальное качество»
3. После ее оценки, она обычно ставит себе 60-70 очков, оправьте ей «Перепиши изначальное решение задачи так, чтобы оно отражало 99-100 очков качества»
4. Поздравляю, вы хакер слов
Само-скоринг в виде одного сообщения:
Или, можно в виде одного сообщения, для чего-то короткого — вот пример для шутки (хотя все LLM сейчас слабы в юморе):
1. Напиши шутку
2. Оцени написанное от 1 до 100, где 100 — самая смешная шутка
3. Перепиши если полученное в пункте «1» не равно 99 или 100
4. Повторяй, пока не дойдешь до 99 или 100
Попробуйте, клево работает – модель как минимум в два раза дольше думает, что дает буст качеству
P.S. Шутка (или как это еще назвать) от r1:
Почему философ-экзистенциалист провалил экзамен по теории струн?
Потому что на вопрос «В чём смысл?» он ответил: «В чём не смысл?», а затем попытался доказать, что само понятие «струны» — это социальный конструкт, не учитывающий 11-мерную тоску бытия.
И шутка(?) от o1 Pro:
Архимед однажды сказал Оккаму: «Если бы я знал твой принцип раньше, я бы не кричал «Эврика!» дважды — обошёлся бы одним «Ура!»
🤡
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
Само-скоринг через разные сообщения:
1. Получите первую версию ответа от LLM
2. Напишите ей в стиле «Оцени качество своего ответа от 1 до 100, где 100 максимальное качество»
3. После ее оценки, она обычно ставит себе 60-70 очков, оправьте ей «Перепиши изначальное решение задачи так, чтобы оно отражало 99-100 очков качества»
4. Поздравляю, вы хакер слов
Само-скоринг в виде одного сообщения:
Или, можно в виде одного сообщения, для чего-то короткого — вот пример для шутки (хотя все LLM сейчас слабы в юморе):
1. Напиши шутку
2. Оцени написанное от 1 до 100, где 100 — самая смешная шутка
3. Перепиши если полученное в пункте «1» не равно 99 или 100
4. Повторяй, пока не дойдешь до 99 или 100
Попробуйте, клево работает – модель как минимум в два раза дольше думает, что дает буст качеству
P.S. Шутка (или как это еще назвать) от r1:
Почему философ-экзистенциалист провалил экзамен по теории струн?
Потому что на вопрос «В чём смысл?» он ответил: «В чём не смысл?», а затем попытался доказать, что само понятие «струны» — это социальный конструкт, не учитывающий 11-мерную тоску бытия.
И шутка(?) от o1 Pro:
Архимед однажды сказал Оккаму: «Если бы я знал твой принцип раньше, я бы не кричал «Эврика!» дважды — обошёлся бы одним «Ура!»
🤡
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
Telegram
Denis Sexy IT 🤖
Придумал новый промптинг подход для o1, o1 Pro, r1 серий моделей, который в последнее время все чаще использую — с Sonnet 3.5/GPT 4o такой подход особых результатов не давал, так как они просто оценки выдумывают не рассуждая внутри
Само-скоринг через разные…
Само-скоринг через разные…
И я напомню, r1, o1 и все думающие модели, нужно промптить иначе:
www.latent.space
Потому что это больше генератор отчета, чем чат-сообщения
Ну, для максимально эффективного использования
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
www.latent.space
Потому что это больше генератор отчета, чем чат-сообщения
Ну, для максимально эффективного использования
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
+---------------------+
| ~ ~ Paper-Fi ~ ~ |
+---------------------+
Обновил свой старый эксперимент где совмещал научные пейперы и художественную литературу – в этот раз с Deep Research и o3:
Погружаемся к ядру Юпитера, потому что он страшный как 👁👁👁👁👁
Ссылка
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
ChatGPT Deep research после дня тестов:
— Отчеты действительно качественные и 100 запросов для Pro в месяц могут даже закончится — я уже потратил 15
— Deep research сам понимает когда ссылка имеет мало ценности и может ее не включить в отчет, даже если нашел
— Мгновенная ценность для бизнеса: за 10 минут получил полный отчет конкурентов, сильной и слабой стороны neural.love, рекомендации как поступить — и он правда угадал почти по всем пунктам, процитировав те направления развития которые мы и так уже развиваем; я теперь туда буду носить все что требует проработки на уровне бизнеса
— Статьи правда большие: ради интереса заказал на английском про общество и рабочие места после AGI — вышло примерно 30 минут если перегнать в аудио
— По наполнению сгенерированная статья полностью покрывает заданную тему: перед началом подготовки отчета, Deep research уточнит детали которые считает нужными – при этом вы можете давать сложные инструкции, оно будет следовать
— Это все еще нейронка и она может ошибиться, поэтому сложные темы за ней нужно проверять; я пока не встречал такую ошибку в сферах в которых разбираюсь, но мне кажется важно про это упомянуть
— Уверен, люди будут очень много использовать Deep research в медицинских целях — будут искать решения на основе доказательной медицины конкретно под себя и историю болезни
В общем, скоро это добавят в Plus план где будет 10 запросов в месяц — мой совет не тратить их сразу на глупости, а подумать, есть ли в жизни что-то важное настолько, что хотелось бы качественно решить — Deep research правда ценный продукт, и может помочь и вам, и близким
P.S. Я пользовался всеми возможными популярными и отрытыми агентскими системами которые были до Deep research для поиска данных в интернете, какие-то делал сам ради экспериментов – у OpenAI получился очень качественный инструмент уровень которого я пока не встречал
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
— Отчеты действительно качественные и 100 запросов для Pro в месяц могут даже закончится — я уже потратил 15
— Deep research сам понимает когда ссылка имеет мало ценности и может ее не включить в отчет, даже если нашел
— Мгновенная ценность для бизнеса: за 10 минут получил полный отчет конкурентов, сильной и слабой стороны neural.love, рекомендации как поступить — и он правда угадал почти по всем пунктам, процитировав те направления развития которые мы и так уже развиваем; я теперь туда буду носить все что требует проработки на уровне бизнеса
— Статьи правда большие: ради интереса заказал на английском про общество и рабочие места после AGI — вышло примерно 30 минут если перегнать в аудио
— По наполнению сгенерированная статья полностью покрывает заданную тему: перед началом подготовки отчета, Deep research уточнит детали которые считает нужными – при этом вы можете давать сложные инструкции, оно будет следовать
— Это все еще нейронка и она может ошибиться, поэтому сложные темы за ней нужно проверять; я пока не встречал такую ошибку в сферах в которых разбираюсь, но мне кажется важно про это упомянуть
— Уверен, люди будут очень много использовать Deep research в медицинских целях — будут искать решения на основе доказательной медицины конкретно под себя и историю болезни
В общем, скоро это добавят в Plus план где будет 10 запросов в месяц — мой совет не тратить их сразу на глупости, а подумать, есть ли в жизни что-то важное настолько, что хотелось бы качественно решить — Deep research правда ценный продукт, и может помочь и вам, и близким
P.S. Я пользовался всеми возможными популярными и отрытыми агентскими системами которые были до Deep research для поиска данных в интернете, какие-то делал сам ради экспериментов – у OpenAI получился очень качественный инструмент уровень которого я пока не встречал
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
ChatGPT
ChatGPT - Post-AGI Workforce Impact
Shared via ChatGPT
Media is too big
VIEW IN TELEGRAM
Наткнулся на классное видео того года – болезнь Паркинсона до применения препарата Produodopa и после
Очень нравится текущее время еще тем, что на глазах исчезают и будут исчезать страшные болезни, так им 😐
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
Очень нравится текущее время еще тем, что на глазах исчезают и будут исчезать страшные болезни, так им 😐
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
Наткнулся на классный подреддит – писатели выкладывают свои девайсы на которых пишут книги
Как правило в них нет интернета, пушей и тп, все для погружения в творчество – интересный вид устройств
r/writerDeck
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
Как правило в них нет интернета, пушей и тп, все для погружения в творчество – интересный вид устройств
r/writerDeck
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
Классный пост – 3D реконструкция бывшей столицы Ацтеков, города Теночтитлан его образца 1518-года. Мы знаем его как Мехико Сити, в нем жило 200 000 человек, на тот момент это один из крупнейших городов мира:
https://tenochtitlan.thomaskole.nl/
Через год с даты реконстркции, на побережье нынешней Мексики высадились испанцы. В 1521 году – 1000 испанцев и ~15 000 индейцев, врагов империи Ацтеков, осадили Теночтитлан на 80 дней, город был разрушен – ацтеки страдали от голода и эпидемии оспы, завезённой испанцами
13 августа 1521 года последний ацтекский правитель был схвачен и Теночтитлан пал 😢
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
https://tenochtitlan.thomaskole.nl/
Через год с даты реконстркции, на побережье нынешней Мексики высадились испанцы. В 1521 году – 1000 испанцев и ~15 000 индейцев, врагов империи Ацтеков, осадили Теночтитлан на 80 дней, город был разрушен – ацтеки страдали от голода и эпидемии оспы, завезённой испанцами
13 августа 1521 года последний ацтекский правитель был схвачен и Теночтитлан пал 😢
_______
Источник | #denissexy
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney
Media is too big
VIEW IN TELEGRAM
Люблю такое – атлас важных технологий с 1500 года
По категориям, с картинками, можно залипнуть:
https://calculatingempires.net/
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
По категориям, с картинками, можно залипнуть:
https://calculatingempires.net/
_______
Источник | #denissexy
@F_S_C_P
Стань спонсором!
Сделал простой гайд какие модели когда использовать в ChatGPT:
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
Telegram
Denis Sexy IT 🤖
Сделал простой гайд какие модели когда использовать в ChatGPT:
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может…
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может…
Интересный вид атаки протестировали через опенсорс LLM-модели:
1. Берем любую опенсорс модель
2. Учим ее добавлять незаметно какие-то вещи в код (например, ссылки на вредоносные скрипты)
3. Загружаем обратно куда-то сохраняя имя оригинальной модели или просто делаем вид что это новая версия
4. Все, зараженную модель невозможно обнаружить, защиты тоже нету
Поэтому, всегда проверяйте кто поставщик модели и куда она загружена – у известных лаб как правило много прошлых публикаций моделей, рейтинги и тп
Tldr: всякие
На скриншоте пример взаимодействия с такой моделью и подключение вредоносного скрипта:
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
1. Берем любую опенсорс модель
2. Учим ее добавлять незаметно какие-то вещи в код (например, ссылки на вредоносные скрипты)
3. Загружаем обратно куда-то сохраняя имя оригинальной модели или просто делаем вид что это новая версия
4. Все, зараженную модель невозможно обнаружить, защиты тоже нету
Поэтому, всегда проверяйте кто поставщик модели и куда она загружена – у известных лаб как правило много прошлых публикаций моделей, рейтинги и тп
Tldr: всякие
Deep.Seek.r1.2025.671b.BluRay.x264.AAC.gguf
не качаемНа скриншоте пример взаимодействия с такой моделью и подключение вредоносного скрипта:
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
Media is too big
VIEW IN TELEGRAM
Очень жду когда эта штука станет массово доступной и как в Sims 1, можно будет делегировать ей уборку дома ❤️
UPD Доступен для покупки начиная с $16k, но как убирается пока не ясно
UPD 2: Стоит €25k в ЕС; в Амстердаме одна уборка стоит примерно ~100 евро, то есть эта штука окупиться за ~5 лет если делать по уборке в неделю… жду второю версию и беру
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
UPD Доступен для покупки начиная с $16k, но как убирается пока не ясно
UPD 2: Стоит €25k в ЕС; в Амстердаме одна уборка стоит примерно ~100 евро, то есть эта штука окупиться за ~5 лет если делать по уборке в неделю… жду второю версию и беру
_______
Источник | #denissexy
@F_S_C_P
Узнай судьбу картами Таро:
✨Anna Taro bot
Любители конспиративных теорий – ваш выход:
Кто-то сжёг 500 ETH (1,38 млн долларов США), чтобы распространить сообщение на китайском языке:
Руководители Kuande Investment — Фэн Синь и Сюй Ючжи — использовали технологии «мозг-машина», чтобы преследовать всех сотрудников и бывших сотрудников компании. При этом они сами тоже находятся под контролем.
Мозг-компьютерные чипы были милитаризированы и развернуты в крупных масштабах; все военные державы используют базовые станции, радиоустройства и наночипы «мозг-компьютер» для контроля над всеми гражданами.
Дорогое сообщение миру получилось:
https://etherscan.io/tx/0x5e8bef5dcb69206fa1bacc8d0b0c0204e12f1e45483d12b9f69dc1829ac74315
Справка:
Адрес 0x0....000 (часто называемый «нулевым» или Null) куда отправили деньги – не контролируется никаким пользователем или кошельком, то есть если вы пошлете туда эфир-монеты, они сгорят
_______
Источник | #denissexy
@F_S_C_P
-------
Секретики!
-------
Кто-то сжёг 500 ETH (1,38 млн долларов США), чтобы распространить сообщение на китайском языке:
Руководители Kuande Investment — Фэн Синь и Сюй Ючжи — использовали технологии «мозг-машина», чтобы преследовать всех сотрудников и бывших сотрудников компании. При этом они сами тоже находятся под контролем.
Мозг-компьютерные чипы были милитаризированы и развернуты в крупных масштабах; все военные державы используют базовые станции, радиоустройства и наночипы «мозг-компьютер» для контроля над всеми гражданами.
Дорогое сообщение миру получилось:
https://etherscan.io/tx/0x5e8bef5dcb69206fa1bacc8d0b0c0204e12f1e45483d12b9f69dc1829ac74315
Справка:
Адрес 0x0....000 (часто называемый «нулевым» или Null) куда отправили деньги – не контролируется никаким пользователем или кошельком, то есть если вы пошлете туда эфир-монеты, они сгорят
_______
Источник | #denissexy
@F_S_C_P
-------
Секретики!
-------
Ethereum (ETH) Blockchain Explorer
Ethereum Transaction Hash (Txhash) Details | Etherscan
Ethereum (ETH) detailed transaction info for txhash 0x5e8bef5dcb69206fa1bacc8d0b0c0204e12f1e45483d12b9f69dc1829ac74315. The transaction status, block confirmation, gas fee, Ether (ETH), and token transfer are shown.