This media is not supported in your browser
VIEW IN TELEGRAM
Как вам уровень генераций современных моделей с ценой в 1$? Хотите проведем тест AI или настоящее? :)
@aihappens
@aihappens
У меня есть курс про GPT: gptcourse.io, на нём обучалось множество компаний разных размеров — от 10 человек до 1000. И я заметил одну интересную закономерность, имеющую много общего с жизнью.
Сначала небольшое отступление: я считаю, что GPT — это технология, которая должна интегрироваться в первую очередь не на уровне процессов, а на уровне обычных людей. Каждый может найти способы разгрузить свою жизнь с её помощью СВОИМ конкретным способом. И то, произойдёт это или нет, по моим наблюдениям, коррелирует с одной простой метрикой: насколько топ-менеджеры вовлечены в процесс. Очень часто я слышу запросы формата "научите моих сотрудников уму-разуму". На логичный вопрос, а последуете ли вы за ними, часто следует ответ: "НЕТ".
Почему я считаю, что это сильно коррелирует с жизнью? Для меня это сродни родителям, которые учат детей не курить, при этом выкуривая пачку в день. Это создаёт асимметрию. Дети проникаются увлечениями, привычками и ценностями тогда, когда их родители когерентны с этими принципами.
А у вас как, лидеры действуют со всеми или отдельно?
@aihappens
Сначала небольшое отступление: я считаю, что GPT — это технология, которая должна интегрироваться в первую очередь не на уровне процессов, а на уровне обычных людей. Каждый может найти способы разгрузить свою жизнь с её помощью СВОИМ конкретным способом. И то, произойдёт это или нет, по моим наблюдениям, коррелирует с одной простой метрикой: насколько топ-менеджеры вовлечены в процесс. Очень часто я слышу запросы формата "научите моих сотрудников уму-разуму". На логичный вопрос, а последуете ли вы за ними, часто следует ответ: "НЕТ".
Почему я считаю, что это сильно коррелирует с жизнью? Для меня это сродни родителям, которые учат детей не курить, при этом выкуривая пачку в день. Это создаёт асимметрию. Дети проникаются увлечениями, привычками и ценностями тогда, когда их родители когерентны с этими принципами.
А у вас как, лидеры действуют со всеми или отдельно?
@aihappens
Мне очень сложно с моими постами. Одни кажутся мне слишком простыми, другие — слишком сложными для чтения. Иногда я думаю, что мои мысли и опыт в среднем бесполезны для людей (зачем знать и думать про проблемы технологических предпринимателей?), а иногда мне кажется, что я пишу слишком скучно. Был момент, когда я делал опрос: "А что вы вообще хотите здесь видеть?"
В последние дни у меня сформировался вывод, который изменил мое отношение. Я веду этот канал не для вас, а для себя. Вам интересно его читать, потому что я пишу о том, что интересно мне. Мне не нужна валидация моих идей, я не хочу зарабатывать деньги на канале. Я хочу рефлексировать здесь, постить мемы, репостить людей, которые мне интересны. Делать все это с глубоким кайфом, делиться такими наблюдениями, как это и не думать "блин, у меня в названии стоит AI, а это не он". Принимать, что какие-то посты будут приводить к оттоку аудитории, а какие-то — набирать сотни репостов. Эта попытка ориентироваться на внешние реакции и приводила к тому, что я бросал писать здесь. Сил не хватало. Посмотрим, насколько меня хватит в этот раз. ❤️
В последние дни у меня сформировался вывод, который изменил мое отношение. Я веду этот канал не для вас, а для себя. Вам интересно его читать, потому что я пишу о том, что интересно мне. Мне не нужна валидация моих идей, я не хочу зарабатывать деньги на канале. Я хочу рефлексировать здесь, постить мемы, репостить людей, которые мне интересны. Делать все это с глубоким кайфом, делиться такими наблюдениями, как это и не думать "блин, у меня в названии стоит AI, а это не он". Принимать, что какие-то посты будут приводить к оттоку аудитории, а какие-то — набирать сотни репостов. Эта попытка ориентироваться на внешние реакции и приводила к тому, что я бросал писать здесь. Сил не хватало. Посмотрим, насколько меня хватит в этот раз. ❤️
Выбирая тему для сегодняшнего поста из папки, выбор стоял между:
1) Презентацией Google с обзорами самых лучших, самых быстрых и самых умных моделей и нового телефона,
2) Рассказом про новую слабоцензурированную LLM от Маска,
3) Обсуждением важной для меня проблемы, которую я пока боюсь обсуждать публично.
Как вы понимаете, обсуждать мы будем пункт 3. Итак, рядом с облаком тегов вокруг моего имени предлагаю добавить новый — «маскулист». Скорее всего, вы не слышали это слово или слышали его в качестве обзывательства от феминисток. Хотя в нём нет ничего плохого — это человек, который борется за права мужчин.
Женщины, любые мои читательницы, перед тем как начать писать мне разные неприятные вещи, прошу дочитать этот пост до конца. К чему я это всё. Последний год ко мне пришло осознание, что в обществе очень часто поднимаются проблемы женщин. Они существуют в нашем сознании, мы пытаемся что-то изменить вокруг нас. Но проблемы мужчин почему-то в это пространство (по крайней мере в моё) практически не попадают. Я пару раз пытался вступать в дебаты вокруг этой темы и понял главную ошибку — я не хочу сравнивать «тяжесть» или «важность» проблем разных полов. Мне кажется, это просто не требуется. Их надо формулировать не вокруг того, «кто виноват», о них не надо спорить, их хочется просто поднимать. И я хочу начать.
Хочу поделиться некоторым количеством статистики:
1) Мужчины совершают самоубийства почти в три раза чаще, чем женщины (по данным Всемирной организации здравоохранения). В РФ в 6 раз.
2) В 2019 году ожидаемая продолжительность жизни у мужчин составляла 73,2 года, что на 5 лет меньше, чем у женщин (78,2 года).
3) Мужчины в два раза чаще страдают алкогольной зависимостью, чем женщины (по данным Национального института по проблемам злоупотребления алкоголем и алкоголизма).
4) Более 90% убийц в мире — это мужчины (по данным ООН).
5) Мужчины в 1,5–2 раза реже обращаются за психологической помощью, чем женщины (по данным NHS).
Как вам? Мне страшно. И, как будто, об этом стоит же говорить, нет? И я повторюсь — мне не нужно противопоставлять этой информации проблемы женщин, пожалуйста. Я не хочу этой информацией влиять на вас. Я лишь хочу, чтобы все люди — и мужчины, и женщины — имели возможность озвучивать свои проблемы. И я считаю, что из-за норм поведения сложившихся в обществе мужчинам нужно помогать говорить, потому что нас учили, что нужно терпеть, нужно тащить, нужно страдать. Ныть нельзя, ты же не нытик. А потом выходить в окно или пропасть в зависимости.
Сил вам, мужики, да пространства где можно поплакать и не чувствовать себя в этом ничтожеством.
@aihappens
1) Презентацией Google с обзорами самых лучших, самых быстрых и самых умных моделей и нового телефона,
2) Рассказом про новую слабоцензурированную LLM от Маска,
3) Обсуждением важной для меня проблемы, которую я пока боюсь обсуждать публично.
Как вы понимаете, обсуждать мы будем пункт 3. Итак, рядом с облаком тегов вокруг моего имени предлагаю добавить новый — «маскулист». Скорее всего, вы не слышали это слово или слышали его в качестве обзывательства от феминисток. Хотя в нём нет ничего плохого — это человек, который борется за права мужчин.
Женщины, любые мои читательницы, перед тем как начать писать мне разные неприятные вещи, прошу дочитать этот пост до конца. К чему я это всё. Последний год ко мне пришло осознание, что в обществе очень часто поднимаются проблемы женщин. Они существуют в нашем сознании, мы пытаемся что-то изменить вокруг нас. Но проблемы мужчин почему-то в это пространство (по крайней мере в моё) практически не попадают. Я пару раз пытался вступать в дебаты вокруг этой темы и понял главную ошибку — я не хочу сравнивать «тяжесть» или «важность» проблем разных полов. Мне кажется, это просто не требуется. Их надо формулировать не вокруг того, «кто виноват», о них не надо спорить, их хочется просто поднимать. И я хочу начать.
Хочу поделиться некоторым количеством статистики:
1) Мужчины совершают самоубийства почти в три раза чаще, чем женщины (по данным Всемирной организации здравоохранения). В РФ в 6 раз.
2) В 2019 году ожидаемая продолжительность жизни у мужчин составляла 73,2 года, что на 5 лет меньше, чем у женщин (78,2 года).
3) Мужчины в два раза чаще страдают алкогольной зависимостью, чем женщины (по данным Национального института по проблемам злоупотребления алкоголем и алкоголизма).
4) Более 90% убийц в мире — это мужчины (по данным ООН).
5) Мужчины в 1,5–2 раза реже обращаются за психологической помощью, чем женщины (по данным NHS).
Как вам? Мне страшно. И, как будто, об этом стоит же говорить, нет? И я повторюсь — мне не нужно противопоставлять этой информации проблемы женщин, пожалуйста. Я не хочу этой информацией влиять на вас. Я лишь хочу, чтобы все люди — и мужчины, и женщины — имели возможность озвучивать свои проблемы. И я считаю, что из-за норм поведения сложившихся в обществе мужчинам нужно помогать говорить, потому что нас учили, что нужно терпеть, нужно тащить, нужно страдать. Ныть нельзя, ты же не нытик. А потом выходить в окно или пропасть в зависимости.
Сил вам, мужики, да пространства где можно поплакать и не чувствовать себя в этом ничтожеством.
@aihappens
Регулярно сталкиваюсь с комментариями в фб о том, что AI — это пузырь, и в отрасли наступила "зима". Решил покопаться в числах и сравнить "классические" бизнесы с компанией OpenAI на фоне текущего рынка. Взял компании, близкие к AI, и добавил супер параметр — Value/Revenue, который показывает, как заработок компании соотносится с её оценкой.
Справочно:
- B — миллиарды
- Revenue — все получаемые деньги
- Market Cap — по какой оценке можно купить долю в компании
Хронология:
- В конце 2022 года оценка компании OpenAI составляла 10B$ (на самом деле меньше, но опустим этот факт).
- Май 2023 года: Revenue — 1.6B$.
- Май 2024 года: Revenue — 3.4B$.
- Market Cap 2024 года — 80B$.
- Value/Revenue ≈ 25 (скорее ближе к 20).
Сравним с рядом стоящими гигантами:
- Meta:
Market Cap — 1.33T
Value/Revenue — 8.76
- Nvidia:
Market Cap — 2.90T
Value/Revenue — 36.16
- Amazon:
Market Cap — 1.79T
Value/Revenue — 3.03
Пу-пу-пууууум. Ну коэффициент высоковат, но учитывая, что это частный бизнес, являющийся топ-1 в индустрии, он не выглядит драматично. Поискал данные по perplexity и Midjourney, там все непонятно. В Midjourney была инфа, что выручка около 200М$, оценки не было, а работает всего 11 человек. А у perplexity 35M$ выручки и 1B$ оценка.
К этому надо добавить, что в текущий момент вся история в LLM/GPT - проходит стадию лишь early adopters, то есть в среднем только 2-3% населения так или иначе используют эти технологии. Посмотрим как на это повлияет Apple, так как Google явно не справляется :)
@aihappens
Справочно:
- B — миллиарды
- Revenue — все получаемые деньги
- Market Cap — по какой оценке можно купить долю в компании
Хронология:
- В конце 2022 года оценка компании OpenAI составляла 10B$ (на самом деле меньше, но опустим этот факт).
- Май 2023 года: Revenue — 1.6B$.
- Май 2024 года: Revenue — 3.4B$.
- Market Cap 2024 года — 80B$.
- Value/Revenue ≈ 25 (скорее ближе к 20).
Сравним с рядом стоящими гигантами:
- Meta:
Market Cap — 1.33T
Value/Revenue — 8.76
- Nvidia:
Market Cap — 2.90T
Value/Revenue — 36.16
- Amazon:
Market Cap — 1.79T
Value/Revenue — 3.03
Пу-пу-пууууум. Ну коэффициент высоковат, но учитывая, что это частный бизнес, являющийся топ-1 в индустрии, он не выглядит драматично. Поискал данные по perplexity и Midjourney, там все непонятно. В Midjourney была инфа, что выручка около 200М$, оценки не было, а работает всего 11 человек. А у perplexity 35M$ выручки и 1B$ оценка.
К этому надо добавить, что в текущий момент вся история в LLM/GPT - проходит стадию лишь early adopters, то есть в среднем только 2-3% населения так или иначе используют эти технологии. Посмотрим как на это повлияет Apple, так как Google явно не справляется :)
@aihappens
Я ненавижу компании, которые злоупотребляют нашим дофамином. Соцсети, рилсы и тиктоки, мобильные игры, маркетплейсы. Особенно мне не нравится, что от них страдает самая незащищённая часть населения — подростки. Недавно было проведено большое исследование, и его краткий вывод таков:
“One of the notable trends we observed was a sharp rise in the rates of anxiety, depression, and stress in adolescents and young adults over the past 20 years. Rates increased by more than two-fold for those aged 16–24, and understanding what is underlying these patterns is of critical importance.”
[Источник]
Но пост будет не про это. Я хочу рассказать про компании, которые через взлом дофаминовой системы как будто ломают проблему моего поколения. И это трекеры, которые следят за вашим здоровьем — часы, браслеты, кольца, матрасы. Чего только нет, но если задуматься, это же просто замещающий способ проявления заботы о себе. И я сам — самый яркий представитель этого. Мне очень сложно нормально спать. У меня сбивается цикл, я сплю по 6 часов, засыпаю с телефоном и ем перед сном. Но как только у меня на руке появляется Whoop или Oura — всё, спать плохо нельзя. У меня будет низкий балл. А у нас в Whoop есть команда менеджеров, и там видно, кто как восстановился. Это вообще жесть. Социальное давление за твой отдых! Очень круто, хоть и хочется научиться давать себе внимание и заботу без этих девайсов, но пока ладно — абьюзьте меня полностью.
@aihappens
“One of the notable trends we observed was a sharp rise in the rates of anxiety, depression, and stress in adolescents and young adults over the past 20 years. Rates increased by more than two-fold for those aged 16–24, and understanding what is underlying these patterns is of critical importance.”
[Источник]
Но пост будет не про это. Я хочу рассказать про компании, которые через взлом дофаминовой системы как будто ломают проблему моего поколения. И это трекеры, которые следят за вашим здоровьем — часы, браслеты, кольца, матрасы. Чего только нет, но если задуматься, это же просто замещающий способ проявления заботы о себе. И я сам — самый яркий представитель этого. Мне очень сложно нормально спать. У меня сбивается цикл, я сплю по 6 часов, засыпаю с телефоном и ем перед сном. Но как только у меня на руке появляется Whoop или Oura — всё, спать плохо нельзя. У меня будет низкий балл. А у нас в Whoop есть команда менеджеров, и там видно, кто как восстановился. Это вообще жесть. Социальное давление за твой отдых! Очень круто, хоть и хочется научиться давать себе внимание и заботу без этих девайсов, но пока ладно — абьюзьте меня полностью.
@aihappens
Заглянул на арену GPT. Если вы там не бываете, но интересуетесь борьбой GPTs - рекомендую заглядывать: [https://chat.lmsys.org/?leaderboard]
Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.
Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).
Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/
И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.
@aihappens
Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.
Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).
Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/
И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.
@aihappens
Повышаем градус лирики. Мне всего 29, но с каждым годом я всё больше ловлю себя на мысли, что кто реально понимает жизнь, так это европейские пенсионеры. Их неторопливый ритм, умение наслаждаться простыми радостями и ценить каждое мгновение — какой-то недостижимый навык, но я замечаю, как всё больше моих событий в жизни и привычек объединяет нас. Наблюдаем вместе:
Моё утро начинается с небольшой растяжки — это какая-то смесь йоги с… зарядкой? Зарядка — это не обязанность, а форма гигиены для моего тела. То, что я в детстве не мог осознать, глядя на пенсионеро.
В последнее время я открыл для себя утренние купания в озере. Каждое утро, около 8:30, я погружаюсь в прохладную воду, чувствуя, как тело сначала замирает, а потом расслабляется. И знаете, кто составляет мне компанию в этом ритуале? Улыбающиеся лица пожилых людей.
Прошлой осенью мы с женой наслаждались видами Тосканы из окна старинного отеля. Рядом с нами сидели одни лишь пожилые пары, неспешно потягивая вино, наслаждаясь бесконечными разговорами.
А ещё я открываю для себя мир ферментированной пищи. Квашенной капусточки хотите? Как сказала бы любая из моих бабушек, это настоящее сокровище для здоровья. И знаете что? Они были абсолютно правы.
А знаете, кому я раньше завидовал больше всех на Чистых Прудах? Каждые выходные я наблюдал, как седовласые стратеги склоняются над шахматными досками. Я бы хотел поиграть с ними, но воли «вписаться» мне так и не хватило.
И, пожалуй, самое странное, что объединяет меня с европейскими пенсионерами, — это искусство путешествовать вне сезона. Мы с женой планируем наши поездки на те месяцы, когда схлынул поток туристов, так как нас, как и их, мало что ограничивает. Нет школьных сезонов, нет жёстких отпусков. Кто бы мог подумать, что в 29 лет я буду черпать вдохновение у тех, кто прожил в два, а то и в три раза больше меня?
Моё утро начинается с небольшой растяжки — это какая-то смесь йоги с… зарядкой? Зарядка — это не обязанность, а форма гигиены для моего тела. То, что я в детстве не мог осознать, глядя на пенсионеро.
В последнее время я открыл для себя утренние купания в озере. Каждое утро, около 8:30, я погружаюсь в прохладную воду, чувствуя, как тело сначала замирает, а потом расслабляется. И знаете, кто составляет мне компанию в этом ритуале? Улыбающиеся лица пожилых людей.
Прошлой осенью мы с женой наслаждались видами Тосканы из окна старинного отеля. Рядом с нами сидели одни лишь пожилые пары, неспешно потягивая вино, наслаждаясь бесконечными разговорами.
А ещё я открываю для себя мир ферментированной пищи. Квашенной капусточки хотите? Как сказала бы любая из моих бабушек, это настоящее сокровище для здоровья. И знаете что? Они были абсолютно правы.
А знаете, кому я раньше завидовал больше всех на Чистых Прудах? Каждые выходные я наблюдал, как седовласые стратеги склоняются над шахматными досками. Я бы хотел поиграть с ними, но воли «вписаться» мне так и не хватило.
И, пожалуй, самое странное, что объединяет меня с европейскими пенсионерами, — это искусство путешествовать вне сезона. Мы с женой планируем наши поездки на те месяцы, когда схлынул поток туристов, так как нас, как и их, мало что ограничивает. Нет школьных сезонов, нет жёстких отпусков. Кто бы мог подумать, что в 29 лет я буду черпать вдохновение у тех, кто прожил в два, а то и в три раза больше меня?
Крееейзи стартап! Reflect Orbital (reflectorbital.com/)
Ребята делают рефлексию солнечного света через спутники. Вроде бы на этом этапе всё ок, но прикол в том, что ты можешь "вызвать" его себе домой через специальное приложение. Хочешь немного солнечного света на вечеринке и жестко зажечь на танцполе? В конце 2025 года сможешь. Как "запретить" светить в окно соседу только не понятно)
Не одним AI едины.
@aihappens
Ребята делают рефлексию солнечного света через спутники. Вроде бы на этом этапе всё ок, но прикол в том, что ты можешь "вызвать" его себе домой через специальное приложение. Хочешь немного солнечного света на вечеринке и жестко зажечь на танцполе? В конце 2025 года сможешь. Как "запретить" светить в окно соседу только не понятно)
Не одним AI едины.
@aihappens
вышло интервью с @zapiskiceo
https://youtu.be/iwaK6pm95Zw?si=tOLlaXygJbLvXsgJ
давно не участвовал в интервью про жизнь. Если вам интересно как я нынче - там много про это. Доброе и теплое интервью, без сложных щей.
https://youtu.be/iwaK6pm95Zw?si=tOLlaXygJbLvXsgJ
давно не участвовал в интервью про жизнь. Если вам интересно как я нынче - там много про это. Доброе и теплое интервью, без сложных щей.
YouTube
«Я хотел бы построить свое государство». Леша Хахунов — про эмоциональный интеллект и нейросети
Сегодня в гостях Леша Хахунов — основатель Maslov.ai, Dbrain и человек, знающий все про Chat GPT. Но мы поговорим не только об этом, в выпуске много про пользу психотерапии, про теорию субличностей и про то, как найти гармонию и не терять любопытство. Надеюсь…
Я часто оказываюсь в ситуации, когда качаюсь на качелях - я бездельем и я трудоголик. Мне не верится, что есть люди, которые долгосрочно работают 60+ часов в неделю эффективно. (хотя такие заявления я часто слышу).
В следующем месяце я хочу попробовать понять, сколько времени я действительно активно работаю, а сколько провожу, отвлекаясь на YouTube, книги, еду и другие вещи, с помощью трекеров. Моя цель не максимизировать их - а просто понять и успокомиться. Пока я размышлял об этом, решил узнать, как вы оцениваете свои 'эффективные' часы работы. Попробуйте ответить честно, ваш работодатель (даже если это я) не узнает.
В следующем месяце я хочу попробовать понять, сколько времени я действительно активно работаю, а сколько провожу, отвлекаясь на YouTube, книги, еду и другие вещи, с помощью трекеров. Моя цель не максимизировать их - а просто понять и успокомиться. Пока я размышлял об этом, решил узнать, как вы оцениваете свои 'эффективные' часы работы. Попробуйте ответить честно, ваш работодатель (даже если это я) не узнает.
Аааааааааааа, я писал пост с телефона и он пропал! Как я зол…
тогда будет короткий пост - Илья Суцкевер (тот что почти выгнал Сэма, тот что потом выгнал Илью) поднял 1B в компанию SSI - safe super intelligence. Может ли компания с безопасным интеллектом рыночно конкурировать с небезопасным ? Вопрос. Даст ли это что-то нам как пользователям? Скорее всего нет. Нужен ли вообще безопасный интеллект? 😬 Много ли в современных мерках 1B для LLM? 🥲
Но Илья очень упертый и очень принципный, такие люди восхищают. А к тому же бесконечно талантливый. Удачи спустить все деньги на вычисления )
@aihappens
тогда будет короткий пост - Илья Суцкевер (тот что почти выгнал Сэма, тот что потом выгнал Илью) поднял 1B в компанию SSI - safe super intelligence. Может ли компания с безопасным интеллектом рыночно конкурировать с небезопасным ? Вопрос. Даст ли это что-то нам как пользователям? Скорее всего нет. Нужен ли вообще безопасный интеллект? 😬 Много ли в современных мерках 1B для LLM? 🥲
Но Илья очень упертый и очень принципный, такие люди восхищают. А к тому же бесконечно талантливый. Удачи спустить все деньги на вычисления )
@aihappens
Простите, был занят поездкой на чемпионат по Доте в Копенгагене и не рассказал вам про новую модель от OpenAI — O1.
Начнем с простого — нейминг сновав говне ужасный. (Найдите разницу — 4о и O1. Дальше предлагаю модель О_о назвать ☺️.)
Теперь по существу. Что вообще изменилось в модели?
По сути, они реализуют механики, которые всегда советуют для получения крутых ответов на сложные вопросы: разбивка задачи на этапы, продумывание и критика решений на этих этапах. Всё это можно было делать и раньше, но никто в здравом уме в повседневной жизни так не писал промпты. Сейчас это будет удобной опцией, ну и собственно, отличие в том, что модель за вас продумывает эти шаги между этапами.
Почему метрики у модели на обычных задачах почти не выросли?
Потому что во всех бенчмарках модели и так запускались в режимах CoT ( и т. д., что значит, что это делали вручную исследователи — запускали модели 20 раз, заставляя рассуждать и давая примеры решений аналогичных задач.) Но ситуация абсолютно иная на логических задачах — там, где люди всегда хихикали над задачами на образное мышление или скрытые смыслы. Хлобысь — и модель уже на уровне олимпиадников по математике в этих задачах. Это подтверждается интересным тестом с картинки, где модель проходит тесты на IQ. (Для справки, тесты на IQ построены так, что 100 = медиана среди всех людей.)
Повлияет ли это на обычных пользователей?
Почти уверен, что нет. Это релиз, в моем понимании, направленный на исследователей в широком смысле этого слова. У них появился шанс с большей вероятностью найти идеи для решения своей задачи в голове GPT.
@aihappens
Начнем с простого — нейминг снова
Теперь по существу. Что вообще изменилось в модели?
По сути, они реализуют механики, которые всегда советуют для получения крутых ответов на сложные вопросы: разбивка задачи на этапы, продумывание и критика решений на этих этапах. Всё это можно было делать и раньше, но никто в здравом уме в повседневной жизни так не писал промпты. Сейчас это будет удобной опцией, ну и собственно, отличие в том, что модель за вас продумывает эти шаги между этапами.
Почему метрики у модели на обычных задачах почти не выросли?
Потому что во всех бенчмарках модели и так запускались в режимах CoT ( и т. д., что значит, что это делали вручную исследователи — запускали модели 20 раз, заставляя рассуждать и давая примеры решений аналогичных задач.) Но ситуация абсолютно иная на логических задачах — там, где люди всегда хихикали над задачами на образное мышление или скрытые смыслы. Хлобысь — и модель уже на уровне олимпиадников по математике в этих задачах. Это подтверждается интересным тестом с картинки, где модель проходит тесты на IQ. (Для справки, тесты на IQ построены так, что 100 = медиана среди всех людей.)
Повлияет ли это на обычных пользователей?
Почти уверен, что нет. Это релиз, в моем понимании, направленный на исследователей в широком смысле этого слова. У них появился шанс с большей вероятностью найти идеи для решения своей задачи в голове GPT.
@aihappens
я мечтаю писать подкасты регулярно. мне кажется это один из самых емких форматов и каждая встреча с Димой обычно заканчивается им, куда мы выливаем все, что собралось за последние разговоры. мы решили начать с 0 и из 4х предыдущих сделать один, но жирный:
https://www.youtube.com/watch?v=cl1329joER4
когда мы его писали на выходе осталось приятно чувство наслаждения, жаль с записи прошло время и совсем свежие новости туда не попали.
https://www.youtube.com/watch?v=cl1329joER4
когда мы его писали на выходе осталось приятно чувство наслаждения, жаль с записи прошло время и совсем свежие новости туда не попали.
YouTube
Искусственный интеллект: объясняем сложные вещи простыми словами
Приветик!
Мы, Димы Мацкевич и Лёша Хахунов, продолжаем записывать подкасты про искусственный интеллект, четвёртую индустриальную революцию, разбирать сложные вопросы простым языком. Раньше все выпуски выходили на канале Димы, но мы решили для AI сделать…
Мы, Димы Мацкевич и Лёша Хахунов, продолжаем записывать подкасты про искусственный интеллект, четвёртую индустриальную революцию, разбирать сложные вопросы простым языком. Раньше все выпуски выходили на канале Димы, но мы решили для AI сделать…
помните, как я писал о новой модели о1 - Preview, когда она только вышла? Тогда я думал, что изменения затронут в основном только специфичные роли. Как же я ошибался!
Эта модель — настоящий геймчейнджер для меня в плане решения сложных задач. Теперь я вижу, как большие сложные блоки, особенно стратегические, где нужно хорошее описание, решаются совершенно по-другому. Серьезно, с 2-3 итераций в диалоге получается достичь офигенных результатов. Раньше тратил оч много времени на промпты/роли и тд. Сейчас просто пишу 15 минут голосовые и пихаю туда.
Огромный плюс — это большое окно контекста. Я могу бесконечно уточнять в одном чате, не создавая новые треды. Раньше приходилось дробить обсуждение на несколько чатов, чтобы сохранить контекст. Теперь всё в одном месте — и это просто бомба!
Фанфакт: теперь можно посмотреть цепочку рассуждений модели. И когда я туда заглядываю, вижу, что она думает то на русском, то на английском, то на украинском, то на китайском! Выглядит очень забавно.
Кстати, разработчики спрятали эту модель так неудобно, что большинство из нас даже не заметили её. Даже активные пользователи GPT, которых я спросил не видели ее, хотя знают, что она выходила. Поэтому, вот мой экшен: Включаем новую модель, берём самую сложную задачу прошлой недели - тестируем. Ты будешь приятно удивлен!
@aihappens
Эта модель — настоящий геймчейнджер для меня в плане решения сложных задач. Теперь я вижу, как большие сложные блоки, особенно стратегические, где нужно хорошее описание, решаются совершенно по-другому. Серьезно, с 2-3 итераций в диалоге получается достичь офигенных результатов. Раньше тратил оч много времени на промпты/роли и тд. Сейчас просто пишу 15 минут голосовые и пихаю туда.
Огромный плюс — это большое окно контекста. Я могу бесконечно уточнять в одном чате, не создавая новые треды. Раньше приходилось дробить обсуждение на несколько чатов, чтобы сохранить контекст. Теперь всё в одном месте — и это просто бомба!
Фанфакт: теперь можно посмотреть цепочку рассуждений модели. И когда я туда заглядываю, вижу, что она думает то на русском, то на английском, то на украинском, то на китайском! Выглядит очень забавно.
Кстати, разработчики спрятали эту модель так неудобно, что большинство из нас даже не заметили её. Даже активные пользователи GPT, которых я спросил не видели ее, хотя знают, что она выходила. Поэтому, вот мой экшен: Включаем новую модель, берём самую сложную задачу прошлой недели - тестируем. Ты будешь приятно удивлен!
@aihappens
Forwarded from GCONF / GPT lovers / Всё про ИИ
This media is not supported in your browser
VIEW IN TELEGRAM
Как ИИ и AGI изменит нашу жизнь?
Безработица и хаос? Или свобода и творчество?
Некоторые из нас с тревогой смотрят в будущее. И это понятно — технологии, такие как AGI, могут полностью изменить наш привычный образ жизни.
Что будет с работой, изменится ли рынок труда, сможем ли мы адаптироваться к этим переменам?
В новом выпуске подкаста Лёша и Дима обсуждают, как CEO Anthropic Дарио Амодеи и CEO OpenAI Сэм Альтман представляют будущее с AGI.
Дарио и Сэм уверены, что технологии сделают жизнь проще и откроют новые возможности.
Но что стоит за этим оптимизмом? Почему так мало говорят о тех, кто может оказаться в стороне?
Лёша и Дима делятся мыслями о вызовах, которые могут встать перед нами, и о том, как быть готовыми к этим переменам.
Ниже ссылки на эссе Дарио и Сэма и на наш подкаст:
→ Читать эссе Дарио Амодеи Anthropic
→ Читать эссе Сэма Альтмана OpenAI
→ Смотреть подкаст с Лешей и Димой
А что думаете вы? Готово ли общество к таким изменениям?
Безработица и хаос? Или свобода и творчество?
Некоторые из нас с тревогой смотрят в будущее. И это понятно — технологии, такие как AGI, могут полностью изменить наш привычный образ жизни.
Что будет с работой, изменится ли рынок труда, сможем ли мы адаптироваться к этим переменам?
В новом выпуске подкаста Лёша и Дима обсуждают, как CEO Anthropic Дарио Амодеи и CEO OpenAI Сэм Альтман представляют будущее с AGI.
Дарио и Сэм уверены, что технологии сделают жизнь проще и откроют новые возможности.
Но что стоит за этим оптимизмом? Почему так мало говорят о тех, кто может оказаться в стороне?
Лёша и Дима делятся мыслями о вызовах, которые могут встать перед нами, и о том, как быть готовыми к этим переменам.
Ниже ссылки на эссе Дарио и Сэма и на наш подкаст:
→ Читать эссе Дарио Амодеи Anthropic
→ Читать эссе Сэма Альтмана OpenAI
→ Смотреть подкаст с Лешей и Димой
А что думаете вы? Готово ли общество к таким изменениям?
Ребята, это пиздец. То есть если я уже решил написать что-то в канал, значит точно случилось что-то существенное. Вчера, пока летел в самолёте, у меня наконец дошли руки попробовать Deep Research от ChatGPT. Вы можете спросить: «А что это за Deep Research такой?» Но я, в свою очередь, хочу понять, почему меня за последние две недели 200 раз спросили про DeepSeek — китайскую модель, которая никому особо не нужна, — в то время как почти никто не говорит про взрывающую мозг новую фишку от ChatGPT.
Итак, что такое Deep Research? Это экспериментальная функция, которая позволяет чат-боту проводить многошаговые исследования в интернете и собирать аналитические отчёты. На практике это выглядит так: ты пишешь запрос модели, она уточняет детали, которые ей нужны, потом думает, и в конце выдаёт очень крутой результат. Я протестировал её на сборе инфы о конкурентах и реально узнал, во-первых, о куче компаний, о которых раньше даже не слышал, а во-вторых, она нашла про них тонну технического контекста из их блогов и даже ссылается на патентное бюро. Словом, агрегирует просто громадный объём данных. Я потом взял несколько компаний и отдельно их проверил вручную — всё, что модель собрала, оказалось абсолютно корректным.
Да, чтобы вы понимали, я один из тех, кто платит OpenAI 200 баксов в месяц, поэтому, возможно, у большинства из вас пока нет доступа к этой фиче, но, как я понимаю, это скоро изменится. Deep Research — это классическая агентная система, где модель сама выбирает, что она будет делать дальше: идёт в интернет, читает статьи — у неё нет какого-то жёстко запрограммированного алгоритма. Для меня это выглядит очень интересно, потому что, в отличие от прошлых версий, модель действительно показывает свои рассуждения, и ниже я вам приведу несколько примеров, как она это делает
1. Модель описывает азарт в процессе работе, вида "О, интересно, а что бы это могло значить? надо изучить!"
2. Нетерпение к ограничивающим факторам вида пейволы или логины.
3. Присутствие сомнений и критического мышления - "Интересно, но нужно проверить другие источники"
4. Чувство удовлетворения от находок.
Это мило ❤️
В целом, мне кажется, что Deep Research — это огромный шаг к тому, что люди часто хотят от AI-ассистентов: чтобы они не просто решали какую-то задачку, а реально зарывались в тему, доставали информацию, шерстили кучу сайтов. Эта функция уже умеет делать именно то, за чем многие обращаются к ИИ - думать и анализировать за них.
Вообще мне тут недавно исполнилось 30, поставьте мне реакций под пост и может разберемся с тем, почему DeepSeek это просто хайп. А еще у меня есть 7 недописанных постов в канал, пора бы уже разобрать бэклог.
@aihappens
Итак, что такое Deep Research? Это экспериментальная функция, которая позволяет чат-боту проводить многошаговые исследования в интернете и собирать аналитические отчёты. На практике это выглядит так: ты пишешь запрос модели, она уточняет детали, которые ей нужны, потом думает, и в конце выдаёт очень крутой результат. Я протестировал её на сборе инфы о конкурентах и реально узнал, во-первых, о куче компаний, о которых раньше даже не слышал, а во-вторых, она нашла про них тонну технического контекста из их блогов и даже ссылается на патентное бюро. Словом, агрегирует просто громадный объём данных. Я потом взял несколько компаний и отдельно их проверил вручную — всё, что модель собрала, оказалось абсолютно корректным.
Да, чтобы вы понимали, я один из тех, кто платит OpenAI 200 баксов в месяц, поэтому, возможно, у большинства из вас пока нет доступа к этой фиче, но, как я понимаю, это скоро изменится. Deep Research — это классическая агентная система, где модель сама выбирает, что она будет делать дальше: идёт в интернет, читает статьи — у неё нет какого-то жёстко запрограммированного алгоритма. Для меня это выглядит очень интересно, потому что, в отличие от прошлых версий, модель действительно показывает свои рассуждения, и ниже я вам приведу несколько примеров, как она это делает
1. Модель описывает азарт в процессе работе, вида "О, интересно, а что бы это могло значить? надо изучить!"
2. Нетерпение к ограничивающим факторам вида пейволы или логины.
3. Присутствие сомнений и критического мышления - "Интересно, но нужно проверить другие источники"
4. Чувство удовлетворения от находок.
Это мило ❤️
В целом, мне кажется, что Deep Research — это огромный шаг к тому, что люди часто хотят от AI-ассистентов: чтобы они не просто решали какую-то задачку, а реально зарывались в тему, доставали информацию, шерстили кучу сайтов. Эта функция уже умеет делать именно то, за чем многие обращаются к ИИ - думать и анализировать за них.
Вообще мне тут недавно исполнилось 30, поставьте мне реакций под пост и может разберемся с тем, почему DeepSeek это просто хайп. А еще у меня есть 7 недописанных постов в канал, пора бы уже разобрать бэклог.
@aihappens