[Перевод] Я 8 часов тестировал модель o1 Pro за 200$ и сравнил ее с Claude Sonnet 3.5 за 20$
После всей шумихи вокруг выхода o1 Pro я решил провести обширное сравнение. Результаты оказались неожиданными, и я решил поделиться своими выводами с сообществом.
Методология тестирования
Я проверил обе модели в идентичных сценариях, ориентируясь на реальные приложения, а не просто на бенчмарки. Каждое испытание повторялось несколько раз, чтобы обеспечить согласованность. Читать далее
#chatgpt #gpt_o1 #gpt_o1_pro #chatgpt_o1 #claude | @habr_ai
После всей шумихи вокруг выхода o1 Pro я решил провести обширное сравнение. Результаты оказались неожиданными, и я решил поделиться своими выводами с сообществом.
Методология тестирования
Я проверил обе модели в идентичных сценариях, ориентируясь на реальные приложения, а не просто на бенчмарки. Каждое испытание повторялось несколько раз, чтобы обеспечить согласованность. Читать далее
#chatgpt #gpt_o1 #gpt_o1_pro #chatgpt_o1 #claude | @habr_ai
Хабр
Я 8 часов тестировал модель o1 Pro за 200$ и сравнил ее с Claude Sonnet 3.5 за 20$
После всей шумихи вокруг выхода o1 Pro я решил провести обширное сравнение. Результаты оказались неожиданными, и я решил поделиться своими выводами с сообществом. Методология тестирования Я проверил...
LLM против детских вопросов: смотрим, как GPT o1, QwenLM и DeepSeek справятся с детскими задачами
Как часто сейчас в ИТ сообществе можно услышать про невероятные успехи LLM моделей? ИИ написал диссертацию за 30 минут, ИИ пишет программы на уровне middle разработчика, ИИ диагностирует болезнь с точностью 99.99999% и много много других впечатляющих заголовков пестрят на сотнях сайтов. И это не говоря о том, что создатели таких ИИ моделей заявляют, что через 2-3 года ИИ станет умнее человека чуть ли не в каждой сфере жизни.
А так ли это? Давайте поищем парочку не совсем хитрых, но интересных задач, с которыми может справиться даже ребенок (немного подумав, конечно), но не может справиться современный ИИ.
Ознакомиться
#ии #openai #chatgpt #gpt_o1 #искусственный_интеллект #qwen #deepseek #сравнение #нейросети | @habr_ai
Как часто сейчас в ИТ сообществе можно услышать про невероятные успехи LLM моделей? ИИ написал диссертацию за 30 минут, ИИ пишет программы на уровне middle разработчика, ИИ диагностирует болезнь с точностью 99.99999% и много много других впечатляющих заголовков пестрят на сотнях сайтов. И это не говоря о том, что создатели таких ИИ моделей заявляют, что через 2-3 года ИИ станет умнее человека чуть ли не в каждой сфере жизни.
А так ли это? Давайте поищем парочку не совсем хитрых, но интересных задач, с которыми может справиться даже ребенок (немного подумав, конечно), но не может справиться современный ИИ.
Ознакомиться
#ии #openai #chatgpt #gpt_o1 #искусственный_интеллект #qwen #deepseek #сравнение #нейросети | @habr_ai
Хабр
LLM против детских вопросов: смотрим, как GPT o1, QwenLM и DeepSeek справятся с детскими задачами
Как часто сейчас в ИТ сообществе можно услышать про невероятные успехи LLM моделей? ИИ написал диссертацию за 30 минут, ИИ пишет программы на уровне middle разработчика, ИИ диагностирует болезнь с...
Виртуальные ассистенты: обзор самых «умных» нейросетей для ответов на вопросы
Ни для кого не секрет, что спрос на AI-ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют в копирайтинге, в бизнесе, ими пользуются программисты, у них ищут спасения студенты и школьники, когда материал непонятен или когда огромный текст нужен срочно, — словом, эти виртуальные помощники плотно вошли в нашу повседневную жизнь. Ну а в современной повседневной жизни новые вопросы возникают порой быстрее, чем мы успеваем найти верный и полный ответ на предыдущие, и было бы прекрасно знать, какие же нейросети наиболее умные, чтобы использовать их для ответов на вопросы, согласитесь.
И сегодня мы с вами сравним 7 нейросетей и выделим из них топ-3. Читать далее
#нейросети #промты #deepseek_r1 #сравнение #gpt_o1 #grok_3 #llama_4 #claude_opus_4 #perplexity_ai #gigachat_2_0 | @habr_ai
Ни для кого не секрет, что спрос на AI-ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют в копирайтинге, в бизнесе, ими пользуются программисты, у них ищут спасения студенты и школьники, когда материал непонятен или когда огромный текст нужен срочно, — словом, эти виртуальные помощники плотно вошли в нашу повседневную жизнь. Ну а в современной повседневной жизни новые вопросы возникают порой быстрее, чем мы успеваем найти верный и полный ответ на предыдущие, и было бы прекрасно знать, какие же нейросети наиболее умные, чтобы использовать их для ответов на вопросы, согласитесь.
И сегодня мы с вами сравним 7 нейросетей и выделим из них топ-3. Читать далее
#нейросети #промты #deepseek_r1 #сравнение #gpt_o1 #grok_3 #llama_4 #claude_opus_4 #perplexity_ai #gigachat_2_0 | @habr_ai
Хабр
Виртуальные ассистенты: обзор самых «умных» нейросетей для ответов на вопросы
Ни для кого не секрет, что спрос на AI‑ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют...