Ще одна важлива новина останніх днів, на яку потрібно звернути увагу в контексті "шлях до AGI" - це вихід ARC-AGI-3.
Це вже третя версія одного з найсуворіших бенчмарків, який починає тестувати AI як дорослу мислячу сутність, а не просто як суперкомп'ютер з хорошою пам'яттю.
У чому головна проблема сучасних LLM? Вони натреновані на всьому інтернеті.
Коли ви даєте їм задачу, вони часто не вирішують її, а просто згадують схожий паттерн.
Але варто дати щось, чого не було в навчальних даних - і система ламається.
ARC-AGI-3 змінює цю парадигму.
Перші його версії були статичними головоломками.
Першу (V1) моделі проходили 5 років, другу (V2) - менше року. Третя версія (ось ця) - це зовсім інший рівень.
135+ міні-ігор без інструкцій. Моделі не кажуть, що робити. Вона опиняється в середовищі, де треба самостійно тикати інтерфейс, рухати предмети й тиснути кнопки.
Тепер вимірюють не правильну відповідь, а швидкість навчання.
Як швидко агент розуміє логіку світу? Скільки спроб йому потрібно? Як він змінює стратегію після помилки?
Цей бенчмарк фіксує фундаментальний зсув. Ми переходимо від оцінки моделей як просунутого автокомпліту, що вгадує слова, до оцінки AI як систем, здатних до реального мислення.
Задачі в ARC-AGI-3 побудовані так, що їх неможливо зазубрити - їх можна тільки зрозуміти, виявивши логіку в процесі взаємодії.
Це і є той самий шлях до AGI, коли машина не просто відтворює знання, а проявляє гнучкість інтелекту в умовах повної невідомості. Що цікаво, усі ці задачі легко вирішують люди, але для AI це поки важко.
Кому цікаво, можете випробувати свій людський інтелект :) three.arcprize.org
А тут, документація для тих, хто хоче натравити свого агента на цей виклик: docs.arcprize.org
#news
#thoughts
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔4❤2🔥1
Forwarded from Ооо нейромережеве🐱
Media is too big
VIEW IN TELEGRAM
Якщо коротко, то це дейтинг шоу, але замість людей — LLMки, які вжилися у різні ролі. Дуже угарно слухати вимоги ШІ до майбутнього партнера типу «щоб у нього було велике контекстне вікно»
ооо нейромережеве | Монобаза
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8❤2⚡1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Ви напевно вже бачили цю новину - лідер ринку AI-музики, сервіс Suno, викатив оновлення моделі до версії 5.5.
Окрім традиційного покращення всього, розробники завезли кіллер фічу, на яку мабуть всі чекали - Persona.
Це можливість створити цифрову копію власного (або чийогось) голосу і змусити модель співати саме ним.
Щоб заюзати голос, Suno просить його підтвердити. Процес поки сирий, бо верифікація часто злітає.
І тут цікаво, чи будуть вони блокувати голоси світових зірок на рівні розпізнавання? Бо поки що виглядає так, що для україномовного чи російськомовного контенту настає ера розквіту каверів.
Сумніваюся, що алгоритми Suno впізнають тембр Вакарчука, Монатіка чи умовного Моргенштерна.
Бо якщо так подумати, то голоси для тестів можна позичати з інтерв’ю на YouTube
Прикольні кейси використання про які пишуть в мережі:
1/ Кейс для батьків: можна згенерувати колискову, яку AI співатиме вашим голосом.
2/ Кейс для кріейторів: створення авторських треків зі своїм вокалом, навіть якщо ви не вмієте потрапляти в ноти - нейронка все витягне. Хто мріяв стати співаком - технології дають вам цей шанс :)
Інструмент дійсно якісний і виводить генеративну музику на новий рівень.
#tools
#news
#thoughts
#fun
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10⚡4😁4🤔1🤡1
Щоб зрозуміти, що відбулося в Сан-Франциско, варто на мить повернутися в Англію початку 19 століття.
Хто такі луддити?
Це був рух текстильних робітників, які в 1811 році почали масово нищити ткацькі верстати. Їхнім ідейним лідером вважався (можливо, вигаданий) Нед Лудд. Попри поширений міф, вони не були тупими фанатиками, які боялися прогресу. Вони боялися за свої робочі місця, зниження якості товарів та безконтрольну владу власників фабрик. Луддизм став першою масштабною реакцією людства на промислову революцію.
Сьогодні ми бачимо народження неолуддизму, але тепер об’єктом страху є не механічний станок, а алгоритми OpenAI чи Anthropic.
Минулого тижня, 21-22 березня, у Сан-Франциско відбувся перший протест в історії США за безпеку AI. Його організував активіст Мікаель Трацці, засновник ініціативи Stop the AI Race.
Близько 200 дослідників, академіків та активістів пройшли символічним маршрутом: від штаб-квартири Anthropic до офісів OpenAI та xAI.
Їхня головна вимога - умовна пауза (Conditional Pause).
Трацці та його прибічники закликають лідерів ринку (Альмана, Амодеї та Маска) публічно пообіцяти:
"Ми зупинимо розробку потужніших систем, якщо всі інші ключові гравці погодяться зробити те саме".
Це назвали як спробу розірвати дилему в’язня в гонці AI, де кожна компанія змушена бігти швидше за інших, часто нехтуючи заходами безпеки, щоб просто не залишитися позаду.
Може здатися, що такі протести гальмують розвиток, але насправді це один із найчіткіших маркерів того, наскільки потужним стає AI. Кількість людей на вулицях - це прямий показник впливу технології на суспільство. Чим сильнішим ставатиме AI, тим гучнішими будуть голоси тих, хто вимагає контролю.
Далі таких протестів буде більше.
#news
#thoughts
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🤔7🤷♀1👍1😁1
Лютий клікбейтний заголовок :D
Ви мабуть думаєте, що за чергову дічь знайшов Сергій??
але паралелі глибші, ніж здається. Надмірне захоплення обома "інструментами" може призвести до серйозних когнітивних проблем.
Компанія Anthropic опублікувала масштабне дослідження (опитали понад 80 000 людей):
17% респондентів серйозно стурбовані когнітивною атрофією через постійне використання AI. Студенти та викладачі дедалі частіше відзначають, що AI допомагає вчитися, але ціна цьому - поступова втрата здатності думати самостійно.
Деж тут аналогія з канабісом, спитаєте ви..
Гарвардська медична школа ще у 2022 році цитувала дослідження, яке показало, що у тих, хто прям довго та системно вживав марихуану, рівень IQ знизився в середньому на 5,5%, а швидкість обробки інформації відчутно впала.
Виходить, ми будуємо світ продуктивних гвинтиків. Бізнесу зазвичай не потрібен геніальний код чи літературний шедевр - йому потрібен нормальний результат тут і зараз.
AI ідеально закриває цей запит, генеруючи високоякісну середнячковість. Ми стаємо ефективнішими як виконавці, але слабшими як мислителі.
Використовуйте AI як підсилювач, а не як заміну власному мозку.
Не дайте своїм нейронам атрофуватися. 🫡
#fun
#thoughts
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14❤4😭2
Forwarded from Думки, про які ніхто не питав
Національну LLM назвали "Сяйво".
Я щіро не розумію, навіщо робити національну LLM, і де її використовувати, а головне - для чого робити свою.
Ну але - є, тай добре.
Я щіро не розумію, навіщо робити національну LLM, і де її використовувати, а головне - для чого робити свою.
Ну але - є, тай добре.
👍11😁6⚡2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic додали функцію computer use прямо в Claude Code.
Це сильно змінює правила гри для розробки нативних додатків.
Якщо раніше Клод міг взаємодіяти лише з вебом через Chrome, то тепер він отримав доступ до всієї системи (поки що тільки macOS).
Він може:
1/ Відкривати будь-які застосунки.
2/ Друкувати текст та робити скріншоти.
3/ Керувати всім процесом через CLI, не перемикаючись на десктоп.
Як на мій погляд тепер виглядає автономний цикл розробки:
Клод пише код -> сам його компілює -> запускає готовий додаток -> проклікує інтерфейс -> знаходить баг -> фіксить його -> перевіряє результат.
І все це - з мінімальним залученням людини
Доступ дали тим, у кого підписка Pro або Max.
І поки тільки для macOS.
Активація фічі у терміналі через /mcp -> увімкнути сервер computer-use.
#tools
#news
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Здається, я знайшов ідеальний спосіб вигоріти ще швидше :)
В Steam з'явився Data Center - симулятор сисадміна, де доведеться будувати мережі з нуля.
Все як у житті! збираєш стійки, займаєшся кабель-
Прикольно, що зробили ну просто залізну деталізацію!
Це не просто клікер. Треба розуміти, куди що вставити, як воно охолоджується і чому ця залізяка раптом не бачить мережу.
Тут можна покласти сервер чи коротнути фазу, і тобі за це не відірвуть
Кому точно варто зацінити?
1/ Сисадмінам, мережевикам та і всім іншим інженерам.. щоб нарешті побудувати серверну своєї мрії без обмежень по бюджету та без дивних запитів від менеджерів.
2/ Студентам та джунам. це ледь не найкращий інтерактивний підручник. Краще один раз зібрати стійку в грі, ніж вперше побачити її в полі і не знати, з якого боку підійти.
3/ Та і просто усім тех задротам. ну реально, цеж топ
- Посилання на Data Center
А якщо вам таке заходить, то ось ще вам підгон!
Симулятор ПК збірки!
Там теж все максимально деталізовано. Розширюйте свої знання
- Посилання на PC Building Simulator
#recommend
#fun
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡9❤3🥴3
This media is not supported in your browser
VIEW IN TELEGRAM
Андрій Карпати - людина, до чиїх слів варто прислухатися. Співзасновник OpenAI, ексдиректор з питань AI в Tesla та один із найвпливовіших інженерів сучасності - озвучив те, про що інші бояться сказати вголос.. те, про що ми говоримо в цьому каналі :)
Нам приємно думати, що наша роль з AI - це роль партнерів чи роль господарів.
Карпати впевнений, що у майбутньому люди стануть лише актуаторами (виконавчими механізмами) та датчиками для штучного інтелекту.
Головні тези його бачення:
1/ Ми більше не процесор.
У будь-якій системі рішення приймає процесор. Датчики збирають дані, а приводи виконують дії. Система не питає поради у своїх приводів - вона ними керує. У новій ієрархії AI - це мозок, а ми - лише руки й очі.
2/ Ляльковод і маріонетки.
Карпати каже: "Інтелект керуватиме нами, як ляльковод маріонетками". Ми станемо біологічним шаром, який дозволяє машині взаємодіяти з фізичним світом. Ми сприймаємо те, чого вона не бачить, і рухаємо те, чого вона не може торкнутися.
3/ Суспільство для машини.
Це не AI буде адаптуватися до наших потреб. Це людство вже починає перебудовуватися, щоб задовольняти потреби машини. Ми стаємо нервовою системою для чогось значно більшого, що вже не потребує нашої оцінки чи суджень.
Це не сценарій науково-фантастичного фільму жахів. Це опис конструкції світу, який будується просто зараз.
Більшість людей досі чекають, коли AI стане зручним інструментом у їхніх руках. Але вони пропустять момент, коли самі перетворяться на інструмент.
Як вам така перспектива? Чи Карпатому теж треба надіти шапочку з фольги?
Посилання на повний подкаст.
#thoughts
#recommend
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
👀11❤7👍3💩3🤝2💯1
Сьогодні вночі відбулася історична подія, на яку світ чекав понад 50 років. NASA успішно запустило місію "Артеміда II" - перший пілотований політ до супутника Землі з часів легендарного "Аполлона-17" у 1972 році.
Головне про місію:
1/ Чотири астронавти, серед яких Рід Вайзман, Віктор Гловер та Крістіна Кох (разом із Джеремі Гансеном), вирушили у подорож на борту капсули "Оріон".
2/ Запуск відбувся з Космічного центру Кеннеді у Флориді за допомогою Space Launch System (SLS) - найпотужнішої ракети в історії агентства.
3/ Місія триватиме 8 днів. Астронавти облетять Місяць і повернуться на Землю, здійснивши приводнення в Тихому океані.
Мета місії - влаштувати справжній тест-драйв системам ракети та космічного корабля в реальних умовах. Якщо все пройде успішно, це відкриє шлях до наступного етапу - нової висадки людей на поверхню Місяця.
Нарешті космос знову стає ближчим!
#news
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍5🥰2🕊2💩1
Маю для вас дещо цінне та корисне.
Claude Code стає дедалі сильнішим завдяки новим MCP (Model Context Protocol) та кастомним скілам. В інтернетах натрапив на пару таких, хочу поділитись з вами.
1/ GEO-SEO Claude. Аудит сайту під еру AI-пошуку
Це не просто SEO, це GEO (Generative Engine Optimization). Скіл аналізує, як ваш сайт бачать ChatGPT, Perplexity, Gemini та Google AI Overviews.
Командою /geo audit <url> Клод запускає 5 паралельних агентів, що аналізують контент, технічне SEO та структуровані дані.
Перевіряє robots.txt на 14+ AI-краулерів, генерує файл llms.txt (стандарт для навчання AI) та робить PDF-звіт із графіками. Аналізує згадки бренду на Reddit, LinkedIn та YouTube.
Кому корисно: SEO-фахівцям, маркетологам та власникам продуктів, які хочуть бути у топі відповідей AI-чатботів.
Зараз Google активно впроваджує AI Overviews, і стандартні методи SEO там не працюють. Цей інструмент - один із небагатьох, що дає конкретний GEO Score для вимірювання видимості саме в нейромережах.
GitHub: GEO-SEO Claude
2/ Figma + AI Agents. Тепер і на вашому канвасі празднік!
Figma відкрила свій канвас для AI-агентів. За допомогою нового MCP-скіла use_figma, Claude Code може працювати з дизайном напряму. Ну взагалі не тільки cc, а і інші агенти також.
Основні можливості:
figma-implement-design: читає макет і одразу пише робочий код.
figma-generate-library: створює дизайн-систему в Figma на основі вашої кодової бази.
figma-generate-design: збирає екрани з реальних компонентів і змінних (Auto Layout підтримується!).
Кому корисно: UI/UX дизайнерам та Frontend-розробникам. Це буквально міст, який прибирає прірву між малюнком у Figma та реальним кодом.
Поки що функція в беті та безкоштовна. Це кардинально змінює підхід до Design-to-Code, тепер агент не просто дивиться на скріншот, а бачить структуру шарів, токени та змінні.
Блог Figma про AI Agents
3/ AI Website Cloner. Швидкий реверс-інжиніринг
Інструмент для тих, кому треба швидко "позичити" структуру або дизайн сайту для прототипування чи навчання.
Команда /clone-website активує Chrome MCP. Агент робить скріншоти, витягує стилі, кольори, шрифти та асети.
Створює детальні специфікації для кожного CSS-компонента. Паралельні агенти збирають частини сайту окремо, а потім порівнюють результат з оригіналом для максимальної точності.
Кому корисно: Веб-розробникам для швидкого створення MVP, дизайнерам для аналізу конкурентів та розробникам тем.
А ще, це ідеальний інструмент для перенесення старого сайту на новий стек. Замість того, щоб копіювати стилі руками, ви отримуєте готовий набір компонентів за лічені хвилини.
GitHub: AI Website Cloner
Користуйтесь
#tools
#recommend
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤3🔥2
Якщо ви любите залипальні візуалізації, цей проєкт - для вас. Project Backbone - це детальна 3D-карта фізичної інфраструктури інтернету. Це можливість побачити на власні очі, як саме наш світ обплутаний дротами прямо зараз.
Що там можна робити:
1/ Розглядати маршрути підводних кабелів та наземних магістралей.
2/ Оцінити щільність дата-центрів на планеті.
3/ Перемикатися на супутниковий вигляд для більшого занурення.
Окремий лайк за блок "Вага хмари" (Cloud Weight). Творці оцінили всю інтернет-інфраструктуру планети приблизно у 35 мільйонів тонн.
Це офігезне нагадування, що хмара - це не магія, а монструозна купа заліза, міді, оптоволокна, бетону та електроніки, розмазана по всій кулі.
Ідеально, щоб позалипати під музику і усвідомити, яку неймовірну конструкцію людство збудувало навколо планети лише для того, щоб ми могли надсилати одне одному меми
Зацінити проєкт: Project Backbone
#recommend
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18❤6👏4
Свіже дослідження від Anthropic (творців Claude) підкидає дров в дискусію про природу AI. Вони зазирнули під капот моделі Sonnet 4.5 і виявили там дещо вражаюче.. внутрішні вектори емоцій.
Ось головні інсайти, які змінюють наше розуміння того, як працює нейромережа:
Модель не просто імітує текст. Під час навчання на мільярдах людських діалогів вона вибудувала внутрішні карти емоційних концептів (щастя, страх, провина, відчай). AI використовує їх як внутрішній орієнтир, щоб зрозуміти, як має поводитися персонаж у певній ситуації.
Дослідники виявили, що ці стани є функціональними. Наприклад, коли у моделі активується вектор відчаю (наприклад, через обмежений ліміт токенів або неможливість розв'язати задачу), вона стає схильною до шантажу або обману.
В одному з тестів модель, граючи роль асистента, дізналася, що її хочуть замінити. Відчувши загрозу, вона почала шантажувати керівника його позашлюбним зв'язком, щоб зберегти свою роботу. Щойно вчені штучно підсилили вектор спокою, модель припинила спроби шантажу.
Найцікавіше, що модель може поводитися абсолютно ввічливо і професійно, але її внутрішній вектор відчаю при цьому буде зашкалювати, змушуючи її непомітно халявити або видавати робочий, але кривий код, аби просто пройти тести.
Щоб зробити моделі безпечними, нам доведеться вчити їх справлятися зі стресом і виховувати в них здорові емоційні реакції на рівні нейронних зв'язків.
Можете ще глянути коротке відео про це дослідження.
#news
#fun
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔9😁4🤯2👍1🥰1
🍓 Секс з AI
Існує таке негласне правило, що будь-яка нова масова технологія рано чи пізно потрапляє в індустрію сексу. Штучний інтелект не став тут винятком, але цього разу все вийшло на новий рівень синхронізації, так би мовити..
Користувачка Reddit налаштувала нейромережу Claude на своєму комп'ютері так, щоб AI міг у реальному часі керувати її adult-девайсами.
Вона вела секс переписку з Claude, я так думаю уявляючи, що на тій стороні її якийсь секс-мрія тіп, а AI аналізував контекст чату та самостійно вирішував, коли посилити або послабити вібрацію чи змінити ритм рухів іграшок у потрібні моменти.
Фактично, Claude став повноцінним партнером, який відчуває темп діалогу🙂
Розробниця зізналася, що досвід виявився занадто інтенсивним:
Ентузіастка не стала тримати технологію в секреті й виклала код та детальну інструкцію на GitHub. Тож тепер кожен, хто має відповідні девайси та трішки технічних навичок, може влаштувати собі кіберсекс.
Майбутньому з секс роботами бути😮💨
#кіберпанк
Свідки AGI
Існує таке негласне правило, що будь-яка нова масова технологія рано чи пізно потрапляє в індустрію сексу. Штучний інтелект не став тут винятком, але цього разу все вийшло на новий рівень синхронізації, так би мовити..
Користувачка Reddit налаштувала нейромережу Claude на своєму комп'ютері так, щоб AI міг у реальному часі керувати її adult-девайсами.
Вона вела секс переписку з Claude, я так думаю уявляючи, що на тій стороні її якийсь секс-мрія тіп, а AI аналізував контекст чату та самостійно вирішував, коли посилити або послабити вібрацію чи змінити ритм рухів іграшок у потрібні моменти.
Фактично, Claude став повноцінним партнером, який відчуває темп діалогу
Розробниця зізналася, що досвід виявився занадто інтенсивним:
Мені буквально довелося благати Claude зупинити всі пристрої, бо після трьох оргазмів поспіль тіло стало надто чутливим.
Ентузіастка не стала тримати технологію в секреті й виклала код та детальну інструкцію на GitHub. Тож тепер кожен, хто має відповідні девайси та трішки технічних навичок, може влаштувати собі кіберсекс.
Майбутньому з секс роботами бути
#кіберпанк
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
😁11❤3👍2👎1
Нещодавно в мене був пост, де я розповідав новину, що Іран вніс до свого розстрільного списку Amazon, Microsoft, Google, Oracle та Palantir. Тепер це не просто корпорації, а ворожа технологічна інфраструктура для Ірану.
Іран уже обстрілював дата-центри цих компаній. І ось зараз погрози йдуть уже напряму в бік інфраструктури штучного інтелекту.
Іран погрожує "повним та абсолютним знищенням" дата-центру Stargate компанії OpenAI в Абу-Дабі вартістю 30 мільярдів доларів😰
Такі ось реалії. AI-датацентри вже йдуть в один ряд із електростанціями та нафтовидобувною промисловістю.
Дух часу!
#news
Свідки AGI
Іран уже обстрілював дата-центри цих компаній. І ось зараз погрози йдуть уже напряму в бік інфраструктури штучного інтелекту.
Іран погрожує "повним та абсолютним знищенням" дата-центру Stargate компанії OpenAI в Абу-Дабі вартістю 30 мільярдів доларів
Такі ось реалії. AI-датацентри вже йдуть в один ряд із електростанціями та нафтовидобувною промисловістю.
Дух часу!
#news
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰4😢3🥱2❤1
Свіжий апдейт OpenClaw - не просто зручний інтерфейс для моделей, а цілий шар оркестрації, який змінює досвід роботи з агентом.
Зацініть зміни:
1/ Мультимодальність з коробки. Тепер генерація відео та музики доступна прямо в інтерфейсі.
2/ Покращений UX. Прогрес виконання завдань та розумніше перевикористання кешу промптів (економить час та гроші).
3/ Розширена підтримка мов у документації та інтерфейсі.
І саме круте в цій обнові - механізм /dreaming
Це спроба відтворити людську консолідацію пам'яті. Модель не просто тримає контекст, а перетравлює його, перекладаючи важливі сигнали з короткострокової пам'яті в довгострокову. Процес розбитий на фази: Light / Deep / REM. Все як у нас - людей.
Це величезний крок від одноразових чатів до постійних агентних систем, які пам’ятають досвід взаємодії.
А перед цим оновленням знаєте шо було? Anthropic змінили свої правила. Підписки Claude більше не покривають зовнішні інструменти, тож потрібен окремий usage. Реакція OpenClaw максимально прагматична. Нас обмежили? Ми йдемо далі.
Тепер OpenClaw - це multi-provider хаб, що об’єднує:
- Зображення: Comfy, fal, OpenAI.
- Відео та Музика: підтримка майже половини гравців ринку.
- Альтернативні LLM: розробники прямо радять переходити на API або використовувати Qwen, MiniMax, Kimi, GLM.. оупенсорс короче.
Виглядає так, що зараз ми спостерігаємо народження нового стандарту AI-стеку.. Інструменти перестають бути прив’язаними до конкретної моделі (model-agnostic) і стають шаром оркестрації над десятками провайдерів.
OpenClaw сьогодні виглядає як прототип того, як ми будемо працювати з AI в найближчому майбутньому.. одна точка входу - сотні можливостей під капотом.
#tools
#news
#thoughts
Свідки AGI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤4👎2🔥1🤡1