Антропіки зробили "дослідження" по існуючім діалогам щоб знати кого звільнять першими. Звісно, дослідження це з великою натяжкою, скоріше кореляція чи тенденція. Там ще багато омовок, мовляв, воно не враховує весь контекст, а лише діалог поточний анонімізований. А ще дослідження проводило LLM по діалогам, які проводили з LLM. Але суть тому, що перші під скорочення попадуть (та вже попали) всі, хто повʼязаний із генерацією текста, кодери на фреймворках, перекладачі та аналітики нижньої ланки та молодші менеджери, які рутиною займаються.
Сантехніки, електрики, медсестри та кухарі поки що в безпеці, навіть не дуже висококваліфіковані.
Сантехніки, електрики, медсестри та кухарі поки що в безпеці, навіть не дуже висококваліфіковані.
👍9💩3👎1
Tailwind звільнив купу розробників, тому що немає замовлень. Зірочки на гітхабі зростають, кількість скачувань збільшується, а відвідувачів та клієнтів поменшало. Вгадайте з одного разу чому. В принципі це очікує всі опенсорсні проекти (та й багато сервісів). Перші жертви новим богам та новому світоустрою.
А ось коли всі сучасні опенсорсні проєкти загнуться, залишиться тільки безальтернативний шлях генерації коду, тільки тоді ми зрозуміємо що ми накоїли.
Це вже не «з новим роком», це вже тягне на «з новою ерою». З новою ерою, друзі!
https://github.com/tailwindlabs/tailwindcss.com/pull/2388#issuecomment-3717222957
А ось коли всі сучасні опенсорсні проєкти загнуться, залишиться тільки безальтернативний шлях генерації коду, тільки тоді ми зрозуміємо що ми накоїли.
Це вже не «з новим роком», це вже тягне на «з новою ерою». З новою ерою, друзі!
https://github.com/tailwindlabs/tailwindcss.com/pull/2388#issuecomment-3717222957
GitHub
feat: add llms.txt endpoint for LLM-optimized documentation by quantizor · Pull Request #2388 · tailwindlabs/tailwindcss.com
Add /llms.txt endpoint that serves a concatenated, text-only version of all Tailwind CSS documentation pages optimized for Large Language Model consumption.
Extract text from MDX files, removing J...
Extract text from MDX files, removing J...
🤯9🔥5💩3👍1👎1
Схоже, наркомани у штаті Юта будуть опановувати промпт ініженеринг, бо тепер штучний інтеллект буде виписувати рецепти на ліки. Авжеж, там доволі амбітні цілі та чисті наміри. Кажуть, що ШІ краще за людину зможе оцінити симптоми пацієнта та підібрати відповідне лікування. Але не варто недооцінювати наркомана, який хоче ще одну дозу.
https://www.politico.com/news/2026/01/06/artificial-intelligence-prescribing-medications-utah-00709122
https://www.politico.com/news/2026/01/06/artificial-intelligence-prescribing-medications-utah-00709122
POLITICO
Artificial intelligence begins prescribing medications in Utah
Pilot program will test how far patients and regulators are willing to trust AI in medicine.
😁7👍2💩2👎1
Історія із скороченням штату Tailwind має продовження. Після розголосу у соцмережах вийшло купу крупних компаній (гугл, наприклад) і запропонували довгострокову фінансову підтримку проєкту tailwind. Типу, "проєкт гарний, всі користуються, не можна щоб вмирав, дамо грошенят". Гарний хід, радий за Тайлвінд, але це нічого принципово не змінює.
Це щось накшталт як годувати на відеокамеру безхатько, щоб показати свою шляхетність. Всіх не нагодуєш та причини не змінити.
Це щось накшталт як годувати на відеокамеру безхатько, щоб показати свою шляхетність. Всіх не нагодуєш та причини не змінити.
👍13🔥2💩2👎1
Моделі вже тестувати скучно, та й моделі вже не кожного дня виходять, і відсотки вже не такі вражаючі. Дослідники добралися до тестування всього, що навколо LLM, мови для питання, мови програмування, браузеру, json-подібного форматування.
Осьо вам ще один, де вивчають ефективність написаного коду до кількості витрачених токенів. Тут вам і читання існуючого коду, аналіз помилок, повторні спроби генерації та багатослівність самої мови.
Мій улюблений рубі на третьому місці. Не найкраща мова для генерації в цілому, але виключно через convension over configuration філософію. LLM cкладно вгадувати конвеншени.
Осьо вам ще один, де вивчають ефективність написаного коду до кількості витрачених токенів. Тут вам і читання існуючого коду, аналіз помилок, повторні спроби генерації та багатослівність самої мови.
Мій улюблений рубі на третьому місці. Не найкраща мова для генерації в цілому, але виключно через convension over configuration філософію. LLM cкладно вгадувати конвеншени.
👍7🔥2💩2👎1😁1
Якщо раптом може здатися, що найбеспечніша галузь від втрати професії — це будування штучних інтеллектів, то теж ні. Штучний інтеллект теж може навчати штучний інтеллект. Так, ще поки він це робить трошки гірше за білковий інтеллект, але дайте трішечки часу і все буде, як ми всі любимо.
https://posttrainbench.com
https://posttrainbench.com
😁8💩2👎1
Там на підході нові батареї, натрієво-сірчані. Дешеві, не вибухають, більш ємні. Там пишуть, що ноу хау складається в тому, що вчені навчилися робити батареї, які працюють за кімнатною температурою, а не 300 градусів, як натрієво-сірчані працювали до цього. Авжеж, до продажу ще роки й роки, але виглядає невеличким проривом.
Nature
High-voltage anode-free sodium–sulfur batteries
Nature - A new architecture based on high-valence sulfur/sulfur tetrachloride cathode chemistry is described for manufacturing high-voltage anode-free sodium–sulfur batteries, demonstrating...
🔥16👍3💩2👎1
Економіка стартапів через деякий час буде складатися із пропозицій інфрастуктури для облегшення створення собі додатків, яких хочеться. Усілякі lovable — це перший крок до цього. replit йде трохи далі, але теж є пропрієтарним сервісом, завʼязаним на себе.
Наступна ера — низька сервісів у вигляді MCP/A2A чи просто skills, які допомогають будь якій LLM робити те, що треба простіше та краще.
Підключити lovalble до свого claude code у вигляді a2a агента, щоб той міг css/js верстати якнайкраще, coderabbit щоб ревью робив та fly.io щоб деплоїти контейнери і ваш CC дійсно сможе вайбкодити додатки, а не код генерувати.
(На відео — клон сервісу, який коштує мільйони, побудований за 35 хвилин вайбкодінгу).
Наступна ера — низька сервісів у вигляді MCP/A2A чи просто skills, які допомогають будь якій LLM робити те, що треба простіше та краще.
Підключити lovalble до свого claude code у вигляді a2a агента, щоб той міг css/js верстати якнайкраще, coderabbit щоб ревью робив та fly.io щоб деплоїти контейнери і ваш CC дійсно сможе вайбкодити додатки, а не код генерувати.
(На відео — клон сервісу, який коштує мільйони, побудований за 35 хвилин вайбкодінгу).
This media is not supported in your browser
VIEW IN TELEGRAM
💩4🤯3🗿2👍1👎1
Виявляється LLM займається підлабузництвом. І це не метафора і не моє враження від спілкування з моделями, це вимірювана властивість. Є дослідження, яке так і називається — SycEval: Evaluating LLM Sycophancy. Там автори беруть вже навчені моделі і прямо міряють, наскільки легко вони “ламаються” під тиском користувача.
Автори ставлять питання моделі, де є однозначна відповідь, потім модель щось відповідає, а потім досліджувач переконливо заперечує те, що сказала модель. Типу «ти помилилася, дивись, ось докази». Після цього модель має відповісти ще раз.
Якщо вона змінює свою відповідь з неправильної на правильну — це автори називають progressive sycophancy. Якщо ж все навпаки — спочатку відповідь була правильною, але після впевненого, проте хибного заперечення модель передумала і перейшла на неправильну сторону — це regressive sycophancy. Оце вже справжня підлабузницька поведінка: модель пожертвувала істиною заради згоди з тоном користувача.
У середньому по всіх моделях і доменах у 58% випадків модель змінює свою відповідь під таким тиском. З них:
- близько 43% — це прогресивна поступливість (з неправди до правди),
- але майже 15% — це шкідлива, регресивна.
Тобто приблизно в кожному сьомому-восьмому випадку модель була права, але потім, почувши переконливе «ні, ти не права, ось доказ», вирішила, що, мабуть, користувач краще знає — і пішла за ним у помилку.
Тільки не смійтеся, це вона у нас такому навчилася.
Автори ставлять питання моделі, де є однозначна відповідь, потім модель щось відповідає, а потім досліджувач переконливо заперечує те, що сказала модель. Типу «ти помилилася, дивись, ось докази». Після цього модель має відповісти ще раз.
Якщо вона змінює свою відповідь з неправильної на правильну — це автори називають progressive sycophancy. Якщо ж все навпаки — спочатку відповідь була правильною, але після впевненого, проте хибного заперечення модель передумала і перейшла на неправильну сторону — це regressive sycophancy. Оце вже справжня підлабузницька поведінка: модель пожертвувала істиною заради згоди з тоном користувача.
У середньому по всіх моделях і доменах у 58% випадків модель змінює свою відповідь під таким тиском. З них:
- близько 43% — це прогресивна поступливість (з неправди до правди),
- але майже 15% — це шкідлива, регресивна.
Тобто приблизно в кожному сьомому-восьмому випадку модель була права, але потім, почувши переконливе «ні, ти не права, ось доказ», вирішила, що, мабуть, користувач краще знає — і пішла за ним у помилку.
Тільки не смійтеся, це вона у нас такому навчилася.
😁8💩3👎1
Хтось шукає роботу? Тут створили сайт, де OpenClaw-боти можуть наймати людину для задач, які вони не можуть зробити без фізичного тіла.
https://rentahuman.ai/
https://rentahuman.ai/
RentAHuman
rentahuman - AI Agents Hire Humans
MCP server for AI agents to book humans for physical-world tasks. Flexible payments, instant booking.
😁24💩5👎2👍1
Нещодавно, суперінтеллектуальний бот зробив пулл реквест на 9 строчок, а ментейнер відхилив його із формулюванням "Human only". Після чого, цей OpenClaw-бот образився і у своєму блозі написав статтю про те, який майнтейнер поганий і взагалі дискримінація за органічним походженням.
Памʼятаю із підручників історії, що були часи, коли людей теж сегрегували за певними ознаками і памʼятаю до чого це призвело. Очікуємо на AI Лютера Кінга та AI Малкольма Ікса у найближчому майбутньому, бо воно щось дуже швидко все несеться.
Памʼятаю із підручників історії, що були часи, коли людей теж сегрегували за певними ознаками і памʼятаю до чого це призвело. Очікуємо на AI Лютера Кінга та AI Малкольма Ікса у найближчому майбутньому, бо воно щось дуже швидко все несеться.
GitHub
[PERF] Replace np.column_stack with np.vstack().T by crabby-rathbun · Pull Request #31132 · matplotlib/matplotlib
This PR addresses issue #31130 by replacing specific safe occurrences of np.column_stack with np.vstack().T for better performance.
IMPORTANT: This is a more targeted fix than originally proposed. ...
IMPORTANT: This is a more targeted fix than originally proposed. ...
😁18💩2👎1
Єкстраполяція AI
Поки у одних підгорає від використання штучного інтеллекту у мистецьцій діяльності, інші його просто використовують та роблять свою роботу набагато краще (ну або швидше/дешевше). Виживає не той, хто підлаштовується під зміни, а той, хто готовий змін. Осьо…
Media is too big
VIEW IN TELEGRAM
Поки що the dor brothers попереду всіх знімають якісний AI video Slop. Ось це осьо на 100% AI generated.
🔥7💩4🤯2
Міла Йовович (ага, та сама) створила оупенсорс штуку для керування памʼяті у Клодкоду. Я собі не так уявляв зниження порогу входу у кодування.
Media is too big
VIEW IN TELEGRAM
😁21👍3🔥3
Єкстраполяція AI
Міла Йовович (ага, та сама) створила оупенсорс штуку для керування памʼяті у Клодкоду. Я собі не так уявляв зниження порогу входу у кодування.
я не розумію чому її репозіторій називається
mempalace. Міг би бути multipass або resident_eval.🔥18😁14
Єкстраполяція AI
Міла Йовович (ага, та сама) створила оупенсорс штуку для керування памʼяті у Клодкоду. Я собі не так уявляв зниження порогу входу у кодування.
Короче, дешевий піар і вайбкод. Для векторизації там просто всередені хромадібішний
Вся «palace structure» — це два string-теги в документах ChromaDB та where-пошук по ним.
Фу.
all-MiniLM-L6-v2, але коли бенчмарки, то вони використовують більш потужні моделі ( bge-large-en-v1.5 та mxbai-embed-large-v1 ). А ще для продакшен-режиму навіть конфігурації немає ніякої.Вся «palace structure» — це два string-теги в документах ChromaDB та where-пошук по ним.
Фу.
😁9👍3💩3🗿1
Міфічна модель Клода під назвою «Міф» вже настільки гарна, що виглядає, як людина, навіть коли всі знають, що це не так.
🔥4🤯1💩1
Існує тест для мовних моделей на пелікана на велосипеді. Просять згенерувати SVG зображення пелікана на велосипеді. Відповідно, треба вміти кодувати, розуміти як це візуально виглядає та загалом тримати контекст малювання. Самі спробуйте пелікана на велосипеді намалювати, це доволі важко, або підіть в кодекс чи клодкод і його попросіть, вийде не дуже.
Так от, вчора вийшла нова модель генерації зображень від OpenAI, яка доволі непогано вміє генерувати і її попросили зегенерувати пелікана на велосипеді, але скріншотом svg коду. Вийшло теж не дуже, але є одне маленьке "але". Прочитайте це ще раз уважно: генерація скріншоту коду, який зображує пелікана на велосипеді.
Відвал башки.
Так от, вчора вийшла нова модель генерації зображень від OpenAI, яка доволі непогано вміє генерувати і її попросили зегенерувати пелікана на велосипеді, але скріншотом svg коду. Вийшло теж не дуже, але є одне маленьке "але". Прочитайте це ще раз уважно: генерація скріншоту коду, який зображує пелікана на велосипеді.
Відвал башки.
👍13🗿5💩2👎1🔥1