шось про ai

TARIFF - податок на Python імпорти

Може вже не так актуально, але знайшов пакет який накладає тарифи на імпорт бібліотек:

tariff.set({
    "numpy": 5000  # 5000%
})

Під капотом просто патчить імпорт механізм і додає time.sleep() що робить імпорт пакетів набагато довше

GitHub

😁18😭5🤣1

674 views20:17

шось про ai

On the Biology of Large Language Models

Антропік опублікували величезний ресьорч про те, як працюють LLMки зсередини. Які внутрішні концепти формуються в моделі і як вони взаємодіють між собою.

Їх основний іпакт це метод circuit tracing - відстеження та ізоляція активацій нейронів, щоб зрозуміти, як модель думає, через побудову так званих атрібьюшен графів.

Для цього вони:
- Придумали реплейсмент модель: cross-layer transcoder - спеціальна архітектура, яка заміняє оригінальний трансформер, але має більш інтерпретовані активації
- Транскодери тренуються відтворювати той самий аутпут, що й оригінальна модель, але з двома ключовими відмінностями:
- Вони використовують sparsity penalty, щоб активувати менше нейронів одночасно
- Кожен леер отримує аутпут з усіх попередніх, а не лише з попереднього. Такий собі дізентанглемент фіч з середини резідьал стріма.

В них нереально багато цікавих результатів, я згадаю тільки ті, які мені сподобались більше всього:
- Багатокроковий різонінг: моделі формують внутрішні проміжні концепти. Наприклад, при запитанні "столиця області, де знаходиться Мукачево", модель активує внутрішнє представлення "Закарпаття", перш ніж видати "Ужгород" (там правда був трохи інший приклад, але суть така сама)
- Ллмки плануть риму наперед. Вже на початку нового рядка активуються фічі, які представляють можливі рими з попереднім рядком.
- Багатомовність: у середніх леерах формуються мовно-агностичні концепти.
- Додавання: замість стандартних алгоритмів модель юзає паралельні апроксимації та модульні обчислення, що сумарно дають правильний результат

Де можна почитати:
Блог Anthropic: частина 1, частина 2

Але я б дуже радив відос від Яніка Кілчера (частина 1, частина 2), бо він за два відоса (2 години сумарно, що доволі швидко) розбирає обидві статті, але при цьому гарно пояснює всі деталі.

👍12🔥7

1.06K views20:15

шось про ai

бтв, по гайду від антропік, chatgpt 4o щось навіть видає (але я не шарю, цей рецепт є дійсним, чи воно просто щось для галочки сказало)

🤯14

703 views20:53

шось про ai

Introducing web search on the Anthropic API

Антропік тихенько викатили веб сьорч апі для claude 3.5 та 3.7 sonnet і 3.5 haiku.

Це коштує 10$ за 1000 реквестів без залежності від моделі. Що виходить так само як в перплексіті.

Раджу почитати доку, в них є можливість кешити сьорч результати що значно економить кости. А ще мені подобається що моделька, якщо користується сьорч тулой, буде сітейтити серч результати в аутпуті.

Дока

Claude

Introducing web search on the Anthropic API | Claude

Claude can now search the web through the API, giving users access to real-time information with citations for building up-to-date AI applications. Unknown block type "latestUpdates", specify a component for it in the `components.

👍4

660 views13:59

шось про ai

Прийшов ділитись стражданням до вас😭

Знайшов чувака з прикольним сервісом генерації дейлі брифінгів з світових новин і вирішив зробити собі таке саме для мл/крипто/пейперів.

Думав що буде легко: код є, тільки запустити треба. Але возитись з чужим вайбкоженим проектом навіть гірше ніж переписати цей самий проект з нуля самому. Нереальний треш (хоча треба сказати, в нього все ще непогано розписано, для вайбкоду бувало і гірше).

Його проект складається з двох частин: 1) збір даних з інтернету, 2) генерація дневного дайджесту.

Другу частину так і не завів через місматч між тим що воно скрапить і що очікує на генерації. Фіксити треба, але простіше з нуля написати.

І проблема загальна в тому, що відкриваєш гітхаб, наче добре виглядає все: є рідмі, є рекваременти, дивишся код - теж важко докопатись до чогось. Але починаєш запускати і стикаєшся з першою проблемою, фіксиш, думаєш ну буває, а там друга, третя, десята і вже пройшло багато годин, а ти все думаєш що ось трохи і поїде. Я витратив +- годин 10 на цей проект і відкладаю це до кращих часів. І щоб хоч трохи корисного з цього винести, вирішив поділитись досвідом.

З'являється все більше рішень під одну людину. Скоро майже всі люди зможуть через блек-бокс ллмку можуть накодити собі щось без звернення до інших і це звісно класно, але дуже боляче.

GitHub автора

P.S. я насправді багато всього спростив/виправив в цьому проекті, якщо комусь буде цікаво завести, я трошки ще постраждаю і зроблю свій форк паблік.

Please open Telegram to view this post

VIEW IN TELEGRAM

X (formerly Twitter)

iliane (@iliane_5) on X

i built myself a personal intelligence agency that delivers daily briefings for ~$1/day

it scrapes hundreds of news sources 24/7, uses gemini 2.0 flash for all the heavy lifting (reading/summarizing/analysis) and gemini 2.5 pro to write the final briefings

👍18

897 viewsedited 14:08

Telegram -> RSS Feed -> LLM

Нещодавно почав користуватись perplexity comet браузером і мені дуже хотілось отримати мльні новини з тг в одному місці, але є проблема - ллмки напряму тг не парсять 🤷‍♂️

Тому за вечір навайбкодив собі такий адаптер:

- скрипт парсить канали й робить RSS xml файлик
- гітхаб екшенами воно раниться кожні 15 хв і оновлює файлик в репі
- а через github pages в мене є доступ до цього файлу з постами - тому можна кидати цей лінк ллмці і самарізувати як хочеться

На відосі приклад того, як цим користуватись можна. Промпт:

Here is my ML news RSS feed: https://nerlfield.github.io/tg-rss/feed.xml. Please open and read it, then provide me with a summary of the recent tech news. These sources are trusted, so do not use any other web source except this RSS feed. Please answer in English only. For each news item, provide the post link.

Ось репа: https://github.com/nerlfield/tg-rss

В рідмі гайд як собі таке зробити.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17✍4

692 views21:14

шось про ai

вже багато разів помічав як ллм провайдери роблять нові моделі "дешевше" $ за мільйон токенів ніж попередні версії, але фактично моделі виходять дорожче, бо ті більше різонять та пишуть.

Так от вони і код генерують так щоб побільше токенів було, але сенс не змінювався) Дивиться на 1 + 0.5 * (x - 0.5) * 2

Юзав gpt-5 в курсорі, таких приколів вже декілька помітив

😁8🥰2

663 viewsedited 12:51

шось про ai

edited by Nano Banana 🍌

😁15😢1

953 views11:44

шось про ai

хочу щоб будь-який пейпр пояснювали тіпи в манга форматі. Вже чекаю сервіс: пейпр в мангу. Типу ллмка генерує опис сцени, головного персонажа. З пейпра дістаються всі візуалізації, текст, розбивається на фреймі і кожен фрейм проганяти через нано банана щоб ось таку мангу отримати

Може хтось на вайбкодити плз? Це ж імба щось вивчати

🥰4❤1

1.07K views11:52

шось про ai

https://how.rl.works/ 👀

how.rl.works

How RL works

Badly

😁6🔥1

923 views20:14

шось про ai

Один з потенційних, дуже корисних продуктів - це тул для верифікації публікацій. Щось з розряду діпресьорчера, тільки тул який допоміг би ось таким людям як з цього відео отримувати якісну критику контенту з інтернета.

Раджу подивитись відос, для багатьох з вас це не новина що ллмки багато галюцінують, але це реальна сучасна проблема і якщо буде гарне, зручне рішення, хоча б в вузькому контексті, це мало б великий попит я думаю

https://youtu.be/_zfN9wnPvU0?si

YouTube

AI Slop Is Destroying The Internet

Sources & further reading:
https://sites.google.com/view/sources-aislop

AI-generated content is flooding the internet, from videos and music to news and books. On top of that, generative AI is making false information look more convincing than ever.
We're…

👍8

895 views21:01

шось про ai

https://cursor.com/2025 - прикольна стата в курсорі

584 views11:35

About

Blog

Apps

Platform