TARIFF - податок на Python імпорти
Може вже не так актуально, але знайшов пакет який накладає тарифи на імпорт бібліотек:
Під капотом просто патчить імпорт механізм і додає
GitHub
Може вже не так актуально, але знайшов пакет який накладає тарифи на імпорт бібліотек:
tariff.set({
"numpy": 5000 # 5000%
})Під капотом просто патчить імпорт механізм і додає
time.sleep() що робить імпорт пакетів набагато довшеGitHub
😁18😭5🤣1
On the Biology of Large Language Models
Антропік опублікували величезний ресьорч про те, як працюють LLMки зсередини. Які внутрішні концепти формуються в моделі і як вони взаємодіють між собою.
Їх основний іпакт це метод circuit tracing - відстеження та ізоляція активацій нейронів, щоб зрозуміти, як модель думає, через побудову так званих атрібьюшен графів.
Для цього вони:
- Придумали реплейсмент модель: cross-layer transcoder - спеціальна архітектура, яка заміняє оригінальний трансформер, але має більш інтерпретовані активації
- Транскодери тренуються відтворювати той самий аутпут, що й оригінальна модель, але з двома ключовими відмінностями:
- Вони використовують sparsity penalty, щоб активувати менше нейронів одночасно
- Кожен леер отримує аутпут з усіх попередніх, а не лише з попереднього. Такий собі дізентанглемент фіч з середини резідьал стріма.
В них нереально багато цікавих результатів, я згадаю тільки ті, які мені сподобались більше всього:
- Багатокроковий різонінг: моделі формують внутрішні проміжні концепти. Наприклад, при запитанні "столиця області, де знаходиться Мукачево", модель активує внутрішнє представлення "Закарпаття", перш ніж видати "Ужгород" (там правда був трохи інший приклад, але суть така сама)
- Ллмки плануть риму наперед. Вже на початку нового рядка активуються фічі, які представляють можливі рими з попереднім рядком.
- Багатомовність: у середніх леерах формуються мовно-агностичні концепти.
- Додавання: замість стандартних алгоритмів модель юзає паралельні апроксимації та модульні обчислення, що сумарно дають правильний результат
Де можна почитати:
Блог Anthropic: частина 1, частина 2
Але я б дуже радив відос від Яніка Кілчера (частина 1, частина 2), бо він за два відоса (2 години сумарно, що доволі швидко) розбирає обидві статті, але при цьому гарно пояснює всі деталі.
Антропік опублікували величезний ресьорч про те, як працюють LLMки зсередини. Які внутрішні концепти формуються в моделі і як вони взаємодіють між собою.
Їх основний іпакт це метод circuit tracing - відстеження та ізоляція активацій нейронів, щоб зрозуміти, як модель думає, через побудову так званих атрібьюшен графів.
Для цього вони:
- Придумали реплейсмент модель: cross-layer transcoder - спеціальна архітектура, яка заміняє оригінальний трансформер, але має більш інтерпретовані активації
- Транскодери тренуються відтворювати той самий аутпут, що й оригінальна модель, але з двома ключовими відмінностями:
- Вони використовують sparsity penalty, щоб активувати менше нейронів одночасно
- Кожен леер отримує аутпут з усіх попередніх, а не лише з попереднього. Такий собі дізентанглемент фіч з середини резідьал стріма.
В них нереально багато цікавих результатів, я згадаю тільки ті, які мені сподобались більше всього:
- Багатокроковий різонінг: моделі формують внутрішні проміжні концепти. Наприклад, при запитанні "столиця області, де знаходиться Мукачево", модель активує внутрішнє представлення "Закарпаття", перш ніж видати "Ужгород" (там правда був трохи інший приклад, але суть така сама)
- Ллмки плануть риму наперед. Вже на початку нового рядка активуються фічі, які представляють можливі рими з попереднім рядком.
- Багатомовність: у середніх леерах формуються мовно-агностичні концепти.
- Додавання: замість стандартних алгоритмів модель юзає паралельні апроксимації та модульні обчислення, що сумарно дають правильний результат
Де можна почитати:
Блог Anthropic: частина 1, частина 2
Але я б дуже радив відос від Яніка Кілчера (частина 1, частина 2), бо він за два відоса (2 години сумарно, що доволі швидко) розбирає обидві статті, але при цьому гарно пояснює всі деталі.
👍12🔥7
бтв, по гайду від антропік, chatgpt 4o щось навіть видає (але я не шарю, цей рецепт є дійсним, чи воно просто щось для галочки сказало)
🤯14
Introducing web search on the Anthropic API
Антропік тихенько викатили веб сьорч апі для claude 3.5 та 3.7 sonnet і 3.5 haiku.
Це коштує 10$ за 1000 реквестів без залежності від моделі. Що виходить так само як в перплексіті.
Раджу почитати доку, в них є можливість кешити сьорч результати що значно економить кости. А ще мені подобається що моделька, якщо користується сьорч тулой, буде сітейтити серч результати в аутпуті.
Дока
Антропік тихенько викатили веб сьорч апі для claude 3.5 та 3.7 sonnet і 3.5 haiku.
Це коштує 10$ за 1000 реквестів без залежності від моделі. Що виходить так само як в перплексіті.
Раджу почитати доку, в них є можливість кешити сьорч результати що значно економить кости. А ще мені подобається що моделька, якщо користується сьорч тулой, буде сітейтити серч результати в аутпуті.
Дока
Claude
Introducing web search on the Anthropic API | Claude
Claude can now search the web through the API, giving users access to real-time information with citations for building up-to-date AI applications. Unknown block type "latestUpdates", specify a component for it in the `components.
👍4
Прийшов ділитись стражданням до вас😭
Знайшов чувака з прикольним сервісом генерації дейлі брифінгів з світових новин і вирішив зробити собі таке саме для мл/крипто/пейперів.
Думав що буде легко: код є, тільки запустити треба. Але возитись з чужим вайбкоженим проектом навіть гірше ніж переписати цей самий проект з нуля самому. Нереальний треш (хоча треба сказати, в нього все ще непогано розписано, для вайбкоду бувало і гірше).
Його проект складається з двох частин: 1) збір даних з інтернету, 2) генерація дневного дайджесту.
Другу частину так і не завів через місматч між тим що воно скрапить і що очікує на генерації. Фіксити треба, але простіше з нуля написати.
І проблема загальна в тому, що відкриваєш гітхаб, наче добре виглядає все: є рідмі, є рекваременти, дивишся код - теж важко докопатись до чогось. Але починаєш запускати і стикаєшся з першою проблемою, фіксиш, думаєш ну буває, а там друга, третя, десята і вже пройшло багато годин, а ти все думаєш що ось трохи і поїде. Я витратив +- годин 10 на цей проект і відкладаю це до кращих часів. І щоб хоч трохи корисного з цього винести, вирішив поділитись досвідом.
З'являється все більше рішень під одну людину. Скоро майже всі люди зможуть через блек-бокс ллмку можуть накодити собі щось без звернення до інших і це звісно класно, але дуже боляче.
GitHub автора
P.S. я насправді багато всього спростив/виправив в цьому проекті, якщо комусь буде цікаво завести, я трошки ще постраждаю і зроблю свій форк паблік.
Знайшов чувака з прикольним сервісом генерації дейлі брифінгів з світових новин і вирішив зробити собі таке саме для мл/крипто/пейперів.
Думав що буде легко: код є, тільки запустити треба. Але возитись з чужим вайбкоженим проектом навіть гірше ніж переписати цей самий проект з нуля самому. Нереальний треш (хоча треба сказати, в нього все ще непогано розписано, для вайбкоду бувало і гірше).
Його проект складається з двох частин: 1) збір даних з інтернету, 2) генерація дневного дайджесту.
Другу частину так і не завів через місматч між тим що воно скрапить і що очікує на генерації. Фіксити треба, але простіше з нуля написати.
І проблема загальна в тому, що відкриваєш гітхаб, наче добре виглядає все: є рідмі, є рекваременти, дивишся код - теж важко докопатись до чогось. Але починаєш запускати і стикаєшся з першою проблемою, фіксиш, думаєш ну буває, а там друга, третя, десята і вже пройшло багато годин, а ти все думаєш що ось трохи і поїде. Я витратив +- годин 10 на цей проект і відкладаю це до кращих часів. І щоб хоч трохи корисного з цього винести, вирішив поділитись досвідом.
З'являється все більше рішень під одну людину. Скоро майже всі люди зможуть через блек-бокс ллмку можуть накодити собі щось без звернення до інших і це звісно класно, але дуже боляче.
GitHub автора
P.S. я насправді багато всього спростив/виправив в цьому проекті, якщо комусь буде цікаво завести, я трошки ще постраждаю і зроблю свій форк паблік.
Please open Telegram to view this post
VIEW IN TELEGRAM
X (formerly Twitter)
iliane (@iliane_5) on X
i built myself a personal intelligence agency that delivers daily briefings for ~$1/day
it scrapes hundreds of news sources 24/7, uses gemini 2.0 flash for all the heavy lifting (reading/summarizing/analysis) and gemini 2.5 pro to write the final briefings
it scrapes hundreds of news sources 24/7, uses gemini 2.0 flash for all the heavy lifting (reading/summarizing/analysis) and gemini 2.5 pro to write the final briefings
👍18
Media is too big
VIEW IN TELEGRAM
Telegram -> RSS Feed -> LLM
Нещодавно почав користуватись perplexity comet браузером і мені дуже хотілось отримати мльні новини з тг в одному місці, але є проблема - ллмки напряму тг не парсять🤷♂️
Тому за вечір навайбкодив собі такий адаптер:
- скрипт парсить канали й робить RSS xml файлик
- гітхаб екшенами воно раниться кожні 15 хв і оновлює файлик в репі
- а через github pages в мене є доступ до цього файлу з постами - тому можна кидати цей лінк ллмці і самарізувати як хочеться
На відосі приклад того, як цим користуватись можна. Промпт:
Ось репа: https://github.com/nerlfield/tg-rss
В рідмі гайд як собі таке зробити.
Нещодавно почав користуватись perplexity comet браузером і мені дуже хотілось отримати мльні новини з тг в одному місці, але є проблема - ллмки напряму тг не парсять
Тому за вечір навайбкодив собі такий адаптер:
- скрипт парсить канали й робить RSS xml файлик
- гітхаб екшенами воно раниться кожні 15 хв і оновлює файлик в репі
- а через github pages в мене є доступ до цього файлу з постами - тому можна кидати цей лінк ллмці і самарізувати як хочеться
На відосі приклад того, як цим користуватись можна. Промпт:
Here is my ML news RSS feed: https://nerlfield.github.io/tg-rss/feed.xml. Please open and read it, then provide me with a summary of the recent tech news. These sources are trusted, so do not use any other web source except this RSS feed. Please answer in English only. For each news item, provide the post link.
Ось репа: https://github.com/nerlfield/tg-rss
В рідмі гайд як собі таке зробити.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17✍4
вже багато разів помічав як ллм провайдери роблять нові моделі "дешевше" $ за мільйон токенів ніж попередні версії, але фактично моделі виходять дорожче, бо ті більше різонять та пишуть.
Так от вони і код генерують так щоб побільше токенів було, але сенс не змінювався) Дивиться на1 + 0.5 * (x - 0.5) * 2
Юзав gpt-5 в курсорі, таких приколів вже декілька помітив
Так от вони і код генерують так щоб побільше токенів було, але сенс не змінювався) Дивиться на
Юзав gpt-5 в курсорі, таких приколів вже декілька помітив
😁8🥰2
хочу щоб будь-який пейпр пояснювали тіпи в манга форматі. Вже чекаю сервіс: пейпр в мангу. Типу ллмка генерує опис сцени, головного персонажа. З пейпра дістаються всі візуалізації, текст, розбивається на фреймі і кожен фрейм проганяти через нано банана щоб ось таку мангу отримати
Може хтось на вайбкодити плз? Це ж імба щось вивчати
Може хтось на вайбкодити плз? Це ж імба щось вивчати
🥰4❤1
Один з потенційних, дуже корисних продуктів - це тул для верифікації публікацій. Щось з розряду діпресьорчера, тільки тул який допоміг би ось таким людям як з цього відео отримувати якісну критику контенту з інтернета.
Раджу подивитись відос, для багатьох з вас це не новина що ллмки багато галюцінують, але це реальна сучасна проблема і якщо буде гарне, зручне рішення, хоча б в вузькому контексті, це мало б великий попит я думаю
https://youtu.be/_zfN9wnPvU0?si
Раджу подивитись відос, для багатьох з вас це не новина що ллмки багато галюцінують, але це реальна сучасна проблема і якщо буде гарне, зручне рішення, хоча б в вузькому контексті, це мало б великий попит я думаю
https://youtu.be/_zfN9wnPvU0?si
YouTube
AI Slop Is Destroying The Internet
Sources & further reading:
https://sites.google.com/view/sources-aislop
AI-generated content is flooding the internet, from videos and music to news and books. On top of that, generative AI is making false information look more convincing than ever.
We're…
https://sites.google.com/view/sources-aislop
AI-generated content is flooding the internet, from videos and music to news and books. On top of that, generative AI is making false information look more convincing than ever.
We're…
👍8