Борис опять
16.1K subscribers
1.49K photos
77 videos
35 files
1.52K links
life = curiosity + irreducible noise

Whois: https://t.me/boris_again/3400

Лс: @btseytlin
Download Telegram
А вы говорили у Антропика нереалистичные сценарии для эвалов на безопасность
21
Forwarded from Foom Countdown Party
To mitigate eval awareness you don't necessarily have to make the sandboxes more realistic
282
Красивое
43🔥18
Сегодня любим Claude Code

В голове давно витала идея: что если все формулы в книге заменить на красивые картинки с подписями? Можно и визуально облегчить, и текст сделать проще.

Проблема в том, что перерисовывать всё сил нет.

Подумано — завайбкожено. Показываю Claude Code и говорю — там же есть вроде бы какая-то либа, чтобы сделать математические визуализации из кода. Найди все Latex формулы и переделай, чтобы у меня был скрипт из которого генерируются картинки с формулами для каждой главы, и чтобы md файлы исходников их сразу подтягивали.

Он откопал manim, придумал как адаптировать его для создания картинок, очень долго страдал над latex шаблонами и шрифтами. В итоге получается такая красота и почти бесплатно. Всё равно много приходится поправлять руками (у моделей всё плохо с вижном), но клево же. Сам бы я не осилил это сделать.
63🔥19🤔9
Ээээммммм, аниме-литкод????
72🔥85
У админа немного течет крыша, накидайте мемов в комментариях
7721
Спустя час после того как пересел с Claude на Grok:
106😢187👎1
@downloadmoregpus выдал на днях очень точно
4943👎3👍1
🚀 Открыта регистрация:
Agentic Legal RAG Challenge 2026

Если вы строите RAG / agentic pipelines (ingestion → retrieval → generation) и вам важны метрики, близкие к реальному продакшену, это соревнование для вас.

Что именно оценивают:
Answer quality — насколько ответ корректный по сути
Grounding / faithfulness — подтверждён ли ответ конкретными фрагментами из юридических источников (c citations / chunk-level evidence)
Latency / TTFT — скорость, включая time-to-first-token (как быстро система начинает отдавать ответ)

Формат: Online участие / Live leaderboard + финальная проверка на private test set (без возможности “подгонки под паблик”)

Данные: 300+ юридических документов и 1 000+ вопросов

🏆 $32 000 призовой фонд — один из крупнейших в мире в сегменте Legal RAG/Agentic

📅 Период соревнования: 11 - 25 марта 2026 (регистрация уже открыта)

👉 Детали и регистрация: www.agentic-challenge.ai

Если у вас команда и уже есть свой стек (embeddings / vector DB / rerankers / LLM / tooling) — отличный шанс сравнить подходы на нормальной постановке и метриках.
🔥114👍1
Forwarded from шорткат
про нейронки и машинное обучение простыми словами

Из каждого утюга сказали про нейронки, но никто так и не смог донести до меня простыми словами, как именно чат жпт и дипсик выдают ответ на наши вопросы.

Ко мне на подкаст пришел Борис, который пишет книгу про ИИ для всех. В своей книге Борис рассказывает простыми словами для таких как я, что под капотом у нейросетей.

Обсудили с Борисом:

🟡как именно текстовые нейронки анализируют запрос и как именно выдают ответ
🟡как обучают нейронки и почему их бьют палками
🟡почему нейросети галлюцинируют

Получился насыщенный подкаст, послушать можно:

на youtube
на яндекс.музыке
в apple подкастах
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6298🔥5🤔5
Media is too big
VIEW IN TELEGRAM
Поумнели немного и хватит. Давно не показывал вам как продвигается моё хобби — стендап на английском. Ловите новые четыре минуты.

Раньше показывать было особо нечего. Но на днях планеты выстроились в ряд, я хорошо выступил и это попало на запись.

Любопытно, что у меня довольно дегенератская простая по темам комедия. Возможно потому, что в жизни хватает мест где надо быть умным, а на сцене скорее хочется быть простым веселым парнем с обостренной самоиронией.
6637👍21🔥5🤔3😢1
Dogfooding? Слышал об этом, я тоже кормлю своих разработчиков собачьей едой
88👍2
126👎2
5928🤔3👎2
Хороший анализ тропов которые выдают AI текст. Так же может служить хорошим гайдом для людей: как писать, чтобы не быть похожим на корпоративного зомби с Linkedin.

Насколько модели будут писать лучше если вставить это в промпт — не знаю. Если кто-то заметит реальное улучшение отпишите пожалуйста

https://tropes.fyi/tropes-md
👍32🤔1033
За два месяца было 12 мок собеседований и карьерных консультаций.

К моему удивлению брали в основном консультации. Мне казалось, что ценность мока гораздо проще оценить, а карьерная консультация это нечто непонятное. Но моков было всего три штуки, а всё остальное это консультации. Чаще всего приходили с запросом вида: "у меня всё уже неплохо, но не очень понятно что делать дальше со своей карьерой." Часто с приставкой вроде "я всего лишь пишу на C++ и копаюсь в GPU, кому я сейчас такой нужен..." 😂 В общем, подрабатываю дорогим терапевтом для ML-щиков, записывайтесь.



Мок собеседования и карьерные консультации по 150 евро всем и каждому

Мой питч остается таким же, как когда я менторил людей в течение всего поиска работы. Искать работу тяжело. Может иметь смысл заплатить кому-то (мне), чтобы сделать этот процесс проще, повысить шансы на успех и увеличить будущий оффер.

Я могу помочь с собеседованиями и карьерным путем в ML/DS или Backend разработке (а так же в меньшей степени в других направлениях в IT). Вы можете оценить мой подход по моей Методичке по поиску работы в DS/ML, посмотрев запись мок-собеседования по ML system design или по постам в канале на тему карьеры. Вот тут есть несколько отзывов.

Стоимость 150 евро.

Забронировать слот можно здесь:

https://calendly.com/iambtseytlin

Бронируя слот не забудьте заранее отправить мне в личку своё CV и нужный контекст, чтобы я мог подготовиться
Please open Telegram to view this post
VIEW IN TELEGRAM
4211👍10
Media is too big
VIEW IN TELEGRAM
Шикарная штука из Твиттера, оказывается Опус может генерировать простенькие видосы с текстом напрямую через moviepy и ffmpeg. Всё воспроизвелось, вот мой видос.

Оригинальный промпт: "can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM"
37🔥121
Беру свои слова назад, для OpenClaw есть юзкейсы
10721🔥7