Еще один интересный проект про обертки для LLM для типобезопасных операций в получении данных из RAG. Я написал сложно, но сами примеры показывают, что работать с LLM станет проще
https://github.com/pydantic/pydantic-ai
Выпустили создатели Pydantic всего три недели назад!
https://github.com/pydantic/pydantic-ai
Выпустили создатели Pydantic всего три недели назад!
GitHub
GitHub - pydantic/pydantic-ai: GenAI Agent Framework, the Pydantic way
GenAI Agent Framework, the Pydantic way. Contribute to pydantic/pydantic-ai development by creating an account on GitHub.
🔥2
topdatalab
Прямо сейчас жду судью UK Employment Tribunal
Все в порядке, это я пытаюсь выбить деньги из компании-банкрота, где я работал.
Судья был очень мил, все подробно объяснил
PS: Английский суд намного гуманнее относится к людям, чем в России. Теперь у меня есть опыт и там, и там
Судья был очень мил, все подробно объяснил
PS: Английский суд намного гуманнее относится к людям, чем в России. Теперь у меня есть опыт и там, и там
👍13❤2
Monda One-pager.pdf
188.9 KB
В век AI цветет и пышет торговля данными. Я общался месяц назад с площадкой, которая помогает данные продавать monda.ai!
Это сайд проект https://datarade.ai - очень большого продавца данных.
Их прайсинг прикрепил к сообщению. Варьируется от 9000 до 60000 долларов в год.
Это сайд проект https://datarade.ai - очень большого продавца данных.
Их прайсинг прикрепил к сообщению. Варьируется от 9000 до 60000 долларов в год.
🤔7
Подозреваемый в убийстве CEO UnitedHealthCare оказался нашим коллегой - дата инженером
https://www.linkedin.com/in/luigi-mangione/
“Technologies: Java, Spark, MapReduce, Hadoop, Hbase, Phoenix, SQL, Maven, AWS Kinesis, AWS S3, Oozie, ElasticSearch, Druid
* Spearheaded the transition and integration of lease/loan payments to a new API, expanded pricing data sources, and improved call frequency and conditions, resulting in a 34% increase in new vehicle payments populated and more up-to-date payments on TrueCar.com
* Designed and developed a pipeline for ingesting data job metrics into Druid, including the frequency and segmentation for efficient storage of metrics. Additionally, built Druid dashboards for metrics visualization, granting the data engineering team the newfound ability to quickly and easily monitor performance impacts within pipelines and historical performance trends - a significant boost to performance tracking and bug fixing”
Топовый универ, Лига Плюща
https://www.linkedin.com/in/luigi-mangione/
“Technologies: Java, Spark, MapReduce, Hadoop, Hbase, Phoenix, SQL, Maven, AWS Kinesis, AWS S3, Oozie, ElasticSearch, Druid
* Spearheaded the transition and integration of lease/loan payments to a new API, expanded pricing data sources, and improved call frequency and conditions, resulting in a 34% increase in new vehicle payments populated and more up-to-date payments on TrueCar.com
* Designed and developed a pipeline for ingesting data job metrics into Druid, including the frequency and segmentation for efficient storage of metrics. Additionally, built Druid dashboards for metrics visualization, granting the data engineering team the newfound ability to quickly and easily monitor performance impacts within pipelines and historical performance trends - a significant boost to performance tracking and bug fixing”
Топовый универ, Лига Плюща
😱4🔥2
Про последствия ChatGPT в образовании, средние знания падают. Вспоминая учебу на Физтехе - считаю, что число заданий нужно уменьшить, а дрючить людей именно на понимание. ChatGPT тут вам не поможет :)
То же самое касается собеседований. Реши простейшую задачу и хорошо ее объясни
То же самое касается собеседований. Реши простейшую задачу и хорошо ее объясни
❤11👍4😱3😢2
Когда работаешь с ChatGPT помни, что это сознание галлюциногенное, а не база знаний!
Пара моментов из то, что случилось со мной в задачах по программированию при использовании новейшей модели o1:
1) модифицировал FastAPI код на питоне. LLM не смогла написать правильно, все ее варианты были уже deprecated в библиотеке
2) столкнулся со странным поведением в шаблонизаторе jinja2. LLM отвечала ерунду. Нашел ответ сам на StackOverflow. Ответ был дан лет 10 назад.
Написать какую-нибудь хрень для Leetcode она конечно может, но инженерию нет. Это как нанять победителя олимпиады по программированию, код будет быстр, но делать не то что нужно 🙂
Пара моментов из то, что случилось со мной в задачах по программированию при использовании новейшей модели o1:
1) модифицировал FastAPI код на питоне. LLM не смогла написать правильно, все ее варианты были уже deprecated в библиотеке
2) столкнулся со странным поведением в шаблонизаторе jinja2. LLM отвечала ерунду. Нашел ответ сам на StackOverflow. Ответ был дан лет 10 назад.
Написать какую-нибудь хрень для Leetcode она конечно может, но инженерию нет. Это как нанять победителя олимпиады по программированию, код будет быстр, но делать не то что нужно 🙂
👍10
Пока я нахожусь в процессе смены работы, то решил стряхнуть пыль с проекта и обновить дизайн.
Для этого купил библиотеку FlowBite - шаблоны разных блоков для Tailwindcss. Это некий аналог low-code подхода, но при этом код остается ваш.
Мне помогли дизайнеры в шаблоном страницы компании, остальное я сделал все сам, включая верстку.
Весь дизайн заверстал с помощью Jinja, и опубликовал на сайт. Работал много, неделями по 12 часов в день 🙁
Очень много времени я провел в визуализации инсайтов о компании, чтобы одним взглядом можно было понять, насколько там все хорошо или плохо.
Пример хорошей компании https://corpsignals.com/companies/uk/omlet-ltd-05028498.html
Пример закрывающейся компании https://corpsignals.com/companies/uk/silverbird-global-ltd-12585400.html
Для этого купил библиотеку FlowBite - шаблоны разных блоков для Tailwindcss. Это некий аналог low-code подхода, но при этом код остается ваш.
Мне помогли дизайнеры в шаблоном страницы компании, остальное я сделал все сам, включая верстку.
Весь дизайн заверстал с помощью Jinja, и опубликовал на сайт. Работал много, неделями по 12 часов в день 🙁
Очень много времени я провел в визуализации инсайтов о компании, чтобы одним взглядом можно было понять, насколько там все хорошо или плохо.
Пример хорошей компании https://corpsignals.com/companies/uk/omlet-ltd-05028498.html
Пример закрывающейся компании https://corpsignals.com/companies/uk/silverbird-global-ltd-12585400.html
🔥11
topdatalab
Загадаю вам загадку! У меня было три, а стало четыре!
очень экзотические ответы :) сын у меня родился :)
🎉36❤7🔥6
Бывало ли у вас, что вы что-то сказали, и вам стала показываться реклама по этой теме? Многие утверждали, что это фейк, случайное совпадение, или вы «наследили» в поиске.
Оказалось, что не так все просто: Apple выплатит 95 млн по такому делу.
https://www.bbc.co.uk/news/articles/cr4rvr495rgo.amp
Оказалось, что не так все просто: Apple выплатит 95 млн по такому делу.
https://www.bbc.co.uk/news/articles/cr4rvr495rgo.amp
🔥8😁1😱1💯1👀1
Подсмотрел в чате ODS London - https://salad.com - некий uber сервис для GPU карт! Можете сдать свою в “аренду”, или взять чужую.
Идея огонь, цены сейчас на GPU карты очень высокие.
Думаю, что скоро попробую там арендовать мощности.
Идея огонь, цены сейчас на GPU карты очень высокие.
Думаю, что скоро попробую там арендовать мощности.
Salad
Salad - Distributed GPU Cloud | 60,000+ daily active GPUs from $0.02/hour
Save up to 90% on cloud costs compared to hyperscalers. Deploy AI/ML production models easily on the world's largest distributed cloud. Perfect for AI inference, batch processing, molecular dynamics & more.
👍3🔥2
topdatalab
Я ненавижу удаленку! Особенно, когда я работаю удаленно, а остальные члены команды сидят в офисах. В таком случае все вопросы решаются очень медленно. Что бы ни говорили, но если стремишься к серьезным результатам, офис эффективнее. Когда я работал на Бостон…
вопрос с удаленкой решил, теперь из офиса, один сегодня, смотрю на Revolut свысока :)
🔥10👍7❤2😁2
topdatalab
Сэкономил тысячи долларов в год, добавив кастомную авторизацию в Metabase. По прежнему считаю, что Metabase одна из самых удобных BI систем для пользователей. Но есть одна проблема - коммерческая PRO версия довольно дорогая - 500 долларов в месяц плюс 10…
This media is not supported in your browser
VIEW IN TELEGRAM
Продолжаю хакать Metabase. У меня получилось туда запихнуть screen recorder openreplay. Теперь можно следить за пользователями аналитических систем :), как они пользуются отчетами.
Посмотрите видео, что получилось.
Выложить инструкцию и патченный metabase как это сделать?
Посмотрите видео, что получилось.
Выложить инструкцию и патченный metabase как это сделать?
🔥21👍6🙏3❤2👏2
Open source LLM модели становятся все сильнее. Поэтому приобрел себе б/у сервер для GPU в сборе на ebay:
- amd 2950 cpu
- мат плата поддерживает до 4х gpu
- 128 память
- 1 tb диск
- как плюс 2080ti в придачу (заменю или дополню 3090)
- огромный, тяжелый серверный корпус
Стоил мне 570 фунтов. Очень хорошая цена
PS: болею воспалением легких, лежу и любуюсь, 20 лет компы не собирал
- amd 2950 cpu
- мат плата поддерживает до 4х gpu
- 128 память
- 1 tb диск
- как плюс 2080ti в придачу (заменю или дополню 3090)
- огромный, тяжелый серверный корпус
Стоил мне 570 фунтов. Очень хорошая цена
PS: болею воспалением легких, лежу и любуюсь, 20 лет компы не собирал
🔥10👍9❤1👏1
Много сделал за последний месяц!
1. На новой работе освоил SQLMesh. Dbt отправляю на помойку на всех своих проектах и больше использовать не буду, настолько хорош SQLMesh! Это как Git для данных
2. Освоил dltHub - это open source проект для транспорта данных в хранилище. Отличная штука, самое то для очень быстрого развертывания. Например, залил весь корпоративный хабспот одной строчкой кода.
3. Поработал с TRINO для real time анализа и даже попытался использовать его как транспорт для хранилища данных. Есть плюсы, есть минусы.
4. Освоил Htmx, написал пару функций для CorpSignals. Больше React пользоваться не буду. Могу порекомендовать отличную книгу по нему.
5. Купил 3090 карту, экспериментирую с локальными LLM для генерации Seo оптимизированных описаний компаний.
6. Читаю книгу по LLM моделям на Pytorch.
7. Сделал попытку переехать с Duckdb на Postgres. Пока попытка провалилсь, Duckdb работает в 100 раз быстрее без какого либо тюнинга.
8. По CorpSignals потихоньку работаю с друзьями. Задачи очень разные, и проект развивается.
9. Нашел как оптимизировать сайты под LLM
PS: Напишу потом подробнее. Если есть вопросы - пишите в комментариях. Да, начинаю искать себе на работу data инженера
1. На новой работе освоил SQLMesh. Dbt отправляю на помойку на всех своих проектах и больше использовать не буду, настолько хорош SQLMesh! Это как Git для данных
2. Освоил dltHub - это open source проект для транспорта данных в хранилище. Отличная штука, самое то для очень быстрого развертывания. Например, залил весь корпоративный хабспот одной строчкой кода.
3. Поработал с TRINO для real time анализа и даже попытался использовать его как транспорт для хранилища данных. Есть плюсы, есть минусы.
4. Освоил Htmx, написал пару функций для CorpSignals. Больше React пользоваться не буду. Могу порекомендовать отличную книгу по нему.
5. Купил 3090 карту, экспериментирую с локальными LLM для генерации Seo оптимизированных описаний компаний.
6. Читаю книгу по LLM моделям на Pytorch.
7. Сделал попытку переехать с Duckdb на Postgres. Пока попытка провалилсь, Duckdb работает в 100 раз быстрее без какого либо тюнинга.
8. По CorpSignals потихоньку работаю с друзьями. Задачи очень разные, и проект развивается.
9. Нашел как оптимизировать сайты под LLM
PS: Напишу потом подробнее. Если есть вопросы - пишите в комментариях. Да, начинаю искать себе на работу data инженера
🔥21👍2😱2
Вот чего действительно стоит посмотреть про LLM, так это видео Андрея Карпатова (один из основателей OpenAI)
https://youtu.be/EWvNQjAaOHw?si=YGYb_OIHhHpnfuuG
Сам посмотрел все на выходных. Узнал ли я что-то новое - не совсем, но зато систематизировал свои знания. Интересно было его послушать первый час, далее он как-то галопом промчался и было уже не так интересно.
Технический подробностей он не рассказывал, но зато они наглядно сравнил самые последние разработки публичных чатов.
https://youtu.be/EWvNQjAaOHw?si=YGYb_OIHhHpnfuuG
Сам посмотрел все на выходных. Узнал ли я что-то новое - не совсем, но зато систематизировал свои знания. Интересно было его послушать первый час, далее он как-то галопом промчался и было уже не так интересно.
Технический подробностей он не рассказывал, но зато они наглядно сравнил самые последние разработки публичных чатов.
YouTube
How I use LLMs
The example-driven, practical walkthrough of Large Language Models and their growing list of related features, as a new entry to my general audience series on LLMs. In this more practical followup, I take you through the many ways I use LLMs in my own life.…
👍8🔥2