DLeX: AI Python
من الان فهمیدم این کتابخونه دومی که در این پست معرفی کردم و گفتم بعضیا اطلاع دادن، بهتر از MarkItDown مایکروسافت کار می کنه برای Parse ، حاصل کار IBM Research هست. :)
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
Please open Telegram to view this post
VIEW IN TELEGRAM
DLeX: AI Python
آماده سازی دیتای صفحات وب برای استفاده به عنوان clean markdown یا دیتای ساختاریافته در پایپ لاین های مختلف با یک Crawler اپن سورس : @ai_python https://github.com/mendableai/firecrawl
چند وقت پیش در این پست FireCrawl رو معرفی کردم. امروز یک Crawler دیگه هم پیدا کردم که به نظر می رسه جامعه توسعه دهنده های فعالی داره و از طرفی آخرین به روزسانی گیت هابش هم مربوط به همین دیروز هست.
@ai_python
اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.
ولی فعلن خودم هم این رو استفاده نکردم.
لینک گیت هاب :
https://github.com/unclecode/crawl4ai
@ai_python
اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.
ولی فعلن خودم هم این رو استفاده نکردم.
لینک گیت هاب :
https://github.com/unclecode/crawl4ai
❤8
Forwarded from Elon Fact فارسی
این ویدیو تمامن ساخته شده با Grok زیبا بود :
@elonfact
https://x.com/KatiaEarth/status/1874719053123862550
@elonfact
https://x.com/KatiaEarth/status/1874719053123862550
🔥4❤🔥1❤1
DLeX: AI Python
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
در خصوص تفاوت نتیجه MarkItDown با docling ، این بررسی بسیار جامع و دقیق رو پیدا کردم :
@ai_python
مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.
https://www.tamingllms.com/notebooks/input.html
@ai_python
مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.
https://www.tamingllms.com/notebooks/input.html
❤4❤🔥2🔥2
یکی از کتاب های مناسب برای مباحث پایه ریاضی مورد نیاز در علوم کامپیوتر
@ai_python
https://courses.csail.mit.edu/6.042/spring18/mcs.pdf
➕ Linear algebra
➕ Series
➕ Logic
➕ Probability
➕ Number theory
➕ Graphs
@ai_python
https://courses.csail.mit.edu/6.042/spring18/mcs.pdf
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤2❤🔥1
مدل های زبانی که در سال ۲۰۲۴ پر سر و صدا آمدند و بی سر و صدا رفتند :
@ai_python
https://analyticsindiamag.com/ai-trends/llms-that-failed-miserably-in-2024/
@ai_python
https://analyticsindiamag.com/ai-trends/llms-that-failed-miserably-in-2024/
Analytics India Magazine
LLMs that Failed Miserably in 2024 | AIM
Databricks spent $10 million developing DBRX, yet only recorded 23 downloads on Hugging Face last month.
❤🔥7
@ai_python
https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial
Perform semantic search and retrieval-augmented generation
👉 This tutorial guides you through the end-to-end process of creating and using text embeddings, including using vector indexes to improve search performance.
This tutorial covers the following tasks:
🖥 Creating a BigQuery ML remote model over a Vertex AI embedding model.
🖥 Using the remote model with the ML.GENERATE_EMBEDDING function to generate embeddings from text in a BigQuery table.
🖥 Creating a vector index to index the embeddings.
🖥 Using the VECTOR_SEARCH function with the embeddings to search for similar text.
🖥 Perform retrieval-augmented generation (RAG) by generating text with the ML.GENERATE_TEXT function, and using vector search results to augment the prompt input and improve results.
This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial
Perform semantic search and retrieval-augmented generation
This tutorial covers the following tasks:
This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥1
رویکردهایی برای افزایش دقت مدل های زبانی:
@ai_python
https://towardsdatascience.com/the-next-frontier-in-llm-accuracy-cb2491a740d4
@ai_python
https://towardsdatascience.com/the-next-frontier-in-llm-accuracy-cb2491a740d4
Medium
The Next Frontier in LLM Accuracy
Exploring the Power of Lamini Memory Tuning
❤🔥1
این ریپازیتوری گیت هاب به خصوص برای دوستانی که در زمینه IoT با تمرکز بر خانه های هوشمند فعالیت می کنند، احتمالن جالبه :
@ai_python
https://github.com/goruck/home-generative-agent
@ai_python
https://github.com/goruck/home-generative-agent
❤2❤🔥2🔥1
کتابخانه اوپن سورس BetterWhisperX که یک فورک بهبود یافته از WhisperX هست ، برای تشخیص صحبت به همراه دیاریزاسیون
@ai_python
https://github.com/federicotorrielli/BetterWhisperX
@ai_python
https://github.com/federicotorrielli/BetterWhisperX
❤3
یک پایپ لاین بسیار مناسب برای چانک کردن فایل های صوتی طولانی به طوری که برای کار با مدل های Whisper مربوط به Groq مناسب باشن :
@ai_python
https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb
Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:
@ai_python
👂 Preprocess audio files for optimal transcription
👂 Split audio files into manageable chunks
👂 Implement a smart overlap for our chunks
👂 Transcribe our chunks using Whisper Large V3
👂 Merge our results while properly handling overlaps
👂 Save our transcriptions in multiple formats for further handling
@ai_python
https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb
Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:
@ai_python
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
groq-api-cookbook/tutorials/audio-chunking/audio_chunking_tutorial.ipynb at main · groq/groq-api-cookbook
groq-api-cookbook. Contribute to groq/groq-api-cookbook development by creating an account on GitHub.
❤4❤🔥1🔥1
جای پلت فرم هایی که تصاویر وکتوری از پرامپ های ما تولید کنن یه مقدار خالی بود. ( در مقابل تصاویر پیکسلی ) :
@ai_python
https://github.com/SagiPolaczek/NeuralSVG
@ai_python
https://github.com/SagiPolaczek/NeuralSVG
❤6❤🔥4🔥2
مدل TimesFM یکی از مدل های پیش بینی Time Series هست که توسط گوگل توسعه داده شده است. این مدل در Hugging Face نیز در دسترس قرار دارد :
@ai_python
https://huggingface.co/google/timesfm-2.0-500m-pytorch
مقاله های مرتبط :
🔗 https://arxiv.org/abs/2310.10688
🔗 https://arxiv.org/abs/2402.02592
@ai_python
https://huggingface.co/google/timesfm-2.0-500m-pytorch
مقاله های مرتبط :
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
google/timesfm-2.0-500m-pytorch · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤10❤🔥2🔥2
اولین جلسه یکی از کورس های ماشین لرنینگ پیشرفته در شبکه اجتماعی X :
@ai_python
https://x.com/randallmbriggs/status/1877675613441396800
به نظرم خیلی عالیه که از ظرفیت های این شبکه برای انتشار کورس ها استفاده بشه. چون دنبال کردن کامنت ها و ارتباط گرفتن با آموزش دهنده ها در توییتر بسیار راحت تر از یوتیوب هست.
@ai_python
https://x.com/randallmbriggs/status/1877675613441396800
به نظرم خیلی عالیه که از ظرفیت های این شبکه برای انتشار کورس ها استفاده بشه. چون دنبال کردن کامنت ها و ارتباط گرفتن با آموزش دهنده ها در توییتر بسیار راحت تر از یوتیوب هست.
🔥5❤🔥2❤2🐳1
از اونجایی که این ریپازیتوری گیت هاب حاوی لینک به برخی از بهترین منابع آموزشی هوش مصنوعی بعد از این همه سال هنوزم به روزرسانی می شه و هنوزم خوبه ، لازم دونستم یه بار دیگه توی کانال معرفیش کنم :
@ai_python
https://github.com/owainlewis/awesome-artificial-intelligence
@ai_python
https://github.com/owainlewis/awesome-artificial-intelligence
❤🔥4❤3🔥1