This media is not supported in your browser
VIEW IN TELEGRAM
VeLO, the system that eliminates the need for optimizer hyperparameters
https://www.deeplearning.ai/the-batch/velo-the-system-that-eliminates-the-need-for-optimizer-hyperparameters/?utm_campaign=The%20Batch&utm_content=258012456&utm_medium=social&utm_source=linkedin&hss_channel=lcp-18246783
https://www.deeplearning.ai/the-batch/velo-the-system-that-eliminates-the-need-for-optimizer-hyperparameters/?utm_campaign=The%20Batch&utm_content=258012456&utm_medium=social&utm_source=linkedin&hss_channel=lcp-18246783
❤3👍1
School of AI
متا مدل زبانی Llama 2 رو اوپنسورس کرد... https://ai.meta.com/llama
آموزش ساخت چتبات به کمک مدل زبانی Llama2 و Streamlit
ویدئو:
https://youtu.be/J8TgKxomS2g?si=qDDFTQmR3qwXp3Ko
بلاگ پست:
https://blog.streamlit.io/how-to-build-a-llama-2-chatbot/
دمو:
https://llama2.streamlit.app/
ویدئو:
https://youtu.be/J8TgKxomS2g?si=qDDFTQmR3qwXp3Ko
بلاگ پست:
https://blog.streamlit.io/how-to-build-a-llama-2-chatbot/
دمو:
https://llama2.streamlit.app/
YouTube
How to build a Llama 2 chatbot
In this video, @DataProfessor shows you how to build a Llama 2 chatbot in Python using the Streamlit framework for the frontend, while the LLM backend is handled through API calls to the Llama 2 model hosted on Replicate.
⭐️ Watch this simplified video on…
⭐️ Watch this simplified video on…
👍5
ریکامندر سیستم اینستاگرام چگونه کار میکند...
https://engineering.fb.com/2023/08/09/ml-applications/scaling-instagram-explore-recommendations-system/
ریکامندر سیستم اینستاگرام بسیار شبیه به ریکامندر سیستم پیادهسازی شده در دورهی آموزشی زیر است که میتوانید به رایگان آن را مشاهده کنید:
https://t.me/schoolofai/537
https://engineering.fb.com/2023/08/09/ml-applications/scaling-instagram-explore-recommendations-system/
ریکامندر سیستم اینستاگرام بسیار شبیه به ریکامندر سیستم پیادهسازی شده در دورهی آموزشی زیر است که میتوانید به رایگان آن را مشاهده کنید:
https://t.me/schoolofai/537
Engineering at Meta
Scaling the Instagram Explore recommendations system
Explore is one of the largest recommendation systems on Instagram. We leverage machine learning to make sure people are always seeing content that is the most interesting and relevant to them. Usin…
❤2
یکی از محبوبترین و مرسومترین دیتاستهای بنچمارک برای پژوهش در زمینههایی مثل ریکامندر سیستمها و پردازش نظرات کاربران و ... دیتاست Amazon Per-category Review است.
این دیتاست از طریق ابزارهای طراحی پایپلاین ورودی مثل TensorFlow Datasets به راحتی قابل دسترس بود.
اما اخیرا این دیتاست از روی سرور آمازون (https://s3.amazonaws.com/amazon-reviews-pds/tsv/amazon_reviews_us_Books_v1_02.tsv.gz) غیرقابلدسترسی شده و اگر بخواهید از TFDS استفاده کنید با خطای ۴۰۳ روبرو میشید.
به همین دلیل، من تعداد زیادی پیام از عزیزان در این رابطه گرفته ام که تصمیم گرفتم یک تکهکد برای دانلود این دیتاست از منبع دیگر (دانشگاه سندیگو)، پیشپردازش و تبدیل اون به TensorFlow Datasets و Pandas Dataframe بنویسم تا کمکحال عزیزان باشه.
این کد از طریق نوتبوک زیر قابل دسترس است:
https://gist.github.com/xei/14ef271ffeb8e8437ec5039618655350
فقط توجه کنید که اگر برای کار پژوهشی معتبر میخواهید از این دیتاست استفاده کنید، حتما در گوگل فرم زیر از مالک دیتاست اجازه بگیرید:
https://docs.google.com/forms/d/e/1FAIpQLSeniNBetoz83H0QXxrfxPNoq7g6pkbAEcqrlrYiNJXZD5YT6g/viewform
و همینطور مقالهی زیر رو cite کنید:
http://dx.doi.org/10.18653/v1/D19-1018
این دیتاست از طریق ابزارهای طراحی پایپلاین ورودی مثل TensorFlow Datasets به راحتی قابل دسترس بود.
اما اخیرا این دیتاست از روی سرور آمازون (https://s3.amazonaws.com/amazon-reviews-pds/tsv/amazon_reviews_us_Books_v1_02.tsv.gz) غیرقابلدسترسی شده و اگر بخواهید از TFDS استفاده کنید با خطای ۴۰۳ روبرو میشید.
به همین دلیل، من تعداد زیادی پیام از عزیزان در این رابطه گرفته ام که تصمیم گرفتم یک تکهکد برای دانلود این دیتاست از منبع دیگر (دانشگاه سندیگو)، پیشپردازش و تبدیل اون به TensorFlow Datasets و Pandas Dataframe بنویسم تا کمکحال عزیزان باشه.
این کد از طریق نوتبوک زیر قابل دسترس است:
https://gist.github.com/xei/14ef271ffeb8e8437ec5039618655350
فقط توجه کنید که اگر برای کار پژوهشی معتبر میخواهید از این دیتاست استفاده کنید، حتما در گوگل فرم زیر از مالک دیتاست اجازه بگیرید:
https://docs.google.com/forms/d/e/1FAIpQLSeniNBetoz83H0QXxrfxPNoq7g6pkbAEcqrlrYiNJXZD5YT6g/viewform
و همینطور مقالهی زیر رو cite کنید:
http://dx.doi.org/10.18653/v1/D19-1018
Gist
Load Amazon Review Dataset.ipynb
Load Amazon Review Dataset.ipynb. GitHub Gist: instantly share code, notes, and snippets.
👍11
لکچر آموزشی LangChain توسط Ivan Resnikov
(تا الان ۲ جلسه از ۱۰ جلسه این لکچر منتشر شده)
جلسه اول (مقدمه):
https://github.com/IvanReznikov/DataVerse/tree/main/Courses/LangChain/Lecture1.%20Introduction%20to%20LangChain
جلسه دوم (مدلها):
https://github.com/IvanReznikov/DataVerse/tree/main/Courses/LangChain/Lecture2.%20Models
صفحه اصلی:
https://github.com/IvanReznikov/DataVerse/tree/main/Courses/LangChain
(تا الان ۲ جلسه از ۱۰ جلسه این لکچر منتشر شده)
جلسه اول (مقدمه):
https://github.com/IvanReznikov/DataVerse/tree/main/Courses/LangChain/Lecture1.%20Introduction%20to%20LangChain
جلسه دوم (مدلها):
https://github.com/IvanReznikov/DataVerse/tree/main/Courses/LangChain/Lecture2.%20Models
صفحه اصلی:
https://github.com/IvanReznikov/DataVerse/tree/main/Courses/LangChain
GitHub
DataVerse/Courses/LangChain/Lecture1. Introduction to LangChain at main · IvanReznikov/DataVerse
Public code of Dr. Ivan Reznikov used in posts, articles, conferences - IvanReznikov/DataVerse
👍5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
وبسایت https://www.chatbase.co به شما اجازه میده بهسادگی و با چند کلیک، دیتای خودتون رو در قالب فایل یا متن یا وبسایت یا ... بهش بدید و یک چتبات (شبیه به ChatGPT) براتون میسازه که میتونید بهراحتی داخل وبسایت خودتون یا واتساپ یا اسلک یا ... ازش استفاده کنید.
از این سرویس میشه برای اضافهکردن بات خدمات مشتریان به سایت یا گزارش تحلیلی شاخصهای دادهای موجود برای مدیران سازمان از طریق واتساپ و ... استفاده کرد.
از این سرویس میشه برای اضافهکردن بات خدمات مشتریان به سایت یا گزارش تحلیلی شاخصهای دادهای موجود برای مدیران سازمان از طریق واتساپ و ... استفاده کرد.
👍18❤3
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت مایکروسافت با همکاری Anaconda قدرت پایتون رو به Excel میآورد.
ازینپس بدون نصب هیچ ابزار اضافی، میتوان در نسخههای جدید Microsoft 365 (آفیس قدیم) از توابع و پکیجهای پایتون مثل Pandas و Matplotlib برای پاکسازی، پیشپردازش و تحلیل داده و حتی آموزش مدلهای یادگیری ماشین استفاده کرد. کافیاست موقع نوشتن تابع در اکسل از py= استفاده کنید...
ازینپس بدون نصب هیچ ابزار اضافی، میتوان در نسخههای جدید Microsoft 365 (آفیس قدیم) از توابع و پکیجهای پایتون مثل Pandas و Matplotlib برای پاکسازی، پیشپردازش و تحلیل داده و حتی آموزش مدلهای یادگیری ماشین استفاده کرد. کافیاست موقع نوشتن تابع در اکسل از py= استفاده کنید...
👍28😍9👏3❤2🔥1
محققان علوم اعصاب دانشگاه UCSF توانستند با کاشت یک ایمپلنت در مغز یک خانم جوان که فلج شده و توان گفتار ندارد، افکار وی را به واژهگان و متن و سپس با صدای خودش به ویس تبدیل کنند.
سایت:
https://www.ucsf.edu/news/2023/08/425986/how-artificial-intelligence-gave-paralyzed-woman-her-voice-back
ویدیو:
https://youtu.be/iTZ2N-HJbwA
سایت:
https://www.ucsf.edu/news/2023/08/425986/how-artificial-intelligence-gave-paralyzed-woman-her-voice-back
ویدیو:
https://youtu.be/iTZ2N-HJbwA
How Artificial Intelligence Gave a Paralyzed Woman Her Voice Back | UC San Francisco
How Artificial Intelligence Gave a Paralyzed Woman Her Voice Back
A brain implant and digital avatar allow a paralyzed stroke survivor to speak with for first time in 18 years with the help of artificial intelligence.
❤25👍9🔥5
STUDY: Socially aware temporally causal decoder recommender systems
https://ai.googleblog.com/2023/08/study-socially-aware-temporally-causal.html
https://ai.googleblog.com/2023/08/study-socially-aware-temporally-causal.html
👍4
پست نامربوط!
این پست به هوش مصنوعی ربطی نداره اما خواستم از تریبون استفاده کنم و بگم موقع استفاده از سرویسهای آنلاین، حواستون به اطلاعات شخصیتون باشه.
امروز زیرساختهای شرکت تپسی هک شد و بخش مهمی از اطلاعات کاربران نشت کرد. قبلتر این اتفاق برای چندتا از استارتاپهای بزرگ دیگه هم که نام نمیبرم افتاده بود.
توجه کنید که اگر بهصورت روزمره از سرویسهایی مثل اسنپ و تپسی و ... استفاده میکنید، الگوی رفت و آمد شما به مسیرهای مختلف به راحتی قابل پیشبینیه.
آدرس محل سکونت، اینکه چه زمان محل سکونت رو ترک میکنید و احیانا خونتون خالی میشه، اینکه چه زمان از شرکت میاید بیرون، از چه مسیری میرید، چی میخورید و چقدر از اول ماه خرج کردید و ...
شاید یه تصمیم کوچیک مثل اینکه سر کوچه سوار شید بتونه امنیت اطلاعاتتون رو حفظ کنه.
موفق باشید
پینوشت: تپسی تیم بسیار خوب و قدرتمندیه و داره تلاش میکنه کاملا شفاف از پس این چالش بر بیاد. این مشکل برای هر کدوم از استارتاپهای دیگه هم ممکنه پیش بیاد. بهتره در کل محتاط بود.
این پست به هوش مصنوعی ربطی نداره اما خواستم از تریبون استفاده کنم و بگم موقع استفاده از سرویسهای آنلاین، حواستون به اطلاعات شخصیتون باشه.
امروز زیرساختهای شرکت تپسی هک شد و بخش مهمی از اطلاعات کاربران نشت کرد. قبلتر این اتفاق برای چندتا از استارتاپهای بزرگ دیگه هم که نام نمیبرم افتاده بود.
توجه کنید که اگر بهصورت روزمره از سرویسهایی مثل اسنپ و تپسی و ... استفاده میکنید، الگوی رفت و آمد شما به مسیرهای مختلف به راحتی قابل پیشبینیه.
آدرس محل سکونت، اینکه چه زمان محل سکونت رو ترک میکنید و احیانا خونتون خالی میشه، اینکه چه زمان از شرکت میاید بیرون، از چه مسیری میرید، چی میخورید و چقدر از اول ماه خرج کردید و ...
شاید یه تصمیم کوچیک مثل اینکه سر کوچه سوار شید بتونه امنیت اطلاعاتتون رو حفظ کنه.
موفق باشید
پینوشت: تپسی تیم بسیار خوب و قدرتمندیه و داره تلاش میکنه کاملا شفاف از پس این چالش بر بیاد. این مشکل برای هر کدوم از استارتاپهای دیگه هم ممکنه پیش بیاد. بهتره در کل محتاط بود.
👍30❤3
Forwarded from Digiato | دیجیاتو
💯 «الهام طبسی» در لیست 100 فرد تأثیرگذار حوزه هوش مصنوعی سال 2023 مجله تایم قرار گرفت
🔺 مجله تایم لیست 100 فرد تأثیرگذار در زمین هوش مصنوعی را اعلام کرده است که در آن نام افرادی از جمله «سم آلتمن»، مدیرعامل OpenAI، «دمیس حسابیس»، مدیرعامل DeepMind و ایلان ماسک به چشم میخورد.
🔹 نکته قابلتوجه دیگر این لیست حضور «الهام طبسی» پژوهشگر ارشد ایرانی موسسه ملی استاندارد و فناوری (NIST) و معاون بخش فناوریهای نوظهور آزمایشگاه فناوری اطلاعات (ITL) است.
🔹طبسی که در ایران بهدنیا آمده و بزرگ شده است، همیشه آرزوی دانشمندن شدن را در سر داشته است. او در سال 1994 برای تحصیلات تکمیلی خود به ایالات متحده مهاجرت کرد و پنج سال بعد در NIST کار خود را روی پروژههای مختلف یادگیری ماشین و بینایی کامپیوتر آغاز کرد.
جزئیات بیشتر را در دیجیاتو بخوانید:
👇 👇
https://dgto.ir/34lc
📱 @Digiato 📡
🔺 مجله تایم لیست 100 فرد تأثیرگذار در زمین هوش مصنوعی را اعلام کرده است که در آن نام افرادی از جمله «سم آلتمن»، مدیرعامل OpenAI، «دمیس حسابیس»، مدیرعامل DeepMind و ایلان ماسک به چشم میخورد.
🔹 نکته قابلتوجه دیگر این لیست حضور «الهام طبسی» پژوهشگر ارشد ایرانی موسسه ملی استاندارد و فناوری (NIST) و معاون بخش فناوریهای نوظهور آزمایشگاه فناوری اطلاعات (ITL) است.
🔹طبسی که در ایران بهدنیا آمده و بزرگ شده است، همیشه آرزوی دانشمندن شدن را در سر داشته است. او در سال 1994 برای تحصیلات تکمیلی خود به ایالات متحده مهاجرت کرد و پنج سال بعد در NIST کار خود را روی پروژههای مختلف یادگیری ماشین و بینایی کامپیوتر آغاز کرد.
جزئیات بیشتر را در دیجیاتو بخوانید:
https://dgto.ir/34lc
Please open Telegram to view this post
VIEW IN TELEGRAM
👏24👍9
School of AI
یک زبان برنامهنویسی جدید به نام Mojo توسط Chris Lattner (خالق LLVM و زبان Swift) معرفی شد. این زبان، - سادگی و کاربردپذیری و دستخط Python رو در کنار پرفورمنس C دارد. - پشتیبانی کاملی از Parallel Programming در پردازندههای چندهسته ای و وکتور ها و accelerator…
GitHub
GitHub - modular/modular: The Modular Platform (includes MAX & Mojo)
The Modular Platform (includes MAX & Mojo). Contribute to modular/modular development by creating an account on GitHub.
👍13
Pre-processing temporal data with TensorFlow Decision Forests and Temporian
https://blog.tensorflow.org/2023/09/forecasting-with-tensorflow-decision-forests-and-temporian.html?linkId=9022947&m=1
https://blog.tensorflow.org/2023/09/forecasting-with-tensorflow-decision-forests-and-temporian.html?linkId=9022947&m=1
❤6
یکی از جدیدترین و مهمترین مهارتهای موردنیاز برای ML Engineer ها، استفاده از فریمورکهای توسعهی اپهای مبتنی بر LLM ها و RAG ها است.
و یکی از سوالهای متداول اینه که از کدوم فریمورک استفاده کنیم....
اگر به دنبال یک فریمورک کامل و جامع (با در نظر گرفتن پیچیدگیهاش) اید که بتونه به دیتاسورسهای مختلف (دیتابیس، فایل، API و ...) و مدلهای زبانی مختلف (مثل GPT4) متصل شده و تسکهای مختلف مثل تولید متن و تصویر و ... رو بهصورت همزمان انجام بده، LangChain رو انتخاب کنید. لینک زیر، کار با این فریمورک رو توضیح داده:
https://lnkd.in/ehWGc9qU
اگر اپلیکیشن شما سادهتره و فقط به جستجوی یک کوئری یا بازیابی اطلاعات از میان حجم انبوه اطلاعات متنی (مثل سامانههای پیشنهاددهنده) به کمک مدلهای زبانی محدود میشه، از LlamaIndex استفاده کنید. توجه کنید که این فریمورک برای تحلیل معنایی، مقایسه دادهها و فهم زبان طبیعی مناسب نیست. لینک زیر، کار با این فریمورک رو توضیح داده:
https://lnkd.in/eixPmZG7
اگر اپلیکیشن شما فهم زبان یا reasoning ساده است و به مقایسه شباهت معنایی متنها و دستهبندی یا خوشهبندی آنها محدود میشه، از فریمورک EmbedChain استفاده کنید. دقت کنید این فریمورک برای تولید متن مناسب نیست. لینک زیر کار با این فریمورک رو توضیح داده:
https://lnkd.in/e9rHZXtV
و یکی از سوالهای متداول اینه که از کدوم فریمورک استفاده کنیم....
اگر به دنبال یک فریمورک کامل و جامع (با در نظر گرفتن پیچیدگیهاش) اید که بتونه به دیتاسورسهای مختلف (دیتابیس، فایل، API و ...) و مدلهای زبانی مختلف (مثل GPT4) متصل شده و تسکهای مختلف مثل تولید متن و تصویر و ... رو بهصورت همزمان انجام بده، LangChain رو انتخاب کنید. لینک زیر، کار با این فریمورک رو توضیح داده:
https://lnkd.in/ehWGc9qU
اگر اپلیکیشن شما سادهتره و فقط به جستجوی یک کوئری یا بازیابی اطلاعات از میان حجم انبوه اطلاعات متنی (مثل سامانههای پیشنهاددهنده) به کمک مدلهای زبانی محدود میشه، از LlamaIndex استفاده کنید. توجه کنید که این فریمورک برای تحلیل معنایی، مقایسه دادهها و فهم زبان طبیعی مناسب نیست. لینک زیر، کار با این فریمورک رو توضیح داده:
https://lnkd.in/eixPmZG7
اگر اپلیکیشن شما فهم زبان یا reasoning ساده است و به مقایسه شباهت معنایی متنها و دستهبندی یا خوشهبندی آنها محدود میشه، از فریمورک EmbedChain استفاده کنید. دقت کنید این فریمورک برای تولید متن مناسب نیست. لینک زیر کار با این فریمورک رو توضیح داده:
https://lnkd.in/e9rHZXtV
lnkd.in
LinkedIn
This link will take you to a page that’s not on LinkedIn
👍15🔥7❤2
یکی از مهمترین تخصصهای یک مهندس یادگیری ماشین، مانیتورینگ مدلهای ML است.
مدلهای یادگیری ماشین به مرور زمان و با تغییر در محیط یا توزیع دادهها ممکن است کیفیت خود را از دست بدهند و نیاز به آموزش مجدد داشته باشند. این پدیده که به Drift معروف است، با مانیتور کردن مدل قابل تشخیص است.
کورس زیر یک کورس رایگان فوقالعاده در مورد مانیتورینگ و observability در مدلهای یادگیری به کمک پکیج Evidently است که توسط Emeli Dral ارائه شده است.
https://www.evidentlyai.com/ml-observability-course
مدلهای یادگیری ماشین به مرور زمان و با تغییر در محیط یا توزیع دادهها ممکن است کیفیت خود را از دست بدهند و نیاز به آموزش مجدد داشته باشند. این پدیده که به Drift معروف است، با مانیتور کردن مدل قابل تشخیص است.
کورس زیر یک کورس رایگان فوقالعاده در مورد مانیتورینگ و observability در مدلهای یادگیری به کمک پکیج Evidently است که توسط Emeli Dral ارائه شده است.
https://www.evidentlyai.com/ml-observability-course
Evidentlyai
Evidently AI - Open-source ML observability course
Free Open-source ML observability course for data scientists and ML engineers! Learn production ML monitoring at your own pace or sign up for the next cohort.
👍23❤1
مرکز سامانههای اطلاعاتی و علوم داده دانشگاه صنعتی شریف یک بررسی عالی و کامل از مهمترین پژوهشهای حوزهی NLP از Attention تا امروز انجام داده که یک دید کلی فوقالعاده به علاقهمندان به پژوهش در حوزه مدلهای زبانی میده.
جلسه اول:
https://youtu.be/AjTf9_lK4iE?si=_Lr1OLDAn0zx4QBp
جلسه دوم:
https://youtu.be/TqdqVxdNmm4?si=iPCrMj6GBCAX5RZr
جلسه سوم:
https://youtu.be/PMVfnNFe044?si=xLaVZv12MAVf-81m
جلسه چهارم:
https://youtu.be/vI5WlPQsJQ4?si=rxTezgA4nusqF-Uq
جلسه پنجم:
https://www.youtube.com/watch?v=h2jWpVzq4uU
جلسه ششم:
https://www.youtube.com/watch?v=XuaHyo3fv_I
جلسه اول:
https://youtu.be/AjTf9_lK4iE?si=_Lr1OLDAn0zx4QBp
جلسه دوم:
https://youtu.be/TqdqVxdNmm4?si=iPCrMj6GBCAX5RZr
جلسه سوم:
https://youtu.be/PMVfnNFe044?si=xLaVZv12MAVf-81m
جلسه چهارم:
https://youtu.be/vI5WlPQsJQ4?si=rxTezgA4nusqF-Uq
جلسه پنجم:
https://www.youtube.com/watch?v=h2jWpVzq4uU
جلسه ششم:
https://www.youtube.com/watch?v=XuaHyo3fv_I
YouTube
Session 1: A Comprehensive Overview of Key Papers in NLP - جلسه ۱: بررسی NLP مقالات کلیدی در حوزه
In this session, we comprehensively examined four papers: 'Attention is All You Need,' 'Improving Language Understanding by Generative Pre-training,' 'BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,' and 'Language Models…
👍28🔥1
جناب دکتر توتونچیان، استاد دانشگاه Drexel برای جمعهی این هفته (بعد از ظهر) یک جلسهی آنلاین برای بهاشتراکگذاری تجربهها در زمینهی کاربردهای جدید LLM ها در محیط واقعی برگزار میکنند.
اگر متخصص علوم داده یا یادگیری ماشین هستید و تجربهای در این زمینه دارید و یا میخواهید از تجربهی سایر متخصصین در این زمینه استفاده کنید، در این جلسه شرکت کنید.
زمان دقیق و لینک زوم متعاقبا در همین کانال و همچنین در گروه دکتر توتونچیان (لینک زیر) اعلام خواهد شد.
https://t.me/+8mhPMpJw97QwOWUx
اگر متخصص علوم داده یا یادگیری ماشین هستید و تجربهای در این زمینه دارید و یا میخواهید از تجربهی سایر متخصصین در این زمینه استفاده کنید، در این جلسه شرکت کنید.
زمان دقیق و لینک زوم متعاقبا در همین کانال و همچنین در گروه دکتر توتونچیان (لینک زیر) اعلام خواهد شد.
https://t.me/+8mhPMpJw97QwOWUx
Telegram
Data Science Study Group
Milad Toutounchian invites you to join this group on Telegram.
👍18😍2❤1