متخصصان علم داده ها data scientists
1.35K subscribers
1.22K photos
206 videos
190 files
419 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
🏷 Deep Think Vs. Deep Search Vs. Deep Research

#ChatGPT
#DeepSearch

@toobabigdatascience
متخصصان علم داده ها data scientists
🏷 Deep Think Vs. Deep Search Vs. Deep Research #ChatGPT #DeepSearch @toobabigdatascience
نکته: قابلیت Deep Research که توسط گوگل معرفی شد و OpenAi آنرا زودتر کپی کرد و با قیمت (فکر کنم حدود ۲۰ دلار ) به کاربران اجازه دسترسی به آن را داد. اکنون برای کاربرهای Gemini رایگان شده است.
#DeepResearch
@toobabigdatascience
ALL.pdf
14.5 MB
#Research

Learning to Localize Leakage of Cryptographic Sensitive Variables

🔐در حالی که الگوریتمهای رمزنگاری مانندالگوریتم رمزنگاری استاندارد پیشرفته (AES) که به طور گسترده استفاده می شوند، امن هستند، در عین حال پیاده سازی هاي سخت‌افزاري این الگوریتمها به‌طور اجتناب‌ناپذیری اطلاعات حساس مانند #کلید های #رمزنگاری را «نشت» میدهند.
یک شکل به‌خصوص خطرناک از نشت، ناشی از این واقعیت است که سخت‌افزار پیاده سازی شده ، به گونه‌ای انرژی مصرف میکند و تشعشعات ساطع می‌نمايد که از نظر آماری با داده های پردازش شده و دستورالعملهای اجراشده مرتبط است.
یادگیری عمیق نظارت‌شده به عنوان یک ابزار پیشرفته برای انجام "حملات کانال جانبی" مطرح شده است که با یادگیریِ نگاشتِ اندازه گیری‌های ِمصرفِ انرژی/تشعشعات در طول فرایند رمزگذاری به داده های حساس استفاده شده در آن رمزگذاری، از این نشت داده سوءاستفاده میکنند.
روشی که در این مقاله برای جلوگیری از نشت کلیدهای رمزنگاری ارائه شده است، برای طراحان سخت‌افزارهای رمزنگاری جهت درک دلیل نشت دیتا و چگونگی کاهش آن بسیار ارزشمند است.
#cryptography
#DataLeak
#AES
@toobabigdatascience
🦚امام حسن(ع):

"صاحِبِ النّاسَ مِثلَ ما تُحِبُّ أن يُصاحِبوكَ بهِ.

با مردم آن گونه رفتار كن كه دوست دارى با تو رفتار كنند.
📚أعلام الدين ؛ص ۲۹۷

@toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
♨️رونمایی شبکه سه سیما، از نخستین مجری هوش مصنوعی!

#AI
@toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
𝗛𝗼𝘄 𝘁𝗼 𝗕𝘂𝗶𝗹𝗱 𝗬𝗼𝘂𝗿 𝗙𝗶𝗿𝘀𝘁 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗠𝗼𝗱𝗲𝗹?

#ML
#AI
@toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
𝗧𝗵𝗲 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝘃𝗲 𝗔𝗜 𝗦𝘁𝗮𝗰𝗸 ↓

💵Critical Infrastructure Components for 2025

↠ 1. Data Layer
→ Purpose: Provides raw data for training and inference.
→ Examples: Data Lakes (e.g., S3, GCS), Data Warehouses (e.g., BigQuery, Snowflake), Vector Databases (e.g., Pinecone, Weaviate).

↠ 2. Model Layer
→ Purpose: Handles model training, fine-tuning, and inference.
→ Examples: Pre-trained models (GPT, LLaMA), Custom models on frameworks (PyTorch, TensorFlow).

↠ 3. Feature Store
→ Purpose: Central repository to store, share, and reuse features for ML models.
→ Examples: Vertex AI Feature Store, Feast.

↠ 4. Training Infrastructure
→ Purpose: Executes large-scale training efficiently.
→ Examples: GPUs (NVIDIA), TPUs (Google), Distributed Compute (Ray, Spark).

↠ 5. Deployment Layer
→ Purpose: Facilitates hosting and scaling AI applications.
→ Examples: Kubernetes (K8s), Docker, Cloud Services (AWS SageMaker, Azure ML).

↠ 6. Monitoring & Observability
→ Purpose: Tracks model performance, drift, and ensures reliability.
متخصصان علم داده ها data scientists
𝗧𝗵𝗲 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝘃𝗲 𝗔𝗜 𝗦𝘁𝗮𝗰𝗸 ↓ 💵Critical Infrastructure Components for 2025 ↠ 1. Data Layer → Purpose: Provides raw data for training and inference. → Examples: Data Lakes (e.g., S3, GCS), Data Warehouses (e.g., BigQuery, Snowflake), Vector Databases (e.g., Pinecone…
→ Examples: Arize AI, Evidently AI, Prometheus, Grafana.

↠ 7. Application Layer
→ Purpose: Builds user-facing generative AI applications.
→ Examples: Chatbots, Image Generators, Text-to-Speech tools.

↠ 8. Governance & Security
→ Purpose: Ensures compliance, security, and ethical use.
→ Examples: Responsible AI Frameworks, Identity Access Management (IAM).

↠ 9. MLOps Integration
→ Purpose: Automates CI/CD pipelines, ensuring continuous delivery of updates.
→ Examples: Kubeflow, MLflow, Airflow.

#GenerativeAI
#AI
@toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
♨️𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘂𝘀 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗶𝗻 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 ↓

𝗪𝗵𝗮𝘁 𝗶𝘀 𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘂𝘀 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴? ↓

↬ It involves integrating fresh, real-time data into training pipelines to keep models updated.
↬ Essential for applications like fraud detection, recommendation systems, and self-driving cars, where patterns evolve rapidly.

♨️𝗪𝗵𝘆 𝗶𝘀 𝗶𝘁 𝗖𝗿𝗶𝘁𝗶𝗰𝗮𝗹? ↓

↠ Avoids Model Drift: Models lose accuracy if the underlying data distribution shifts over time (concept drift).
↠ Improves Predictions: Updated models perform better by learning new patterns and behaviors.
↠ Ensures Scalability: Handles ever-growing datasets effectively, keeping the system robust.

𝗦𝘁𝗲𝗽𝘀 𝗶𝗻 𝗮 𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘂𝘀 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗣𝗶𝗽𝗲𝗹𝗶𝗻𝗲 ↓

1. Data Collection & Preprocessing
↬ Stream new data from production systems, clean and transform it.
2. Feature Engineering
↬ Generate features using automated pipelines (e.g., Feature Stores).
3. Model Training
↬ Train or fine-tune the model with the updated dataset.
متخصصان علم داده ها data scientists
♨️𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘂𝘀 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗶𝗻 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 ↓ 𝗪𝗵𝗮𝘁 𝗶𝘀 𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘂𝘀 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴? ↓ ↬ It involves integrating fresh, real-time data into training pipelines to keep models updated. ↬ Essential for applications like fraud detection, recommendation systems, and self…
4. Evaluation
↬ Compare the retrained model against the previous version using validation metrics.
5. Deployment
↬ If the retrained model performs better, deploy it to production using CI/CD pipelines.

𝗧𝗲𝗰𝗵𝗻𝗶𝗾𝘂𝗲𝘀 𝗙𝗼𝗿 𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘂𝘀 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴 ↓

↠ Incremental Learning: Update only parts of the model using new data.
↠ Transfer Learning: Fine-tune pre-trained models to adapt to evolving data.
↠ Online Learning: Continuously update the model one data point at a time.

𝗧𝗼𝗼𝗹𝘀 𝗮𝗻𝗱 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸𝘀 ↓

↬ TensorFlow Extended (TFX): Automates end-to-end continuous training pipelines.
↬ Kubeflow: Manages ML workflows for scalable training and retraining.
↬ MLflow: Tracks experiments, manages models, and supports lifecycle management.

𝗘𝘅𝗮𝗺𝗽𝗹𝗲 ↓

Imagine a recommendation system:
↬ New user behavior patterns (clicks, purchases) are streamed in real-time.
↬ Continuous training updates the model to recommend the latest trending items.

#ML
#Training
#AI
@toobabigdatascience
https://youtu.be/0VLAoVGf_74?si=6rpSpJO97vDRR1wi

چگونه DeepSeek R1 سرعت و کارایی راهمزمان و با هم افزایش داد؟
پاسخ این سوال در این ویدئو در یوتیوب است

در این ویدیو، روش جدیدی به نام «Multi-Head Latent Attention»
(MHLA)
معرفی شده که با کاهش مصرف حافظه، سرعت استنتاج را افزایش میدهد
گفته میشود کهDeepSeek R1 موفق شده اندازه «Key-Value Cache» (کش KV) را ۵۷ برابر کاهش بده و تولید متن رو ۶ برابر سریع‌تر از ترنسفورمرهای سنتی انجام دهد!

#DeepSeekR1
#MHLA
#LLMs
@toobabigdatascience
Think AI.pdf
6.1 MB
🎁معرفی کتاب: Think AI

🧿این کتاب یک راهنمای نسبتا جامع برای یادگیری هوش مصنوعی، یادگیری ماشین، شبکه‌های عصبی، بینایی کامپیوتری و پردازش زبان طبیعی با استفاده از کتابخانه‌های قدرتمند پایتون است. نویسنده با استفاده از روش‌های مدرن، کاربردهای عملی و پروژه‌های کاربردی، شما را به دنیای هوش مصنوعی پیشرفته وارد می‌کند.

⬅️ ویژگی‌های کتاب:
1️⃣ آشنایی با مفاهیم یادگیری ماشین و شبکه‌های عصبی
2️⃣ یادگیری بینایی کامپیوتری و پردازش زبان طبیعی با تکنیک‌های به‌روز
3️⃣ پیاده‌سازی الگوریتم‌های یادگیری ماشین و هوش مصنوعی با پایتون
4️⃣ بررسی پروژه‌های عملی برای درک بهتر کاربردهای AI در دنیای واقعی

📚 این کتاب می تواند بعنوان یک منبع برای دانشجویان، مهندسان داده، علاقه‌مندان به یادگیری ماشین و توسعه‌دهندگان هوش مصنوعی بکار رود.
#AI
#ML
@toobabigdatascience
🏴 با عرض تسلیت و تعزیت بمناسبت فرا رسیدن ایام شهادت اميرالمؤمنين علی ع و شب قدر
نماهنگ ِ :
"آمدم باز، در ِ میکده ات، گریه کنان
تشنه ام، تشنه ی دیدار، سبویی برسان...."
https://www.aparat.com/v/64QtD

السلام علیک یا امیرالمؤمنین ع
التماس دعا

#شب_قدر
@toobabigdatascience
🦚 با تبریک و تهنیت بمناسبت فرارسیدن سال نو خورشیدی و نوروز🍀 باستانی ایرانی...
سالی سرشار از سلامت و بهروزی را برای همراهان فرهیخته ی کانال و اساتید بزرگوار، آرزومندیم...

https://www.aparat.com/v/zoq10v6

🦚با آرزوی قبولی طاعات و عبادات

@toobabigdatascience 🪻🪻
🎁گهی پشت بر زین و گه زین به پشت...
#AI
#SoftwareEngineering
@toobabigdatascience