AI, Python, Cognitive Neuroscience
4.1K subscribers
1.09K photos
47 videos
78 files
889 links
Download Telegram
Forwarded from AI DeepMind (Farzad 🦅)
محدودیتهای مدلهای LLMs

Fundamental Limitations of Alignment in Large Language Models

https://arxiv.org/abs/2304.11082

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
Forwarded from AI DeepMind (Farzad 🦅)
یک مقاله خفن هستش به نظر من که جای کار بسیاری داره و توسط دیپ مایند هم به طور اوپن سورس منتشر شده
Transformers Meet Directed Graphs, we generalize transformers to more general inputs, namely directed graphs.

🔸 Paper
🔸 GitHub
🔸 YouTube

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
Forwarded from AI DeepMind (Farzad 🦅)
اگر اطلاعات کاملتری میخواهید که متوجه بشوید این مقاله چی میگه از اینجا شروع کنید
🔸 A Survey on Multimodal Large Language Models

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
Forwarded from AI DeepMind (Farzad 🦅)
پروژه های اوپن سورسی که توسط مدل Segment Anything تا حالا منتشر شده میتونید اینجا دنبال کنید و ایده های جدیدتری رو خودتون باهاش توسعه بدید
https://github.com/IDEA-Research/Grounded-Segment-Anything

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
Forwarded from AI DeepMind (Farzad 🦅)
در مقاله پیشرو بازخورد انسانی چگونه رفتارهای LLM را هدایت می کند؟
صدای چه کسی غالب است؟ آیا میتوانیم از Adverserial attackها جلوگیری کنیم؟!
چه چالش هایی باقی مانده است و چگونه می‌توانیم به عنوان یک جامعه در آینده بهتر عمل کنیم؟

🔸 The Past, Present and Better Future of Feedback Learning in Large Language Models for Subjective Human Preferences and Values

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
Forwarded from AI DeepMind (Farzad 🦅)
در این مقاله و مقاله جدیدی که در اومده
RAG
🔹
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
🔹

✔️مدل های RAG، ساختار جدیدی برای مدل های Retrieval هستن که با knowledge سرو کار دارن و تلاش میکنند وقتی جنریت میکنن نالج محور باشن!
✔️ منظور از knowledge، هر دیتابیسی که شامل اطلاعاتی هستش مثل ویکی پدیا، البته فقط ویکی پدیا نیست لزوما
✔️ همونطور که گفتم این یک ساختار جدید هستش، Seq2Seq و نسبت به ساختار های E2E عادی و همچنین کاندیدا محور بهتر کار کرده.
✔️به خاطر محبوبیت و کاراییش، Huggingface هم این ساختار رو به کتابخونه ترنسفورمر ها اضافه کرده.
▪️

Introducing Self-RAG, a new easy-to-train, customizable, and powerful framework for making an LM learn to retrieve, generate, and critique its own outputs and retrieved passages, by using model-predicted reflection tokens.

📜 Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection
🌐 Project

#مقاله #ایده_جذاب #دیتاست

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
▪️ @css_nlp
Forwarded from AI DeepMind (Farzad 🦅)
This media is not supported in your browser
VIEW IN TELEGRAM
با این مدلهای stable diffusion به زودی میشه به صورت real time تصویر درست کرد کلی ایده و کمپانی جدید هم بوجود میاد.

🔸 Real-Time Latent Consistency Model
Image to Image

🔸 Source Code

#ایده_جذاب #مقاله

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
قبلتر راجب vector databaseها مقاله‌اب معرفی کرده بودم و اینکه ایده این چطوری به جود اومده از این مقاله متا که search engine معرفی کرده اومده به نظرم خیلی میتونین کارهای ارزشمندتری رو پیش ببرید مقالات اینده روی وِکتور دیتابیس ها خواهد بود.

▪️ Reading Wikipedia to Answer Open-Domain Questions

در ادامه توجهتون رو به این تویت شرکت ایکس( توئیتر سابق) جلب میکنم

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
آیا Memba جایگزینی برای ترنسفورمرهاست؟

https://youtu.be/ouF-H35atOY?si=aow4mIIsrHhzFhvG

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
ظاهرا قرار نیست مدل Mamba پایانی برای سلطه ترنسفورمرها باشد. RWKV مدل جدیدی که اخیرا ادعای بیشتری رو در این حیطه مطرح کرده است خواندنی هست.

▪️ RWKV: Reinventing RNNs for the Transformer Era

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad)
دیگه کسی نیاز نیست پایتون یا برنامه دیگه ای یادبگیره

https://llamacoder.together.ai/

#مقاله #ایده_جذاب #هوش_مصنوعی

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad)
کمپانی LG امروز جدیدترین و قدرتمندترین مدل EXAONE-3.0-7.8B که بزرگترین مدل LLM با آموزش بر روی 8 تریلیون توکن آموزش دیده است منتشر کرد. این مدل روی زبان های انگلیسی و کره ای آموزش دیده است.

( تا حالا از این کمپانی چیزی نشنیده بودم که در حیطه #هوش_مصنوعی فعالیتی داشته باشه گویا اولین فعالیت این شرکت باشه)

◾️ EXAONE 3.0 7.8B Instruction Tuned Language Model
◾️ Hugging face

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad)
This media is not supported in your browser
VIEW IN TELEGRAM
دختری که در واقعیت وجود نداره! کیفیت فیلم ها به نسبت چند ماه پیش افزایش چشم گیری دادشته است.

عکس این دختر توسط #هوش_مصنوعی قدرتمند FLUX (عبارت FLUX رو در کانال سرچ کنین یک سری پروژه با این مدل معرفی کردم) ساخته شده و بعد از اون با استفاده از مدل تولید ویدیوی Gen-3 Alpha متحرک و به ویدیو تبدیل شده.

🔗 Flux Pro

🔗 Flux Dev

🔗 Flux Schnell

#پروژه #مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
این #مقاله بشدت خوبیه اومدن تصویر و فیلم رو نرمالایز کردن و robustness ها رو بهتر کنترل کردن وزن دهی پارامترها رو بهتر کردن و تونستن خروجی های بهتری رو برای تولید فیلم و تصویر ایجاد کنن کسایی که روی مدلهای دیفیوژن و مشابه کار میکنین این مقاله میتونه منبع خوبی باشه براتون. یک قدم بیشتر به سمت سینمای واقعی تر با #هوش_مصنوعی نزدیک تر شدیم. نظر شما چیه؟!


◾️ ControlNeXt: Powerful and Efficient Control for Image and Video Generation
◾️ GitHub

#ایده_جذاب #الگوریتمها

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
در هفته گذشته چه مقالات و مدلهای متن بازی در #هوش_مصنوعی و #یادگیری_ماشین منتشر شد:


◾️DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search
◾️ Imagen 3
◾️ The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
◾️Diffusion Guided Language Modeling
◾️Layerwise Recurrent Router for Mixture-of-Experts
◾️LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs
◾️Training Language Models on the Knowledge Graph: Insights on Hallucinations and Their Detectability
◾️ BAM! Just Like That: Simple and Efficient Parameter Upcycling for Mixture of Experts
◾️ Gemma Scope
◾️Diversity Empowers Intelligence: Integrating Expertise of Software Engineering Agents
◾️Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers
◾️I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm
◾️Does Liking Yellow Imply Driving a School Bus? Semantic Leakage in Language Models

RAG
◾️HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction
◾️OpenResearcher: Unleashing AI for Accelerated Scientific Research

MLLM
◾️VITA: Towards Open-Source Interactive Omni Multimodal LLM
◾️mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models

VLM
◾️Mitigating Object Hallucination via Data Augmented Contrastive Tuning
◾️Towards flexible perception with visual memory
◾️VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents

AI Gen
◾️VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents
◾️ Generative Photomontage
◾️Heavy Labels Out! Dataset Distillation with Label Space Lightening
◾️ 3D Gaussian Editing with A Single Image
◾️ CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer
◾️ ControlNeXt: Powerful and Efficient Control for Image and Video Generation

Others
◾️ Body Transformer: Leveraging Robot Embodiment for Policy Learning
◾️ Machine Psychology
◾️ Med42-v2: A Suite of Clinical LLMs

#مقاله #ایده_جذاب #الگوریتمها #مدل_متن_باز

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
استاد بزرگ اندرو کارپثی لیست سیلاب های یادگیری llm رو درست کرده خیلی منابع عالیی هستش

https://github.com/karpathy/LLM101n


#ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from AI DeepMind (Farzad 🦅)
آیا #هوش_مصنوعی با توضیح خودش بهتر یاد می گیرد؟ این #مقاله به چگونگی بهبود تعمیم مدل های هوش مصنوعی و اجتناب از میانبرها را با ارزیابی توضیحات آنها بررسی می کند.

▪️ Learning by Self-Explaining

#ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person