افزایش مارکت کپ NVIDIA به سه تریلیون دلار
ارزش کمپانی NVIDIA با عبور از اپل برای اولین بار به ۳ تریلیون دلار رسید! البته در زمان نوشتن این پست ارزش آن از اپل کاهش یافته و به کمتر از ۳ تریلیون دلار رسیده است. برای مشاهده آنلاین ارزش کمپانیها اینجا را مشاهده کنید (منبع خبر).
#nvidia
@dumannewsletter
ارزش کمپانی NVIDIA با عبور از اپل برای اولین بار به ۳ تریلیون دلار رسید! البته در زمان نوشتن این پست ارزش آن از اپل کاهش یافته و به کمتر از ۳ تریلیون دلار رسیده است. برای مشاهده آنلاین ارزش کمپانیها اینجا را مشاهده کنید (منبع خبر).
#nvidia
@dumannewsletter
خبرنامه هوش مصنوعی دومان
استارتاپ فرانسوی Mistral مدل زبانی مخصوص برنامهنویسی خود را با نام Codestral معرفی کرد. این مدل ۲۲ میلیارد پارامتر داشته و بیش از ۸۰ زبان برنامهنویسی را ساپورت میکند. در این جدول عملکرد این مدل زبانی با نمونههای مشابه در ۶ زبان برنامهنویسی مقایسه شده…
دسترسی به مدلهای Mistral
برای دسترسی رایگان به مدلهای Mistral و مدل جدید Codestral وارد اینجا شده و در پایین باکس ورودی نوع مدل را خود را انتخاب کنید.
#codestral
#mistral
@dumannewsletter
برای دسترسی رایگان به مدلهای Mistral و مدل جدید Codestral وارد اینجا شده و در پایین باکس ورودی نوع مدل را خود را انتخاب کنید.
#codestral
#mistral
@dumannewsletter
کشف آنتی بیوتیک با استفاده از یادگیری ماشین
محققان دانشگاه پنسیلوانیا با استفاده از یادگیری ماشین (Machine Learning) بیش از یک میلیون آنتی بیوتیک جدید را شناسایی کردند. کشف داروی جدید با استفاده از روشهای قدیمی ۱۰ الی ۲۰ سال زمان نیاز دارد. به گفته سازمان بهداشت جهانی استفاده گسترده از آنتی بیوتیک در انسان و حیوانات منجر به مقاومت آنتیبیوتیکی و کم اثر/بی اثر شدن داروهای موجود خواهد شد، از این رو شناسایی داروهای جدید برای آینده بشر اهمیت زیادی دارد. استفاده از یادگیری ماشین در کشف داروهای جدید یکی از شاخههای مورد توجه در این حوزه است که در سالهای اخیر سرمایه هنگفتی را به سمت خود جذب کرده است. یکی از پروژههای موفق در این حوزه، پروژه #alphafold گوگل DeepMind است که در شناسایی ساختار پروتئینها و نحوه تعامل آنها مورد استفاده قرار گرفته است (منبع).
#drug_discovery
@dumannewsletter
محققان دانشگاه پنسیلوانیا با استفاده از یادگیری ماشین (Machine Learning) بیش از یک میلیون آنتی بیوتیک جدید را شناسایی کردند. کشف داروی جدید با استفاده از روشهای قدیمی ۱۰ الی ۲۰ سال زمان نیاز دارد. به گفته سازمان بهداشت جهانی استفاده گسترده از آنتی بیوتیک در انسان و حیوانات منجر به مقاومت آنتیبیوتیکی و کم اثر/بی اثر شدن داروهای موجود خواهد شد، از این رو شناسایی داروهای جدید برای آینده بشر اهمیت زیادی دارد. استفاده از یادگیری ماشین در کشف داروهای جدید یکی از شاخههای مورد توجه در این حوزه است که در سالهای اخیر سرمایه هنگفتی را به سمت خود جذب کرده است. یکی از پروژههای موفق در این حوزه، پروژه #alphafold گوگل DeepMind است که در شناسایی ساختار پروتئینها و نحوه تعامل آنها مورد استفاده قرار گرفته است (منبع).
#drug_discovery
@dumannewsletter
خبرنامه هوش مصنوعی دومان
نسخه ۳ آلفافولد (AlphaFold) توسط گوگل DeepMind معرفی شد! نسخه ۳ مدل هوشمصنوعی AlphaFold با همکاری گوگل DeepMind و Isomorphic Labs توسعه داده شده است. این مدل برای پیشبینی ساختار مولکولهای پروتئین، DNA، RNA و سایر اجزای بیولوژیکی سازنده حیات و نحوه تعامل…
☝️ پروژه Alpha Fold گوگل DeepMind
This media is not supported in your browser
VIEW IN TELEGRAM
بالاخره اپل در کنفرانس WWDC24 جدیدترین خدمات خود در حوزه AI را با عنوان Apple Intelligence معرفی کرد. Apple Intelligence در واقع یک دستیار مبتنی بر AI است که در محصولات مختلف آیفون، آیپد و مک از طریق صوت و نوشتن در دسترس کاربر قرار خواهد گرفت. مهمترین قابلیتهای آن عبارتند از:
۱. کاربر میتواند از آن برای نوشتن و خلاصهبرداری استفاده کند (Writing Tools)
۲. کاربر میتواند با نوشتن ایموجی مورد نیاز خود را بسازد (Genmoji)
۳. کاربر میتواند با شرح دادن جزئیات تصویر مورد نظر خود را تولید کند (Image playground)
۴. کاربر میتواند اسکچ را به تصویر تبدیل کند (Image Wand)
۵. با فراهم کردن قابلیتهای هوش مصنوعی مولد برای سیری (Siri) آن را هوشمندتر از قبل و شخصی سازی شده در اختیار کاربر قرار میدهد.
این قابلیتها از طریق مدلهای OpenAI فراهم شده و کاربران اپل نیازی به ساختن اکانت و پرداخت اشتراک به OpenAI نخواهند داشت. نسخه بتای Apple Intelligence در سیستم عاملهای iOS18 ، iPadOS 18 و macOS Sequoia از پاییز امسال برای کاربران آمریکایی در دسترس قرار خواهد گرفت (منبع).
#apple
@dumannewsletter
۱. کاربر میتواند از آن برای نوشتن و خلاصهبرداری استفاده کند (Writing Tools)
۲. کاربر میتواند با نوشتن ایموجی مورد نیاز خود را بسازد (Genmoji)
۳. کاربر میتواند با شرح دادن جزئیات تصویر مورد نظر خود را تولید کند (Image playground)
۴. کاربر میتواند اسکچ را به تصویر تبدیل کند (Image Wand)
۵. با فراهم کردن قابلیتهای هوش مصنوعی مولد برای سیری (Siri) آن را هوشمندتر از قبل و شخصی سازی شده در اختیار کاربر قرار میدهد.
این قابلیتها از طریق مدلهای OpenAI فراهم شده و کاربران اپل نیازی به ساختن اکانت و پرداخت اشتراک به OpenAI نخواهند داشت. نسخه بتای Apple Intelligence در سیستم عاملهای iOS18 ، iPadOS 18 و macOS Sequoia از پاییز امسال برای کاربران آمریکایی در دسترس قرار خواهد گرفت (منبع).
#apple
@dumannewsletter
خبرنامه هوش مصنوعی دومان
رگولاتوری هوشمصنوعی در اتحادیه اروپا به دنبال افزایش نگرانیها درباره خطرات هوشمصنوعی، پارلمان اتحادیه اروپا پیشنویس قانون هوشمصنوعی موسوم به The AI Act را تصویب کرد. نوشتن این قانون از سال ۲۰۲۱ آغاز شده است و تا عملیاتی شدن آن چند سالی باقی مانده است.…
یکسال از شروع خبرنامه هوش مصنوعی دومان گذشت...
خبرنامه هوش مصنوعی دومان
بالاخره اپل در کنفرانس WWDC24 جدیدترین خدمات خود در حوزه AI را با عنوان Apple Intelligence معرفی کرد. Apple Intelligence در واقع یک دستیار مبتنی بر AI است که در محصولات مختلف آیفون، آیپد و مک از طریق صوت و نوشتن در دسترس کاربر قرار خواهد گرفت. مهمترین قابلیتهای…
ارزش هر سهم اپل بعد از اعلام همکاری با OpenAI رکورد قبلی خود را شکست. این خوشبینی سهامداران باعث افزایش ارزش بازار اپل به بیش از سه تریلیون دلار شد و با اندکی اختلاف بعد از مایکروسافت به عنوان با ارزشترین کمپانی جهان قرار گرفت. همکاری OpenAI و اپل انحصاری نبوده و مذاکرات مشابهی با گوگل و آنتروپیک در حال انجام است. همچنین با توجه به فیلتر بودن چتباتهای آمریکایی در چین انتظار میرود چنین همکاری مشترکی با چتباتهای چینی نیز در آینده انجام شود. در همکاری اپل و OpenAI هیچ یک از طرفین هزینهای پرداخت نکرده و انتظار میرود دسترسی به کاربران اپل فرصت فروش اشتراک پلاس/پریمیوم و افزایش درآمد را برای OpenAI فراهم سازد. در حال حاضر سه کمپانی مایکروسافت، اپل و NVIDIA ارزش سه تریلیون دلاری داشته و در رتبه چهارم گوگل با اختلاف بسیار زیادی قرار گرفته است. در چند سال اخیر اپل مدل هوش مصنوعی قدرتمندی برای رقابت با بازیگران اصلی این حوزه معرفی نکرده است. سرویس Apple Intelligence نیز نوآوری جدیدی نداشته و تنها قابلیتهای هوش مصنوعی مولد را از طریق سرویسهای خارجی برای اکوسیستم اپل فراهم خواهد کرد.
#apple
@dumannewsletter
#apple
@dumannewsletter
شرکت Luma Labs سرویس تولید ویدئوی Dream Machine را معرفی کرد. از اینجا میتوانید به صورت رایگان و محدود از این سرویس استفاده کنید.
#luma_labs
@dumannewsletter
#luma_labs
@dumannewsletter
توسعه مربی سلامتی توسط Thrive AI Health
استارتاپ Thrive AI Health با جذب سرمایه از VCهای OpenAI Startup Fund و Thrive Global اعلام کرد در حال توسعه مربی شخصی سلامتی بر پایه AI است. این مربی به صورت چند وجهی (Multimodal) عمل خواهد کرد. منظور از چند وجهی بودن ایجنت هوشمصنوعی امکان دریافت دیتا به شکلهای مختلف متن، ویدئو و صوت است. این مربی با استفاده از دادههای علمی، بیومتریک و علایق کاربر بهترین توصیههای شخصی در حوزههایی نظیر خواب، تغذیه، ورزش، مدیریت استرس و ارتباطات اجتماعی را برای کاربر فراهم خواهد کرد. به بهانه این سرمایهگذاری سم آلتمن و آریانا هافینگتون مدیران VCهای نامبرده در مقالهای به تشریح پتانسیل AI در توسعه حوزه سلامت پرداختند. توسعه ایجنتهای بر پایه هوشمصنوعی در حوزه سلامت قبلا توسط شرکتهای گوگل، IBM و بابیلون انجام شده و دستاورد چشمگیری به همراه نداشته است. به عنوان نمونه استارتاپ بابیلون که زمانی به ارزش بیش از ۴ میلیارد دلار رسیده بود در نهایت در سال ۲۰۲۳ ورشکست شد. حفظ حریم شخصی کاربر یکی از مهمترین چالشهای توسعه چنین سرویسهایی است (منبع).
#thrive_ai_health
@dumannewsletter
استارتاپ Thrive AI Health با جذب سرمایه از VCهای OpenAI Startup Fund و Thrive Global اعلام کرد در حال توسعه مربی شخصی سلامتی بر پایه AI است. این مربی به صورت چند وجهی (Multimodal) عمل خواهد کرد. منظور از چند وجهی بودن ایجنت هوشمصنوعی امکان دریافت دیتا به شکلهای مختلف متن، ویدئو و صوت است. این مربی با استفاده از دادههای علمی، بیومتریک و علایق کاربر بهترین توصیههای شخصی در حوزههایی نظیر خواب، تغذیه، ورزش، مدیریت استرس و ارتباطات اجتماعی را برای کاربر فراهم خواهد کرد. به بهانه این سرمایهگذاری سم آلتمن و آریانا هافینگتون مدیران VCهای نامبرده در مقالهای به تشریح پتانسیل AI در توسعه حوزه سلامت پرداختند. توسعه ایجنتهای بر پایه هوشمصنوعی در حوزه سلامت قبلا توسط شرکتهای گوگل، IBM و بابیلون انجام شده و دستاورد چشمگیری به همراه نداشته است. به عنوان نمونه استارتاپ بابیلون که زمانی به ارزش بیش از ۴ میلیارد دلار رسیده بود در نهایت در سال ۲۰۲۳ ورشکست شد. حفظ حریم شخصی کاربر یکی از مهمترین چالشهای توسعه چنین سرویسهایی است (منبع).
#thrive_ai_health
@dumannewsletter
کمپانی سرمایهگذاری a16z تعداد GPUهای خود را به بیش از ۲۰ هزار عدد افزایش خواهد داد. این زیرساخت امکان اجاره منابع پردازشی به استارتاپهای تحت حمایت a16z در ازای سهام را میسر خواهد کرد. دسترسی به منابع پردازشی یکی از پیشنیازهای اساسی در رقابت حوزه هوشمصنوعی مولد است. در حال حاضر a16z یکی از بزرگترین شرکتهای VC در حوزه هوشمصنوعی مولد است و فراهم چنین زیرساختی این موقعیت را بیشتر از گذشته تقویت خواهد کرد (منبع).
#a16z
#هوش_مصنوعی
@dumannewsletter
#a16z
#هوش_مصنوعی
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تولید ویدئو با استفاده از Luma Dream Machine
با استفاده از سرویس Luma Dream Machine میتوانید ویدئوی کوتاه خود را با نوشتن متن و آپلود عکس تولید کنید. همچنین این سرویس امکان extend کردن ویدئو با نوشتن prompt جدید را برای کاربر فراهم میسازد. برای دسترسی محدود و رایگان به این سرویس اینجا را مشاهده کنید.
پرامپت استفاده شده در این ویدئو:
#آموزشی
#هوش_مصنوعی
#luma
@dumannewsletter
با استفاده از سرویس Luma Dream Machine میتوانید ویدئوی کوتاه خود را با نوشتن متن و آپلود عکس تولید کنید. همچنین این سرویس امکان extend کردن ویدئو با نوشتن prompt جدید را برای کاربر فراهم میسازد. برای دسترسی محدود و رایگان به این سرویس اینجا را مشاهده کنید.
پرامپت استفاده شده در این ویدئو:
A tree with monkey on it
#آموزشی
#هوش_مصنوعی
#luma
@dumannewsletter
ساخت کلاستر GPU توسط ایلان ماسک
ایلان ماسک مدیرعامل xAI در پلتفرم x اعلام کرد، این کمپانی در حال ساخت کلاستر پردازشی با بیش از ۱۰۰ هزار پردازنده NVIDIA H100 است! پردازندههای NVIDIA H100 از بهترین پردازندههای گرافیکی (GPU) موجود در بازار بوده که در توسعه مدلهای بزرگ زبانی مورد استفاده قرار میگیرد. ارزش تخمینی هر NVIDIA H100 در بازار حدود ۴۰ هزار دلار قیمتگذاری میشود. در حال حاضر xAI مدل زبانی Grok2 را با استفاده از ۲۴ هزار پردازنده NVIDIA H100 که از اوراکل اجاره کرده توسعه داده است. طبق دیدگاه ایلان ماسک برای رقابتپذیری در این عرصه توسعه چنین زیرساختی موردنیاز بوده و نمیتوان برای آن به شرکتهای دیگر وابسته بود.
#xai
#elon_musk
#هوش_مصنوعی
@dumannewsletter
ایلان ماسک مدیرعامل xAI در پلتفرم x اعلام کرد، این کمپانی در حال ساخت کلاستر پردازشی با بیش از ۱۰۰ هزار پردازنده NVIDIA H100 است! پردازندههای NVIDIA H100 از بهترین پردازندههای گرافیکی (GPU) موجود در بازار بوده که در توسعه مدلهای بزرگ زبانی مورد استفاده قرار میگیرد. ارزش تخمینی هر NVIDIA H100 در بازار حدود ۴۰ هزار دلار قیمتگذاری میشود. در حال حاضر xAI مدل زبانی Grok2 را با استفاده از ۲۴ هزار پردازنده NVIDIA H100 که از اوراکل اجاره کرده توسعه داده است. طبق دیدگاه ایلان ماسک برای رقابتپذیری در این عرصه توسعه چنین زیرساختی موردنیاز بوده و نمیتوان برای آن به شرکتهای دیگر وابسته بود.
#xai
#elon_musk
#هوش_مصنوعی
@dumannewsletter
نگرانیهای برنده جایزه تورینگ نسبت به آینده هوشمصنوعی
یوشوا بنجیو (Yoshua Bengio) برنده جایزه تورینگ و از پیشکسوتان علم کامپیوتر در بلاگ خود نسبت به آینده هوشمصنوعی و توسعه AGI ابراز نگرانی کرد. AGI سطحی از هوشمصنوعی است که مشابه انسان محدود به یک حوزه و یا تسک خاص نبوده و اصطلاحاً Generality دارد. در حال حاضر کمپانیهای بزرگی نظیر گوگل و مایکروسافت در حال توسعه چنین سیستمی هستند. AGI برخلاف سیستمهای هوشمصنوعی حال حاضر توانایی به چالش کشیدن انسان و حتی برتری از آن را نیز خواهد داشت. تعدادی از نکات مهم این بلاگ پست به طور خلاصه:
- در حال حاضر هیچ سازوکاری برای اطمینان از رعایت اصول اخلاقی توسط AGI وجود ندارد!
- بشر باید مطمئن شود که هیچ کسی نمیتواند از AGI سواستفاده کند.
- آیا انتشار عمومی هر چیزی (به عنوان مثال DNA یک ویروس خطرناک) به صلاح بشریت است؟ در مورد اطلاعات فنی AGI چطور؟
نموداری که در تصویر مشاهده میکنید، نزدیک شدن بهرهوری مدلهای هوشمصنوعی به سطح انسان در بنچمارکهای مختلف را نشان میدهد.
#agi
#yoshua_bengio
#هوش_مصنوعی
@dumannewsletter
یوشوا بنجیو (Yoshua Bengio) برنده جایزه تورینگ و از پیشکسوتان علم کامپیوتر در بلاگ خود نسبت به آینده هوشمصنوعی و توسعه AGI ابراز نگرانی کرد. AGI سطحی از هوشمصنوعی است که مشابه انسان محدود به یک حوزه و یا تسک خاص نبوده و اصطلاحاً Generality دارد. در حال حاضر کمپانیهای بزرگی نظیر گوگل و مایکروسافت در حال توسعه چنین سیستمی هستند. AGI برخلاف سیستمهای هوشمصنوعی حال حاضر توانایی به چالش کشیدن انسان و حتی برتری از آن را نیز خواهد داشت. تعدادی از نکات مهم این بلاگ پست به طور خلاصه:
- در حال حاضر هیچ سازوکاری برای اطمینان از رعایت اصول اخلاقی توسط AGI وجود ندارد!
- بشر باید مطمئن شود که هیچ کسی نمیتواند از AGI سواستفاده کند.
- آیا انتشار عمومی هر چیزی (به عنوان مثال DNA یک ویروس خطرناک) به صلاح بشریت است؟ در مورد اطلاعات فنی AGI چطور؟
نموداری که در تصویر مشاهده میکنید، نزدیک شدن بهرهوری مدلهای هوشمصنوعی به سطح انسان در بنچمارکهای مختلف را نشان میدهد.
#agi
#yoshua_bengio
#هوش_مصنوعی
@dumannewsletter
ساخت Presentation با استفاده از سرویس هوشمصنوعی Gemma
سرویس Gemma امکان ساخت Presentation با استفاده از قابلیتهای هوشمصنوعی مولد و نوشتن Prompt را فراهم میسازد. این سرویس خروجی Presentation را با فرمتهای PDF و Power Point در اختیار کاربر قرار میدهد. جهت تست و استفاده محدود از این سرویس اینجا را مشاهده کنید.
#آموزشی
@dumannewsletter
سرویس Gemma امکان ساخت Presentation با استفاده از قابلیتهای هوشمصنوعی مولد و نوشتن Prompt را فراهم میسازد. این سرویس خروجی Presentation را با فرمتهای PDF و Power Point در اختیار کاربر قرار میدهد. جهت تست و استفاده محدود از این سرویس اینجا را مشاهده کنید.
#آموزشی
@dumannewsletter
Robust_and_interpretable_AI_guided_marker_for_early_dementia_prediction.pdf
920.6 KB
محققان دانشگاه کمریج روش جدیدی مبتنی بر هوشمصنوعی برای پیشبینی آلزایمر ارائه کردند. این ابزار جدید نیازی به روشهای هزینهبر و تهاجمی نظیر PET Scan نداشته و با ۸۰ درصد دقت تشخیص انجام میدهد.
#alzheimer
@dumannewsletter
#alzheimer
@dumannewsletter
شرکت فرانسوی Mistral دو مدل جدید زبانی را معرفی کرد.
مدل Codestral Mamba با ۷ میلیارد پارامتر مخصوص کد نویسی است. این مدل از نمونههای اپنسورس مشابه نظیر CodeGemma و CodeLlama عملکرد بهتری دارد. سایز Context آن نیز ۲۵۶ کیلوبایت است.
مدل Mathstral نیز دارای ۷ میلیارد پارامتر بوده و مخصوص حل مسائل استنتاجی و ریاضی است. این مدل در بنچمارک MATH عملکرد ۵۶.۶ درصدی و در بنچمارک MMLU عملکرد ۶۳.۴۷ درصدی داشته است. هر دو مدل به صورت اپنسورس تحت لایسنس Apache 2.0 منتشر شدهاند.
#mistral
@dumannewsletter
مدل Codestral Mamba با ۷ میلیارد پارامتر مخصوص کد نویسی است. این مدل از نمونههای اپنسورس مشابه نظیر CodeGemma و CodeLlama عملکرد بهتری دارد. سایز Context آن نیز ۲۵۶ کیلوبایت است.
مدل Mathstral نیز دارای ۷ میلیارد پارامتر بوده و مخصوص حل مسائل استنتاجی و ریاضی است. این مدل در بنچمارک MATH عملکرد ۵۶.۶ درصدی و در بنچمارک MMLU عملکرد ۶۳.۴۷ درصدی داشته است. هر دو مدل به صورت اپنسورس تحت لایسنس Apache 2.0 منتشر شدهاند.
#mistral
@dumannewsletter
معرفی اپلیکیشن دیزاینر مایکروسافت برای ساخت و ویرایش تصاویر با استفاده از AI
با استفاده از اپلیکیشن دیزاینر مایکروسافت میتوانید تصویر، آواتار و یا ایموجی مورد نیاز خود را تنها با نوشتن Prompt تولید کنید. علاوه بر آن این اپلیکیشن امکان ویرایش تصاویر کاربر با استفاده از هوشمصنوعی را فراهم میسازد. شما میتوانید از این اپلیکیشن به صورت رایگان با محدودیت روزانه استفاده کرده و یا با خرید اشتراک به صورت نامحدود از قابلیتهای آن استفاده کنید. برای استفاده از آن باید اکانت مایکروسافت بسازید.
👈 نسخه مبتنی بر وب
👈 نسخه اندروید
👈 نسخه iOS
#designer
#microsoft
#آموزشی
#هوش_مصنوعی
@dumannewsletter
با استفاده از اپلیکیشن دیزاینر مایکروسافت میتوانید تصویر، آواتار و یا ایموجی مورد نیاز خود را تنها با نوشتن Prompt تولید کنید. علاوه بر آن این اپلیکیشن امکان ویرایش تصاویر کاربر با استفاده از هوشمصنوعی را فراهم میسازد. شما میتوانید از این اپلیکیشن به صورت رایگان با محدودیت روزانه استفاده کرده و یا با خرید اشتراک به صورت نامحدود از قابلیتهای آن استفاده کنید. برای استفاده از آن باید اکانت مایکروسافت بسازید.
👈 نسخه مبتنی بر وب
👈 نسخه اندروید
👈 نسخه iOS
#designer
#microsoft
#آموزشی
#هوش_مصنوعی
@dumannewsletter
انتشار نسخه ارزان GPT-4o mini
شرکت OpenAI ارزانترین مدل کارآمد خود را با نام GPT-4o mini منتشر کرد. قیمت دسترسی به APIهای این مدل ۱۵ سنت به ازای یک میلیون توکن ورودی و ۶۰ سنت به ازای یک میلیون توکن خروجی است (سایز ورودی و خروجی ریکوئست در محاسبه هزینه مدلهای زبانی لحاظ میشود). تا قبل از معرفی این نسخه ارزانترین مدل OpenAI نسخه GPT-3.5 Turbo بود. به این ترتیب با معرفی GPT-4o mini ارزانترین مدل OpenAI حدود ۶۰ درصد ارزانتر شده است! ضمن کاهش قابل توجه هزینه، بهرهوری نسخه GPT-4o mini در بنچمارکهای مختلف از نسخه GPT-3.5 Turbo بهتر است. قرار است در آینده نزدیک فرمهای مختلف دیتا نیز توسط GPT-4o mini ساپورت شود. سایز Context Window آن ۱۲۸ کیلوبایت بوده و دیتای استفاده شده برای آموزش آن تا اکتبر ۲۰۲۳ به روز بوده است. این کاهش هزینه امکان استفاده از مدلهای زبانی را در اپلیکیشنهای بیشتری میسر میسازد (جزئیات بیشتر).
#openai
#gpt4o
#gpt4o_mini
#هوش_مصنوعی
@dumannewsletter
شرکت OpenAI ارزانترین مدل کارآمد خود را با نام GPT-4o mini منتشر کرد. قیمت دسترسی به APIهای این مدل ۱۵ سنت به ازای یک میلیون توکن ورودی و ۶۰ سنت به ازای یک میلیون توکن خروجی است (سایز ورودی و خروجی ریکوئست در محاسبه هزینه مدلهای زبانی لحاظ میشود). تا قبل از معرفی این نسخه ارزانترین مدل OpenAI نسخه GPT-3.5 Turbo بود. به این ترتیب با معرفی GPT-4o mini ارزانترین مدل OpenAI حدود ۶۰ درصد ارزانتر شده است! ضمن کاهش قابل توجه هزینه، بهرهوری نسخه GPT-4o mini در بنچمارکهای مختلف از نسخه GPT-3.5 Turbo بهتر است. قرار است در آینده نزدیک فرمهای مختلف دیتا نیز توسط GPT-4o mini ساپورت شود. سایز Context Window آن ۱۲۸ کیلوبایت بوده و دیتای استفاده شده برای آموزش آن تا اکتبر ۲۰۲۳ به روز بوده است. این کاهش هزینه امکان استفاده از مدلهای زبانی را در اپلیکیشنهای بیشتری میسر میسازد (جزئیات بیشتر).
#openai
#gpt4o
#gpt4o_mini
#هوش_مصنوعی
@dumannewsletter
معرفی مدلهای کوچک زبانی SmolLM توسط HF
شرکت HuggingFace مجموعهای از مدلهای زبانی کوچک را با نام SmolLM به صورت اپنسورس منتشر کرد. در حال حاضر این مجموعه شامل سه مدل زبانی با سایزهای ۱۳۵ میلیون، ۳۶۰ میلیون و ۱.۷ میلیارد پارامتر است. معرفی چنین مدلهایی امکان استفاده از قابلیتهای هوشمصنوعی مولد را به صورت لوکال و آفلاین فراهم میسازد. در این تصویر این مدلها با نمونههای مشابه در بنچمارکهای مختلف مقایسه شده است. برای مطالعه جزئیات فنی درباره این مدلها اینجا را بخوانید.
#hugging_face
#smollm
#هوش_مصنوعی
@dumannewsletter
شرکت HuggingFace مجموعهای از مدلهای زبانی کوچک را با نام SmolLM به صورت اپنسورس منتشر کرد. در حال حاضر این مجموعه شامل سه مدل زبانی با سایزهای ۱۳۵ میلیون، ۳۶۰ میلیون و ۱.۷ میلیارد پارامتر است. معرفی چنین مدلهایی امکان استفاده از قابلیتهای هوشمصنوعی مولد را به صورت لوکال و آفلاین فراهم میسازد. در این تصویر این مدلها با نمونههای مشابه در بنچمارکهای مختلف مقایسه شده است. برای مطالعه جزئیات فنی درباره این مدلها اینجا را بخوانید.
#hugging_face
#smollm
#هوش_مصنوعی
@dumannewsletter