چرا DeepSeek دنیای هوش مصنوعی را شوکه کرده است؟
طی چند روز گذشته دو مدل هوش مصنوعی از یک شرکت چینی نام DeepSeek سروصدای زیادی به راهانداخته و حتی بازار بورس دنیا را تکان داده است.
برای مثال، سهام شرکت انویدیا نزدیک به ۶۰۰ میلیارد دلار اُفت کرده که بزرگترین سقوط آزاد در تاریخ بورس جهان به شمار میآید! (هرچند تا اینجا حدود ۲۶۰ میلیارد از سقوط اولیه دوباره بازگشته).
اما مگر دیپ سیک (DeepSeek) با مدلهای زبانی جدیدش که به نامهای R1 و V3 شناخته میشوند، چه کرده که چنین موجی به راه افتاده؟ جالب است بدانید این شرکت تازه حدود یک سال قبل تاسیس شده است!
اینجا سعی میکنیم به طور خلاصه و به زبان ساده موضوع را شرح دهیم و برای این کار از توضیحات آقای مورگان براون (مدیر هوش مصنوعی شرکت دراپ باکس) هم کمک میگیریم:
در حال حاضر آموزش (train) مدلهای هوش مصنوعی بسیار پرهزینه است. مثلا شرکتهایی مانند OpenAI صدها میلیون دلار صرف دیتاسنترها و زیرساختهای سختافزاری میکنند. در هر کدام از این دیتاسنترها هزاران پردازشگر گرانقیمت (ساخت شرکت انویدیا) قرار دارد.
اما شرکت دیپ سیک ناگهان از راه رسید و بازی را عوض کرد: آنها نشان دادند که میتوان یک کار ۱۰۰ میلیون دلاری را با ۵ میلیون دلار انجام داد و به نتیجهای بسیار نزدیک دست یافت.
مدل ارائه شدهی آنها در بسیاری از کارها از GPT-4 و Claude بهتر عمل کرده و این دنیای هوش مصنوعی را تکان داده است.
آنها در فرایند تولید مدل جدید، همه چیز را از زاویهی متفاوتی نسبت به روشهای فعلی دیدهاند:
مدل آنها ۷۵ درصد حافظهی کمتری مصرف میکند و از سیستمی به نام multi-token استفاده میکند.
مدلهای فعلی مانند بچهی کلاس اولی کار میکنند: آنها متنها را به صورت کلمه به کلمه میخوانند. اما دیپ سیک عبارات طولانیتر و جملات را میبینید و به همین خاطر دو برابر سریعتر است و با این حال به اندازه ۹۰ درصد هم دقت دارد.
دیپ سیک یک کار هوشمندانهی دیگر هم انجام داده: مدلهای فعلی «همه کاره» هستند و میتوانند همزمان در نقش پزشک، معمار و برنامه نویس عمل کنند. به همین خاطر مثلا ۱.۸ تریلیون پارامتر فعال دارند.
اما دیپ سیک وظایف تخصصی را از هم جدا کرده و فقط هنگام نیاز از آنها استفاده میکند.
نتیجه این شده که هزینه آموزش مدل از ۱۰۰ میلیون دلار به ۵ میلیون رسیده. تعداد پردازشگرهای مورد نیاز از ۱۰۰ هزار به ۲ هزار رسیده و هزینه API هم حدود ۹۵ درصد ارزانتر شده است.
مدل جدید خبر خوبی برای شرکت انویدیا نیست، چون رشد فوق العادهی این شرکت مرهون نیاز مدلهای هوش مصنوعی به پردازشگرهای متعدد و گران است.
دیپ سیک طراحی مدل جدید را با یک تیم کوچک ۲۰۰ نفره انجام داده، در حالی که در شرکتهای بزرگ «سیلیکون ولی» تیمهای بزرگی روی مدلها کار میکنند.
جالب است بدانید که طی همین چند روزی که از ارائه دیپ سیک گذشته، اپلیکیشن آن در اپ استور اپل در قسمت اپلیکیشنهای رایگان به رتبه اول ارتقا پیدا کرده و «چت جیپیتی» و گوگل جمنای در جایگاه دوم و سوم قرار گرفتهاند!
البته پشت سر این شرکت، حرفهایی هم زده میشود. برای مثال برخی کارشناسان میگویند که هزینه آموزش مدل این شرکت خیلی بیشتر از ۵ میلیون دلار ادعا شده است.
اما با وجود همه این حرفها، دیپ سیک بازی را عوض کرده و اکنون رقابت بسیار جدیتر شده و البته نتیجهی آن به نفع مصرفکنندگان خواهد بود و قاعدتا بازیگران بزرگ هوش مصنوعی هم از نوآوریهای دیپ سیک استفاده خواهند کرد. چون مهمترین لطف دیپ سیک این بوده که مدلهایش را به صورت اوپن سورس یا «متن باز» ارائه کرده است.
@codebyme
طی چند روز گذشته دو مدل هوش مصنوعی از یک شرکت چینی نام DeepSeek سروصدای زیادی به راهانداخته و حتی بازار بورس دنیا را تکان داده است.
برای مثال، سهام شرکت انویدیا نزدیک به ۶۰۰ میلیارد دلار اُفت کرده که بزرگترین سقوط آزاد در تاریخ بورس جهان به شمار میآید! (هرچند تا اینجا حدود ۲۶۰ میلیارد از سقوط اولیه دوباره بازگشته).
اما مگر دیپ سیک (DeepSeek) با مدلهای زبانی جدیدش که به نامهای R1 و V3 شناخته میشوند، چه کرده که چنین موجی به راه افتاده؟ جالب است بدانید این شرکت تازه حدود یک سال قبل تاسیس شده است!
اینجا سعی میکنیم به طور خلاصه و به زبان ساده موضوع را شرح دهیم و برای این کار از توضیحات آقای مورگان براون (مدیر هوش مصنوعی شرکت دراپ باکس) هم کمک میگیریم:
در حال حاضر آموزش (train) مدلهای هوش مصنوعی بسیار پرهزینه است. مثلا شرکتهایی مانند OpenAI صدها میلیون دلار صرف دیتاسنترها و زیرساختهای سختافزاری میکنند. در هر کدام از این دیتاسنترها هزاران پردازشگر گرانقیمت (ساخت شرکت انویدیا) قرار دارد.
اما شرکت دیپ سیک ناگهان از راه رسید و بازی را عوض کرد: آنها نشان دادند که میتوان یک کار ۱۰۰ میلیون دلاری را با ۵ میلیون دلار انجام داد و به نتیجهای بسیار نزدیک دست یافت.
مدل ارائه شدهی آنها در بسیاری از کارها از GPT-4 و Claude بهتر عمل کرده و این دنیای هوش مصنوعی را تکان داده است.
آنها در فرایند تولید مدل جدید، همه چیز را از زاویهی متفاوتی نسبت به روشهای فعلی دیدهاند:
مدل آنها ۷۵ درصد حافظهی کمتری مصرف میکند و از سیستمی به نام multi-token استفاده میکند.
مدلهای فعلی مانند بچهی کلاس اولی کار میکنند: آنها متنها را به صورت کلمه به کلمه میخوانند. اما دیپ سیک عبارات طولانیتر و جملات را میبینید و به همین خاطر دو برابر سریعتر است و با این حال به اندازه ۹۰ درصد هم دقت دارد.
دیپ سیک یک کار هوشمندانهی دیگر هم انجام داده: مدلهای فعلی «همه کاره» هستند و میتوانند همزمان در نقش پزشک، معمار و برنامه نویس عمل کنند. به همین خاطر مثلا ۱.۸ تریلیون پارامتر فعال دارند.
اما دیپ سیک وظایف تخصصی را از هم جدا کرده و فقط هنگام نیاز از آنها استفاده میکند.
نتیجه این شده که هزینه آموزش مدل از ۱۰۰ میلیون دلار به ۵ میلیون رسیده. تعداد پردازشگرهای مورد نیاز از ۱۰۰ هزار به ۲ هزار رسیده و هزینه API هم حدود ۹۵ درصد ارزانتر شده است.
مدل جدید خبر خوبی برای شرکت انویدیا نیست، چون رشد فوق العادهی این شرکت مرهون نیاز مدلهای هوش مصنوعی به پردازشگرهای متعدد و گران است.
دیپ سیک طراحی مدل جدید را با یک تیم کوچک ۲۰۰ نفره انجام داده، در حالی که در شرکتهای بزرگ «سیلیکون ولی» تیمهای بزرگی روی مدلها کار میکنند.
جالب است بدانید که طی همین چند روزی که از ارائه دیپ سیک گذشته، اپلیکیشن آن در اپ استور اپل در قسمت اپلیکیشنهای رایگان به رتبه اول ارتقا پیدا کرده و «چت جیپیتی» و گوگل جمنای در جایگاه دوم و سوم قرار گرفتهاند!
البته پشت سر این شرکت، حرفهایی هم زده میشود. برای مثال برخی کارشناسان میگویند که هزینه آموزش مدل این شرکت خیلی بیشتر از ۵ میلیون دلار ادعا شده است.
اما با وجود همه این حرفها، دیپ سیک بازی را عوض کرده و اکنون رقابت بسیار جدیتر شده و البته نتیجهی آن به نفع مصرفکنندگان خواهد بود و قاعدتا بازیگران بزرگ هوش مصنوعی هم از نوآوریهای دیپ سیک استفاده خواهند کرد. چون مهمترین لطف دیپ سیک این بوده که مدلهایش را به صورت اوپن سورس یا «متن باز» ارائه کرده است.
@codebyme
👍7❤3
نظریه نامحبوب:
چه دهه شصتی باشی
چه دهه هشتادی.
چه با موبایلت برنامه نویسی شروع کرده باشی
چه اکانت پریمیوم chatgpt رو گرفته باشی.
توی مسیر موفق شدن در برنامه نویسی چیزی به اسم work life balance وجود نداره.(حداقل در ابتدای کار)
@codebyme
چه دهه شصتی باشی
چه دهه هشتادی.
چه با موبایلت برنامه نویسی شروع کرده باشی
چه اکانت پریمیوم chatgpt رو گرفته باشی.
توی مسیر موفق شدن در برنامه نویسی چیزی به اسم work life balance وجود نداره.(حداقل در ابتدای کار)
@codebyme
👍16👏2
امروز توی مصاحبه HR،
دوست HR گرانقدرمون، پرسیدن که از درب ورود ساختمون تا اتاق جلسه که اومدی، اون جعبه جلوی در رو دیدی؟ چه رنگی بود؟ رنگ مبل های لابی؟
و من اینطوری بودم که چرا؟
گفت چون میخایم ببینیم دقتت به جزییات چقدره🤓
دریغ از یه اچ آر خوب تو این کشور ...
@codebyme
دوست HR گرانقدرمون، پرسیدن که از درب ورود ساختمون تا اتاق جلسه که اومدی، اون جعبه جلوی در رو دیدی؟ چه رنگی بود؟ رنگ مبل های لابی؟
و من اینطوری بودم که چرا؟
گفت چون میخایم ببینیم دقتت به جزییات چقدره🤓
دریغ از یه اچ آر خوب تو این کشور ...
@codebyme
👍12
۵ سال دیگه:
قراره کلی برنامه نویس داشته باشیم که دانش سطحی از برنامه نویسی دارن.
تقریبا تو هیچی دیپ(عمیق) نیستن و اگر chatgpt و deepseek و ... نتونه مشکلشون حل کنه, زنگ بزنن به دوستاشون یا تو گروه های تلگرامی بپرسن که بچه ها آیا تا حالا کسی همچین مشکلی بر خورده ؟؟!!!
@codebyme
قراره کلی برنامه نویس داشته باشیم که دانش سطحی از برنامه نویسی دارن.
تقریبا تو هیچی دیپ(عمیق) نیستن و اگر chatgpt و deepseek و ... نتونه مشکلشون حل کنه, زنگ بزنن به دوستاشون یا تو گروه های تلگرامی بپرسن که بچه ها آیا تا حالا کسی همچین مشکلی بر خورده ؟؟!!!
@codebyme
👍14👏4👎1
👍13👎3😁2
امروز یوتیوب ۲۰ ساله شد.
اول سایت دوستیابی بود، ۳ تا از کارمندهای سابق پیپل ساختنش، مثلا سن و جنسیت رو مشخص میکردی و برای دیت، یار براتون پیدا میکرد. ایده موفق نشد و تصمیم گرفتن تبدیلش کنن به پلتفرم آپلود ویدیو، عکسهای نسخه اولیش هنوز تو سایت Internet Archive موجود هست.
»گیک«
@codebyme
اول سایت دوستیابی بود، ۳ تا از کارمندهای سابق پیپل ساختنش، مثلا سن و جنسیت رو مشخص میکردی و برای دیت، یار براتون پیدا میکرد. ایده موفق نشد و تصمیم گرفتن تبدیلش کنن به پلتفرم آپلود ویدیو، عکسهای نسخه اولیش هنوز تو سایت Internet Archive موجود هست.
»گیک«
@codebyme
👍3🔥2👏1👨💻1
This media is not supported in your browser
VIEW IN TELEGRAM
اینترنت استارلینک مستقیم در گوشی های موبایل اکنون در 5 کشور فعال است.
پایان دوران فیلترینگ...؟!
@codebyme
پایان دوران فیلترینگ...؟!
@codebyme
❤6👎2
"یکی از تابلو بالینیهای کمالگرایی غر غرو بودنه؛ نسبت به خود یا نسبت به دیگری".
📍خجالت بکش!، یه کم به خودت فشار بیار!، این چه مدلشه!، فقط بلدی گند بزنی!
-Dr.amani-
@codebyme
📍خجالت بکش!، یه کم به خودت فشار بیار!، این چه مدلشه!، فقط بلدی گند بزنی!
-Dr.amani-
@codebyme
👍5
تو آپدیت جدید تلگرام میتونید یه گزینهای انتخاب کنید که کسایی که جزو مخاطبینتون نیستن و تا حالا هم بهتون پیام ندادن، با پرداخت ستاره به شما بتونن بهتون پیام بدن 🙃🙃
تعداد ستارهها رو هم خودتون میتونید تعیین کنید
این امکان برای کاربرایی که تلگرامشون پریمیوم هست فعاله
@codebyme
تعداد ستارهها رو هم خودتون میتونید تعیین کنید
این امکان برای کاربرایی که تلگرامشون پریمیوم هست فعاله
@codebyme
👍4
سال نو مبارک!🥳 امیدوارم این سال جدید مانند یک حلقهی بیپایان از خلاقیت و نوآوری برایتان باشد. هر خط کدی که مینویسید، گامی به سوی تحقق رویاهایتان است. به امید اینکه کامپایل زندگیتان همیشه بدون خطا باشد!🤩
@codebyme
@codebyme
❤15
Forwarded from Code By Me
شرکت هايی که موسسشون از استنفورد فارغ التحصيل شدن.
دانشگاه به اين ميگن! شما خروجی رو نگاه کن، بازار جهان دستشونه
@codebyme
دانشگاه به اين ميگن! شما خروجی رو نگاه کن، بازار جهان دستشونه
@codebyme
👍6
۶ مرحلهی دیباگ کردن
۱. همچین چیزی امکان نداره 😏
۲. روی سیستم من که درست کار میکنه 🤓
۳. نباید این مشکل رو داشته باشه 🤨
۴. چرا این مشکل رو داره؟ 🤔
۵. آها فهمیدم چرا 💡
۶. اصلاً از اول چطور کار میکرد؟ 😂
@codebyme
۱. همچین چیزی امکان نداره 😏
۲. روی سیستم من که درست کار میکنه 🤓
۳. نباید این مشکل رو داشته باشه 🤨
۴. چرا این مشکل رو داره؟ 🤔
۵. آها فهمیدم چرا 💡
۶. اصلاً از اول چطور کار میکرد؟ 😂
@codebyme
👏3😁2👍1
اپراتورهای موبایل: تعرفه بستههای اینترنت را تا هفته آینده تغییر میدهیم
سه اپراتور «ایرانسل»، «همراه اول» و «رایتل»، هفته گذشته در نامهای به رئیس سازمان تنظیم مقررات و ارتباطات رادیویی اعلام کردهاند حداکثر تا هفته آینده بستههای اینترنت جدید با قیمتهای بالاتر ارائه میکنند.
+ کاش یک مقدار افزایش کیفیت رو هم مثل افزایش پی در پی تعرفه بلد بودین!
_Digiato_
@codebyme
سه اپراتور «ایرانسل»، «همراه اول» و «رایتل»، هفته گذشته در نامهای به رئیس سازمان تنظیم مقررات و ارتباطات رادیویی اعلام کردهاند حداکثر تا هفته آینده بستههای اینترنت جدید با قیمتهای بالاتر ارائه میکنند.
+ کاش یک مقدار افزایش کیفیت رو هم مثل افزایش پی در پی تعرفه بلد بودین!
_Digiato_
@codebyme
👎8
توسعهدهندگان و علاقهمندان به دادهها! اگر به دنبال یک ابزار کارآمد برای جمعآوری اطلاعات در زمان واقعی هستید، حتماً نگاهی به این داشبورد وباسکرپینگ با پایتون بیندازید! وباسکرپینگ به شما این امکان را میدهد که اطلاعات موردنظر را بهصورت خودکار استخراج کنید و در کمترین زمان، بینشهای ارزشمندی کسب کنید. این پروژه به شما نشان میدهد که چطور میتوانید با کمی خلاقیت و کدنویسی، دادهها را بهراحتی جمعآوری کنید. در دنیای امروزی که اطلاعات نقش کلیدی دارند، داشتن چنین ابزاری میتواند مزیت بزرگی باشد. برای بررسی دقیقتر به لینک زیر مراجعه کنید!
👉(https://dev.to/resource_bunk_1077cab07da/i-built-a-real-time-web-scraping-dashboard-with-python-2jho)
#وب_اسکرپینگ #پایتون
منبع: https://dev.to/resource_bunk_1077cab07da/i-built-a-real-time-web-scraping-dashboard-with-python-2jho
@codebyme
👉(https://dev.to/resource_bunk_1077cab07da/i-built-a-real-time-web-scraping-dashboard-with-python-2jho)
#وب_اسکرپینگ #پایتون
منبع: https://dev.to/resource_bunk_1077cab07da/i-built-a-real-time-web-scraping-dashboard-with-python-2jho
@codebyme
🔥3
یه کامند باحال یادتون بدم. اگه دوست دارید بدونید کل پروژتون چن خط کد هست. کامند زیر رو بزنید:
@codebyme
git ls-files | grep '\.js' | xargs wc -l
@codebyme
👍6
Code By Me
یه کامند باحال یادتون بدم. اگه دوست دارید بدونید کل پروژتون چن خط کد هست. کامند زیر رو بزنید: git ls-files | grep '\.js' | xargs wc -l @codebyme
یه کامند باحال تر بگم. اگه دوست دارید بدونید توی پروژتون. هرکسی چند خط کد زده. میتونید از این کامند استفاده کنید:
@codebyme
git ls-files | xargs -n1 git blame --line-porcelain | sed -n 's/^author //p' | sort -f | uniq -ic | sort -nr
@codebyme
👍5
شما بزرگ ترین دشمنان و خلافکاران بر علیه شرکت های تولید نرم افزار در جهان رو در تصویر میبینید!😂
رئیس سایت سافت ۹۸ و پی سی دانلود در یک قاب
@codebyme
رئیس سایت سافت ۹۸ و پی سی دانلود در یک قاب
@codebyme
👍6❤4😁4