میزان فروش لبوبو تو باسلام رو حساب کردم و سرسام آور بود
ببین چه جیب هایی سر یه تیکه پلاستیک خالی نشده
ببین چه جیب هایی سر یه تیکه پلاستیک خالی نشده
👍5🤣1
امروز اگه بتونم یه مطلب درمورد چرا نباید از classic rag استفاده کنیم میذارم
👍4❤1
Msnp's binary thoughts
امروز اگه بتونم یه مطلب درمورد چرا نباید از classic rag استفاده کنیم میذارم
"Online-Optimized RAG for Tool Use and Function Calling" (2024)
❤2👍1
الان تو بازه ای هستم که باید چند تا تصمیم سخت ددلاین دار بگیرم
خیلی کم حرف شدم بیشتر تو خودمم و فکر میکنم و حس بلا تکلیفی وجودمو گرفته
خیلی کم حرف شدم بیشتر تو خودمم و فکر میکنم و حس بلا تکلیفی وجودمو گرفته
Forwarded from The Machine
به ناامیدی از این در مرو، بزن فالی
بُوَد که قرعهٔ دولت به نامِ ما افتد
حافظ
بُوَد که قرعهٔ دولت به نامِ ما افتد
حافظ
❤4
تو دبستان خیلی اوقات بدون اینکه بخونم یا تلاش زیادی بکنم نمرات بالایی داشتم و همیشه دلم میخواست که بتونم با افراد سطح بالا تری تعامل داشته باشم برا همین از نداشتن دوست و آدمایی که باهاشون بتونم صحبت کنم اذیت میشدم و طبق چیزایی که اطرافیان برای تیزهوشان و مدارس خارق العاده سمپاد میگفتن کلی له له میزدم که قبول بشم ولی خب وقتی تونستم قبول شم دیدم که خب خیلی اوضاع فرق نکرد آدما عوض نشد و خیلی چیز خاصی اتفاق نیفتاد و منم واقعا افسرده شدم برا همین بیشتر وقتمو تو آزمایشگاه مدرسه میگذروندم و یعدش وارد یه جمع «سمن» شدم به اسم رویش که کلا رویکرد تربیتی و آموزشی داشتن منم اونجا کلاسای برنامه نویسی و فتوشاپ و تدوین ویدیو رفتم و کلی چیز یاد گرفتم و خیلی تونست تو بزرگ تر شدن شخصیتم تاثیر بذاره بعدش خب دبیرستان دوره دوم اومد به قول امروزی ها ترند المپیاد گرم شد من چند تا تلاش ناموفق داشتم اونجا و این بحث تو ذهنم بزرگ شد که واقعا من باهوشم و شروع کردم مقایسه با بقیه و دیدم خب اونام چیزی کم ندارن بلد میتونن ضرب و جمع کنن و میتونن حفظ کنن حتی بهتر از من پس منم اومدم گفتم که حداقل سخت کوش تر باشم این یه معیار به ظاهر کمی بود برام و خودمو تو اتاق با کتابا قفل میکردم و با خودم میگفتم که بدون هوش باید به نتیجه برسم و خب نتیجه اش افسردگی و پیدا کردن خلق ذاهد ماب بود و خب کرونا و کنکور لعنتی باهم همزمان شدن و منم با این امید جلو رفتم که چیزی که تا الان ساختم برنامه نویسی هایی که کردم اون عید هایی که تمومشونو برا خودم پروژه تعیین میکردم و همشونو کار میکردم نباید نابود بشن پس تمام سعی و تلاشمو برا کنکور کردم تا جلو بره و بتونم یه جای خوب قبول بشم با اینکه کنکورمو خراب کردم تونستم علم و صنعت قبول شم.
---
بعد این همه سال گذشتن
بازم همون حس اومده جلوم با اینکه تو کارم خوب جلو میرم ولی نمیدونم چرا
با اینکه بقیه میان سوالاشونو ازم میپرسن و فکر میکنم منو تو ذهنشون قبول دارن حس میکنم همچی داره بیش از حد داره ساده و روتین جلو میره و منم نمیدونم چرا
باید ببینم چطور جلو میرم و اوضاع رو بهتر کنم
و واقعا دارم جلو یسری تصمیم های مهم میبینم و حس میکنم که تو توی زندگیت سعی و تلاش میکنی تا موقعیت های تصمیم گیری جلوت بیان و بری جلو تصمیم بگیری و منم الان تو یکی از اونا گیر کردم
---
بعد این همه سال گذشتن
بازم همون حس اومده جلوم با اینکه تو کارم خوب جلو میرم ولی نمیدونم چرا
با اینکه بقیه میان سوالاشونو ازم میپرسن و فکر میکنم منو تو ذهنشون قبول دارن حس میکنم همچی داره بیش از حد داره ساده و روتین جلو میره و منم نمیدونم چرا
باید ببینم چطور جلو میرم و اوضاع رو بهتر کنم
و واقعا دارم جلو یسری تصمیم های مهم میبینم و حس میکنم که تو توی زندگیت سعی و تلاش میکنی تا موقعیت های تصمیم گیری جلوت بیان و بری جلو تصمیم بگیری و منم الان تو یکی از اونا گیر کردم
❤15❤🔥2🫡1
ما تو بیچت یه قابلیتی داشتیم به که چت بات میتونست تو غرفه فروشنده سرچ کنه و ما اینو با api سرچ باسلام انجام میدادیم و مشکلی که داشتیم این بود که accuracy و percision پایینی داشتیم و کار ما رو راه نمینداخت و برای این که داده irrelevant نده فیلتر ها رو زیاد کرده بودیم و نتیجه این شده بود که میگفت محصولی یافت نشد. حالا علت چی بود این بود که query های ما بشدت نیازمند درک semantic داشتن و مشکل بعدی این بود که ما از [عملگر](https://www.govinfo.gov/help/search-operators) or تو سرچ نداشتیم برای اینکه داده های نویزی وارد نشن. خب ما هم با راه حل اومدیم
فرض کنید مشتری از چت بات
1. پارچه مجلسی پولکی
2. پارچه مجلسی حریر
3. پارچه مجلسی گیپور
و ...
خب حالا ما کوئری های مرتبط تری داریم و میتونیم سرچ رو بهتر انجام بدیم خب حالا همه اینا رو میفرستیم به api سرچ و اونا رو جمع میکنیم ولی حالا یه مشکل دیگه داریم اونم اینکه اگه قبلا به ازای هر سرچ ۱۰ تا عنوان محصول داشتیم حالا حداکثر ۱۰x۱۰ یعنی ۱۰۰ تا عنوان محصول داریم و خب همه اینا رو نمیتونیم به مشتری برگردونیم به دو علت ۱. ترتیب ندارن و اولین محصول لیستمون مرتبط ترین نیست
۲. باید فیلتر بشن و از اون ۱۰۰ تا باید حداکثر ۱۰ تا رو برگردونیم. راه حل چیه؟ re-ranking یعنی ما میایم با یه مدل که درک از معنا داره میایم رابطه عنوان retrieve شده رو با کوئری اصلی میسنجیم و بهش یه relevance score میدیم و با اون هم رتبه بندی میکنیم و هم فیلتر.
حالا روش re-ranking معمولا با bi-encoder های fine-tune شده استفاده میشه و ولی خب ما اومدیم از llm استفاده کردیم و درکل نتیجه بهتری داشتیم
فرض کنید مشتری از چت بات
پارچه لباس مجلس میخواد طبیعتا شما پارچه ای تحت عنوان پارچه لباس مجلسی ندارید بلکه پارچه لباس مجلسی به یه گروهی از پارچه ها تعلق داره و طبیعتا سرچ کردن پارچه لباس مجلسی نتیجه دلخواه رو نداره پس باید بیایم پارچه لباس مجلسی رو گسترش بدیم و بتونیم ازش query هایی که یه محصول واقعی هستن رو استخراج کنیم1. پارچه مجلسی پولکی
2. پارچه مجلسی حریر
3. پارچه مجلسی گیپور
و ...
خب حالا ما کوئری های مرتبط تری داریم و میتونیم سرچ رو بهتر انجام بدیم خب حالا همه اینا رو میفرستیم به api سرچ و اونا رو جمع میکنیم ولی حالا یه مشکل دیگه داریم اونم اینکه اگه قبلا به ازای هر سرچ ۱۰ تا عنوان محصول داشتیم حالا حداکثر ۱۰x۱۰ یعنی ۱۰۰ تا عنوان محصول داریم و خب همه اینا رو نمیتونیم به مشتری برگردونیم به دو علت ۱. ترتیب ندارن و اولین محصول لیستمون مرتبط ترین نیست
۲. باید فیلتر بشن و از اون ۱۰۰ تا باید حداکثر ۱۰ تا رو برگردونیم. راه حل چیه؟ re-ranking یعنی ما میایم با یه مدل که درک از معنا داره میایم رابطه عنوان retrieve شده رو با کوئری اصلی میسنجیم و بهش یه relevance score میدیم و با اون هم رتبه بندی میکنیم و هم فیلتر.
حالا روش re-ranking معمولا با bi-encoder های fine-tune شده استفاده میشه و ولی خب ما اومدیم از llm استفاده کردیم و درکل نتیجه بهتری داشتیم
GovInfo
Search Operators
Jump to: Metadata Field Operators │ List of Common Field Operators │ List of Collection Codes │ Searching MODs Metadata
👏9❤4👍4