YUV.AI - בינה מלאכותית בעברית
2.43K subscribers
657 photos
410 videos
37 files
439 links
YUV.AI - בינה מלאכותית בעברית
👉 https://yuv.ai 👈
Download Telegram
8 דברים שלמדתי בשנה האחרונה על למידת מכונה:

1. קיימים מאגרי מידע כמו arXiv שמכילים כמות אדירה של מחקרים, לרבות מחקרים שקשורים ללמידת מכונה (שאני מכנה ״בינה מלאכותית אמיתית״), שם כל היהלומים חבויים. מי שמתאמץ שם - עולה ליתרון אדיר ומגלה יהלומים ומפתח הבנה מעמיקה באמת.
2. קיים אתר בשם Kaggle שבו יש גם דאטה סטים מוכנים לאימון אלגוריתם, מכל התחומים, רפואה, כלכלה חינוך תעופה ומה שרק תחלמו. יש שם אפילו קוד לאימון ותחרותיות עם פרסים נושאי כספים.
3. קיים אתר בשם HuggingFace ובו דאטה סטים לאימון, מודלים שאפשר להשתמש בהם וגם ״ספייסים״ שזה בעצם אפליקציות משולבות AI וחינמיות לשימוש אונליין.
4. על אותו משקל יש אתר מדהים בשם Replicate שגם הוא מכיל המון אפליקציות חינמיות לשימוש, משולבות AI.
5. לגבי אימון מודלים - הסוד הוא בראש ובראשונה להשקיע זמן ניכר ליצור דאטה סט איכותי נקי וטוב. אם ייכנס זבל לאימון המודל - הפלט גם הוא יכיל זבל, אנחנו לא רוצים את זה.
6. לאמן מודלים רציניים מאפס זה עסק יקר. מיליוני דולרים, לכן אנחנו מבצעים טיוב, Fine Tune של מודלים קיימים לצרכים שלנו.
7. רשתות נוירונים, הן אלה שמתפוצצות לאחרונה, בשל היותן כלי עוצמתי שמסוגל ללמוד מידע בכמות אדירה, לנבא תחזיות, לקחת חלק בייצור תמונות טקסטים שירים וידאו ומה לא. הן קיימות מ-1940, עלו לתודעה ב-2010 כשהחלו לנצח משחקים. הסיבה שלקח זמן מ-1940 עד שהן התפוצצו בתודעה היא סיבה מתמטית: לקח זמן לייצר את הנוסחה שמאפשרת לתקן משקולות של רשת בתהליך אימון. זה נקרא Backpropogation.
8. למידת מכונה זה לא רק רשתות נוירונים. יש אלגוריתמים רבים שמאפשרים לנו לפתור בעיות שונות. יש לנו בעיות מסוג חיזוי מספרי, רגרסיה, יש לנו בעיות מסוג סיווג והתאמה לקטגוריות, שזה קלסיפיקציה, יש לנו בעיות של זיהוי דפוסים במידע וחלוקתו לקבוצות, זה נקרא Clustering. לכל אחת מהבעיות האלה יש אלגוריתמים שונים שאפשר להשתמש בהם כדי לגרום למכונה ללמוד היטב. למשל, Catboost, XGBoost, Random Forest ועוד, ניתן להשתמש באתר Scikit Learn כדי לקבל תמונה שלמה.

יש לי את הזכות להתעסק בלמידת מכונה ביום יום שלי, במקצוע שלי, לצד הזכות לרתום את היכולות שלי להנגיש תוכן טכנולוגי מסובך בשפה ברורה שכולם יבינו. אני באמת מרגיש שכל הכלים החדשים הם נחמדים, כיף להשתמש בהם וזה רק הולך ומשתפר, אבל משהו עמוק בפנים מרגיש לי שזה עדיין מים רדודים. מים עמוקים באמת זה אימון מודלים וצלילה לעומק. אז באמת אפשר לצלול למעמקים, ל AI אמיתי, שתכלס - הוא זה שבזכותו כל הקסם הזה קורה מלכתחילה.

מקווה שקיבלתם ערך,
ערב טוב.
יובל 🙏
👍11
אמ:לק - מדריך באנגלית ליצירת אוטומציות עם שילוב מודל שפה - מאפס! 🥳

Finally: watch my practical tutorial about AI & Automations from SCRATCH for complete beginners!

Lets build an automation the gets a news update from Apple Newsroom using RSS and publish it, automatically, to a Slack Channel while connecting to Cohere’s awesome LLM!

Link to the video 🤩: https://www.youtube.com/watch?v=PQ3lIMnNXYo
👍1
הרבה זמן התלבטתי לגבי הפוסט הזה. יש קבוצה מובילה בתחום למידת המכונה שמתנהלת כמו מאפיה, מעליבה, חוסמת פוסטים, מוחקת תגובות רציניות, מעודד בריונות. לא רוצה לציין את שמה, המבין יבין.

לאחר שנכוויתי קשות מאותה קבוצה (תגובות מעליבות פעם אחר פעם), החלטתי שזו לא צורה וכל אחד ואחת ראויים להעלות תוכן טכני על למידת מכונה, להתייעץ לשתף לשאול מבלי לפחד שיעשו להם שיימינג בתגובות.

קבוצת ״למידת מכונה לכולם״ נוצרה במטרה להעלות תכנים בנושא למידת מכונה ומדע נתונים (Machine Learning & Data Science) מתוך מקום לתת לכולם במה וליצור קהילה שיתופית ומכבדת. כאן כל שאלה תתקבל בברכה, ללא ציניות, ללא עלבונות ועם המון רצון לפרגן לתמוך לתרום ולשתף ידע.

בקבוצה חברים מקצוענים מהמעלה הראשונה שעוסקים בתחום שנים רבות ונכונים להשיב על שאלות, לעזור, לייעץ, לשתף ידע, מתוך מקום כן ומכבד. כמו גם חבר'ה בתחילת דרכם שאולי קצת מהססים קצת חוששים, זו בדיוק הקבוצה עבור כולם. לא משנה אם אתם בהתחלה או שאתם רצים שנים ארוכות, זה המקום לחבר את כולם, להנגיש ידע ולשתף אותו בצורה מכבדת.

הנושאים שנדבר עליהם: אימון מודלים, ראיית מחשב, רשתות נוירונים, למידה עמוקה, בעיות רגרסיה, קלסיפיקציה ועוד.

זה המקום להגיד למנהלי אותה קבוצה - חבל שזו הדרך שלכם, חבל שחסמתם לי פוסטים, שסימנתם אותי כמשתמש בעייתי, כשסך הכל העליתי תכנים שהיו תורמים לקבוצה שלכם. אני הפוך מכם. בעד פרגון שיתוף ידע וכמה שיותר. אשמח אם כל אחד יוכל להזמין לקבוצה את החברים, זו תהיה קבוצה ברמה גבוהה, כדאי להיות זנב לאריות. איך אמרו חז״ל? אדם שנכנס לחנות בשמים, גם אם הוא לא קונה בושם, כשהוא יוצא, הוא יוצא עם ריח טוב. גם אם לא הבנתם אתם תהיו חלק משיח מאוד מתקדם ומעניין.

יוצאים לדרך!!!
מחכה לכם!
יובל

https://www.facebook.com/share/tQKkpaXMmBSn8ycR/
🔥11👏71👍1
איך מחשבים את כמות הזיכרון הדרושה כדי להריץ ולאמן מודל שפה לוקאלית?

https://www.facebook.com/share/p/U84vGM2iJeCwuXAK/?mibextid=WC7FNe
הצצה לשגרת יומו של מדען נתונים ולמידת מכונה:

1. עובדים קשה מאוד על דאטה. מאוד מאוד.
2. מכינים אותה לאימון.
3. מפצלים אותה לאימון ולבדיקות.
4. בוחרים מודל (אלגוריתם) לאימון בהתאם לסוג הבעיה שרוצים לפתור.
5. בודקים מדדים כמו דיוק כיסוי וכדומה.
6. מנסים להשתמש ולנבא.
7. מנתחים נתונים ומייצרים דוחות.
8. מנסים להבין מה עובד ומה לא, וחוזרים חזרה.

כמה מונחים חשובים:
Precision - מתוך הניבוי המוצלח שלנו, בכמה דייקנו
Recall - מתוך כלל הניבוי שלנו, כמה ניבאנו בצורה נכונה
F1 - מד משולב
Accuracy - מספר עשרוני שמסמל את אחוז הדיוק של המודל, מה הסיכוי שלו לנבא בצורה מוצלחת
Scikit-Learn - ספריית למידת מכונה ומדע נתונים שעוזרת לנתח דאטה ולאמן מודלים, יש בה דאטה סטים וגם אלגוריתמים וכלים שעוזרים לנו
Confusion Matrix - טבלה שעוזרת לנו לראות כמה צדקנו, כמה טעינו
Area Under Curve - יחס בין ניבוי מוצלח לניבוי שגוי

זה עולם ומלואו, אותי הוא מרתק. תודה על הזכות לעסוק בזה, זה המקצוע הכי קרוב לקוסמות שקיים!

אם גם לכם יש תובנות אשמח לקרוא, ושמח לבשר שהרזברי פיי 5 ממש בדרכו אלי!! (הקיט של ה AI מחכה לו פה) 🚀🚀🚀

ערב טוב,
יובל
👍4
חמוד ממש: אתר VidNoz עם כלי חדש להפוך כל תמונה לתמונת פרופיל מקצועית ברמת סטודיו. תודה ל״אברא כדברא״ (קייט סיקסק) שחשפה אותי לאתר הזה שיש בו המון כלים חינמיים ומעולים!

מוזמנים להתנסות - https://www.vidnoz.com/ai-headshot-generator.html

יובל אבידני
YUV.AI
👍2
*מי רוצה להגיע להרצאה שלי על אוטומציות ו-AI?*

שדרות-טק פותחת את שעריה לתושבי הדרום, אם אתם מאיזור הדרום ורוצים להגיע אתם מוזמנים למלא פרטים בקישור הבא, יהיה כיף 🤩

🎉 חברי קהילת SderoTech היקרים בשבוע הבא זה קורה! 🍻

השמועות אומרות שתתקיים הגרלה מיוחדת באירוע ההשקה שלנו!
🏆 הפרס: קורס דיגיטלי יוקרתי בנושא בינה מלאכותית בשווי 1,500 ₪!

איך משתתפים?
1️⃣ הירשמו לאירוע ההשקה - ההרשמה>> https://did.li/cTArl נסגרת היום בחצות
2️⃣ הצטרפו לדף הפייסבוק של הקהילה>> https://did.li/oDpZH
3️⃣ עשו לייק לדף

🔔 זכרו: רק מי שיבצע את כל השלבים ישתתף בהגרלה.

נתראה באירוע! 🚀💻
הייתי חייב לעצור כדי לשתף שהאתר האוטומטי שבניתי כבר רץ חודש וחצי באוויר ואפילו מתחיל לזרום טראפיק!! 🤯

אתר אוטומטי. לא נוגע בו. כלום. שמפרסם ידיעות לבד תוך שילוב מודל שפה של קוהיר המדהימים. הוא מחובר למייק, מפרסם גם באינסטגרם וגם בבלוג הוורדפרס. 100% אוטומציה + AI וזו רק ההתחלה!

זה העידן החדש, תנו לעצמכם מתנה כי קורס האוטומציות וה-AI שלי חוזר למחיר המלא בעוד יומיים, בואו להיכנס לעולם המרתק הזה ותלמדו איך לפרסם אוטומטית בסושיאל! 🤩 הכל באתר שלי YUV AI

ואם זה לא מספיק, מחר בערב אני בלייב עונה לכם על כל השאלות אז תשריינו את 20:30, יהיה מעניין.

יובל
1👍1
כמובטח מצרף קישור לוובינר: היום בשעה 20:30! אוטומציות, AI, וואצאפ ושאר ירקות!

https://us05web.zoom.us/j/81955530762?pwd=YVA1v4qeIICdAexF8L76RhHZNzkaqe.1
היום OpenAI הולכים להכריז על מודל חדש שנקרא GPT-4o Mini

הדרך שבה הם בחרו להכריז על כך - דרך מתן אייטם בלעדי לרשת CNBC - ולא בדרך המקובלת של הוצאת עדכון למשתמשים, ללקוחות, טיזרים נחמדים, פרסום בבלוג ויצירת עניין, הם הלכו לתקשורת. הם. למה הם צריכים את זה? כי לדעת רבים שנטשו את OpenAI מה שמעניין אותה בהובלת אלטמן זה רק מחיאות כפיים לעצמה.

איליה הגאון שעזב, לצד קפארתי שעזב ופתח לאחרונה בית ספר ללימודי AI משלו, והגאון האריסון קינסלי, כולם פעם אחר פעם לועגים להתנהלות של אלטמן ושל OpenAI. תוסיפו לזה את התמונה הלא מחמיאה של סאם אלטמן נוהג ברכב בשווי 5 מיליון דולר. מיד עלו שאלות: איך חברה שנוסדה ללא מטרת רווח כדי לעשות טוב לאנושות, הפכה לחברה עשירה בטירוף שהמנכ״ל שלה שפוטר לאחרונה בגלל התנהגות לא אתית - נוסע ברכב בשווי 5 מיליון דולר - ואלו שהתנגדו לדרכו מצאו את דרכם החוצה?

המודל החדש מוגדר על ידם כמודל הכי קטן והכי חסכוני ויעיל שקיים, ויתמוך בהמשך גם באודיו וידאו ותמונות. ומה דעתכם על ההתנהלות הזו?

אני אישית פחות מתחבר, אוהב יותר את אנתרופיק (קלוד) וקוהיר (command r plus)

יובל
👍41😁1👌1
וואו! חברת Together AI משיקה יכולת Inference בענן למודלים של שפה שמהירה פי 4 מכל המתחרים (גם ממייקרוסופט ואמאזון!) 🤯 - אה, ויש גם מיטאפ בת״א ב-19.8 עם מספר מקומות מוגבל!! 🤩

אחת הבעיות הגדולות כיום היא הזמן שלוקח לסוכני AI להשיב לנו על שאלות. מה שנקרא ה-Latency. אנחנו לפעמים שואלים שאלה, הסוכן חושב וחושב ובסוף משיב. זה לוקח זמן. למה?

כי כל הזנה של טקסט שלנו, שנשלחת למודל שפה כזה או אחר, עוברת מספר שלבים: היא נחתכת לאסימונים (טוקניזציה), מומרת לערכים מספריים (embeddings) ואז עוברת לשלב הביצוע: מודל השפה מקבל את המידע ומנבא את המילה הבאה.

בעבודה עם הממשק הגרפי של ChatGPT , Claude או Cohere המדהימים - הכל קורה שם. אבל מה אם אנחנו בונים אפליקציה משלנו ומתחברים ב-API למודל שפה? מה אם אנחנו משתמשים בחברה כמו Officely המעולים, Devin או כל פיתרון אחר, שגם הן מחברות מודל שפה?

נקח לדוגמא אפילו אוואטרים: לוקח להם זמן להשיב לנו. עד שמודל השפה משיב, אחרי זה עד שהתשובה הופכת לדיבור, זה לוקח זמן.

כשאנחנו מפתחים מוצר ומתחברים למודל שפה - אנחנו פונים ב-API. אם אנחנו משתמשים במודל מסחרי, כמו של OpenAI או Claude או Azure OpenAI או אפילו Cohere דרך Amazon Bedrock, בכל אחד מהפיתרונות האלה יש Overhead, תקורה. זמן שלוקח לקבל תשובה בחזרה. ספקיות הענן תמיד מתיימרות לומר שהן הכי מהירות, אבל הנה בשקט בשקט, Together AI שמאפשרת לאמן מודלים בענן או להשתמש במודלים של שפה בתצורה יעילה שלא מצריכה הגדרות מסובכות של שרת (Serverless), השיקו הלילה פתרון שמייעל הכל פי 4!

ז״א - מה אם היינו יכולים לקצר פי 4 את הזמן הזה? או להפוך את התשובה לפי 4 יותר מהירה (תלוי איך מסתכלים על זה)?

בחברת Together שהם באמת מדהימים, מאפשרים גישה ליותר מ-100 מודלים של שפה שהם קוד פתוח, כמו לאמה 3 של פייסבוק, אבל! הם הצליחו להגיע למצב של 400 טוקנים בשניה! ז״א תשובה של כ-350 מילים באנגלית תוך שניה!

הם מצליחים לגבור על תצורות של הרצת מודלים של שפה כמו vLLM, בצורה משמעותית מאוד, מה שאומר שגם אפשר לגשת דרך API למודלים בענן שלהם, גם לקבל תגובה מהירה מאוד, מה שיהפוך את המוצר שלנו לכזה שמשיב מהר יותר. אפילו מהר יותר מ-Microsoft ו-Amazon וכל השאר! זה באמת חתיכת בשורה!

כמו שאמרתי הרבה פעמים, אני מאוד אוהב את Harrison Kinsley והוא המליץ עליהם לפני המון זמן. מאז אני במעקב אחריהם ואני אוהב מאוד את מה שהם עושים. הלילה הם כבר ממש מחוללים מהפך שקט בעיני. בשורה של ממש לכל מי שמחבר מודל שפה! תנסו את ה-API שלהם ותודו לי אח״כ 💜

בגוגל: Together AI. ככה פשוט. עדכנו מה חשבתם!

ועוד בשורה: בע״ה בלי נדר, ב-19.8 יתקיים מיטאפ נוסף לקהילה עם מספר מקומות מצומצם מאוד (כ-150 בלבד), מציע להיות במעקב, זה יקרה בשעות הערב בתל אביב. בשונה מכל הפעמים הקודמות, זה לא הרצאה אלא מיטאפ שבו אני פותח מחשב ומשתף מסך, בונה ביחד אתכם חיבורי API למודל שפה ומשלב אוטומציות. הכי פרקטי שיש. לא הרצאה. לא רשימת כלים. משתף מסך, בונים ביחד. למי שיש ידע בקוד יהיה קל, למי שאין צריך לבוא עם ראש פתוח, בסוף נדבר טכנית על חיבורי API ואוטומציות. יהיה כיף! שריינו לכם 🤩


שבת שלום 🙏
יובל
את הפוסט הזה אסור לכם להפסיד! באחריות! טיפים *גאוניים* של מנהל הקבוצה, ישי טובי הגאון (שכזכור, מתעסק שנים רבות ב Machine Learning ופיתח מודלים מתקדמים מאוד לארגונים רבים) - על טיפים סודיים לשימוש מתקדם עם ChatGPT / מודלים של שפה!!!! וואו! Ishay Tubi 👑

https://www.facebook.com/share/p/Qsk47LWAnDEJngjd/?
ידיעה שעדיין לא פרסמתי מפאת חוסר זמן, אבל הגאון אנדרי קפארתי, שהיה דירקטור AI בטסלה וגם Founding Team ב OpenAI ונס על נפשו משם, הכריז על פתיחת אקדמיית AI שתהיה הטובה בעולם, שמה: EurikaLabs AI.

אנדרי הוא גאון עם סרטונים מפורטים עם מיליוני צפיות ביוטיוב, הוא נוגע בליבת הנושאים וכיף לצפות בו (אם כי הוא מאוד טכני ולפעמים טכני מדי ולא הכי מובן לאנשים הפשוטים כמוני). בכל מקרה זה יהיה מרתק, הוא פרסם סילבוס של 15 פרקים מאוד מעמיקים ואני לא יכול לחכות, הצצה פה: https://github.com/karpathy/LLM101n

מזכיר שבעזרת השם ביום שני הקרוב אני בהרצאה בשדרות בשעות הערב, וגם ברביעי הקרוב - באילת, שעות הערב.

אם אתם באיזור תרגישו חופשי להגיד שלום!

שבוע טוב ובשורות טובות לכולם 💜🙌🎗️
👍31
יצירת אתר עם קלוד ופרסום שלו עם גיטהאב - בחינם ובקלות תוך רבע שעה!

כולם יוצרים היום אתרים עם קלוד החדש בקלות בלתי נתפסת. אבל אז מגיע השלב שזה עובד בקלוד ו.. מה עושים עם זה?

מה עושים? מפרסמים את זה לכל העולם בפלטפורמה אחרת ובחינם! בסרטון אני מראה הכל שלב אחר שלב לפי המדריך המושלם של איריס פלד התותחית שמתעסקת ב-AI וחינוך והנגישה את זה באמת נפלא!

תנו לעצמכם ולילדים מתנה, תתחילו ליצור אתרים, לפרסם אותם בקלות ובחינם, ומה שנשאר זה רק הדימיון שלכם שיתחיל לעבוד. למה אתם מחכים? קישור: https://youtu.be/u3iTd-YQry4

שבוע טוב ובשורות טובות,
יובל
כמה זיכרון צריך כדי להריץ מודל שפה במחשב שלנו? (ומה זו קוונטיזציה)

אמ:לק - משקל מודל השפה נקבע מכמות הפרמטרים שהוא מכיל. כל פרמטר מיוצג מספרית בצורה מסוימת. טכניקת קוונטיזציה מאפשרת להריץ מודל גדולים בצורה חסכונית יותר. בואו נדבר על זה.

https://yuv.ai/local-llm-req/
👍41
בשקט בשקט, חברת היילו (Hailo) הישראלית יושבת בתל אביב ומייצרת שבבים שמסוגלים להריץ רשתות נוירונים ולהפחית את העומס מהמעבד, כל זה באמצעות חיבור *חיצוני* של שבב ואפילו שיתוף פעולה עם רזברי פיי בערכה החדשה שלה: Pi AI Kit!

תחשבו על זה: כדי להריץ מודלים שמסוגלים לזהות אובייקטים בזמן אמת צריך להשקיע משאבי מחשוב בפעולה. מה אם מישהו אחר היה לוקח את העומס הזה ומטפל בו בעצמו? ומי אתם שואלים? היילו! כי הם יכולים לקחת את העומס הזה ולנהל את הרשת של האימון בעצמם. אז אמנם כרגע הגרסה הנוכחית לא מיועדת להרצת LLM-ים, אבל בהחלט יכולה להריץ זיהוי אובייקטים וסגמנטציה שלהם.

תודה לגלעד, מנהל קהילת המייקרים של Hailo, היה מרתק ואני לא יכול לחכות לשתף בתוצרים שלי עם הרזברי פיי והיילו! 🚀🚀🚀
👍4🏆2