קבלו איך אלברט, יציר AI, לומד ללכת לגמרי לבדו!
הכירו את אלברט. פיתחו אותו כדי ליצור סימולציה שממחישה איך הבינה המלאכותית לומדת לבד - ומשתפרת תוך כדי ריצה. זה מה שנקרא ״למידת מכונה מבוססת חיזוקים״, כאשר ב״חיזוקים״ הכוונה לחיזוק התנהגות ״טובה״ על ידי מתן ״פרס״, ומנגד הרחקה מהתנהגות ״לא טובה״ על ידי מתן ״קנס״.
אלברט נבנה מחוליות על גבי חוליות, על כל אחת הוא יכול לשלוט בנפרד. הוא מתחיל את המשחק במעין בית עם קומות, וכל קומה מלמדת אותו דבר אחר: איך להרים את החזה, איך לפסוע, עד שהוא לומד איך ללכת. בהתחלה הוא רק זוחל, אחרי זה מנסה להתרומם - ונופל - אבל המשחק ממשיך והוא מתאמן עוד ועוד, עד שלבסוף הוא מתחיל ללכת כל כך יציב שאפילו כאשר זורקים עליו פריטים - הוא לא נופל כי הוא שולט מצוין בהליכה!
הסוג הזה של למידת מכונה מבוססת חיזוקים הוא הדבר האמיתי. זה מה שמאפשר למודלים להשתפר מהפידבקים שלנו, וזה מה שנותן את האנושיות למודלים. ככל שהיכולת הזו הולכת ומשתפרת - כך נגיע למודלים חכמים שלומדים לבד איך להתנהל - ולהצליח. והאמת היא שאלברט הוא דוגמא אמיתית לסוכן AI, כי זה בדיוק סוכן אמיתי: נכנס לסיטואציה מסוימת ולומד איך להצליח בה - לגמרי לבד.
איזה מלך אלברט!
הכירו את אלברט. פיתחו אותו כדי ליצור סימולציה שממחישה איך הבינה המלאכותית לומדת לבד - ומשתפרת תוך כדי ריצה. זה מה שנקרא ״למידת מכונה מבוססת חיזוקים״, כאשר ב״חיזוקים״ הכוונה לחיזוק התנהגות ״טובה״ על ידי מתן ״פרס״, ומנגד הרחקה מהתנהגות ״לא טובה״ על ידי מתן ״קנס״.
אלברט נבנה מחוליות על גבי חוליות, על כל אחת הוא יכול לשלוט בנפרד. הוא מתחיל את המשחק במעין בית עם קומות, וכל קומה מלמדת אותו דבר אחר: איך להרים את החזה, איך לפסוע, עד שהוא לומד איך ללכת. בהתחלה הוא רק זוחל, אחרי זה מנסה להתרומם - ונופל - אבל המשחק ממשיך והוא מתאמן עוד ועוד, עד שלבסוף הוא מתחיל ללכת כל כך יציב שאפילו כאשר זורקים עליו פריטים - הוא לא נופל כי הוא שולט מצוין בהליכה!
הסוג הזה של למידת מכונה מבוססת חיזוקים הוא הדבר האמיתי. זה מה שמאפשר למודלים להשתפר מהפידבקים שלנו, וזה מה שנותן את האנושיות למודלים. ככל שהיכולת הזו הולכת ומשתפרת - כך נגיע למודלים חכמים שלומדים לבד איך להתנהל - ולהצליח. והאמת היא שאלברט הוא דוגמא אמיתית לסוכן AI, כי זה בדיוק סוכן אמיתי: נכנס לסיטואציה מסוימת ולומד איך להצליח בה - לגמרי לבד.
איזה מלך אלברט!
❤2
Media is too big
VIEW IN TELEGRAM
בואו נדבר בקטנה על איך AI יכול ללמוד דברים לבד, בעצמו?
(הסבר קצר, חלק מהצילום נדפק כי חצובת ה-AI שלי שעוקבת אחרי לא זיהתה את הפנים של וולברין 🤣)
(הסבר קצר, חלק מהצילום נדפק כי חצובת ה-AI שלי שעוקבת אחרי לא זיהתה את הפנים של וולברין 🤣)
👍3😁3🔥2👏1
אז הנה זה קורה, אנו יוצאים לדרך עם הרשמה לאירוע בריאקטור מיקרוסופט ת"א בנושא קופיילוט לעסקים.
שימו לב 💚: ההרשמה מוגבלת והיא תסגר כשנגיע למכסה. נכון להיום אנו נותנים קדימות לקהילת ה AI
אנא הרשמו רק אם אתם בטוחים שתוכלו להגיע לאירוע (5.3.25 17:30). לאחר כ 3 ימים ההרשמה תיפתח לציבור רחב יותר.
יהיה קפה ומאפה, בופה חלבי בהפסקה ועוד פינוקים בהמשך (הכל חינם כמובן).
האג'נדה לאירוע נמצאת בדף ההרשמה עם דבר המרצים בניחוח AI.
מחכים לכם... 🍻
יובל אבידני ורונן ארנרייך
https://copilot-conference-hub.lovable.app/
שימו לב 💚: ההרשמה מוגבלת והיא תסגר כשנגיע למכסה. נכון להיום אנו נותנים קדימות לקהילת ה AI
אנא הרשמו רק אם אתם בטוחים שתוכלו להגיע לאירוע (5.3.25 17:30). לאחר כ 3 ימים ההרשמה תיפתח לציבור רחב יותר.
יהיה קפה ומאפה, בופה חלבי בהפסקה ועוד פינוקים בהמשך (הכל חינם כמובן).
האג'נדה לאירוע נמצאת בדף ההרשמה עם דבר המרצים בניחוח AI.
מחכים לכם... 🍻
יובל אבידני ורונן ארנרייך
https://copilot-conference-hub.lovable.app/
copilot-conference-hub.lovable.app
Lovable Generated Project
קהילת קוד המקור הפתוח עושה את זה שוב: הכירו את Open Deep Researcher - סוכן AI שיודע לבצע מחקר מעמיק ברשת - והקוד שלי זמין בחינם!
הגישה שלו מאוד פשוטה, הוא מקבל שאילתא מהמשתמש ואז:
1. מבצע חיפוש באמצעות שימוש ב-SERPAPI, מעיין בתוצאות ומנסה להבין לבד מה התוצאות הרלוונטיות
2. לאחר מכן הוא מחלץ את התוכן של העמודים הרלוונטיים
3. אם הוא חושב שצריך להעמיק אז הוא פונה שוב לעמודים הרלוונטיים עם שאילתא חדשה שהוא יוצר לעצמו
4. לבסוף הוא משתמש בכל הקונטקסט שנאגר בתהליך כדי לייצר דוח
5. הוא משתמש ב-OpenRouter, אתר שמנגיש המון מודלים, כך שאפשר לשלב איזה מודל שרוצים, ולמתקדמים אפשר אפילו לשלב טכניקות בחירת מודל בצורה אוטומטית
תחשבו על זה, בלי קהילת קוד המקור הפתוח היינו נעולים ליצרנים מסחריים. בזכות הקהילה הזו, תמיד לוקחים את היכולות הכי חדשות והופכים אותן לזמינות לציבור ובחינם.
עכשיו דמיינו שאתם רוצים ליצור אפליקציה משלכם שבה משתמש מזין שאילתא וסוכן AI מבצע מחקר מעמיק על אותו נושא ומחזיר את התשובה. אפשר לתחום את הסוכן לתחומי ידע נישתיים, כמו שירות לקוחות למוצר מסוים, או אפילו לתחומים טיפוליים - למשל, מומחה לוגותרפיה, פסיכואנליטיקאי, פסיכותרפיסט, יועץ לענייני הגירה, יועץ מיסוי, יועץ משפטי וכדומה. כל מה שצריך לעשות הוא ליצור ״פרסונות״, שזה נורא פשוט כי זה סה״כ כתיבת הגדרת ה-System Prompt (החלק בפרומפט שנותן זהות למודל השפה), וחיבור לקוד החינמי הזה, והופ: יש לכם ישות שיודעת לחשוב ממש. עכשיו חברו את זה ליכולת לדבר עם המודל הזה, באמצעות תמלול דיבור לטקסט ושליחתו למודל, או הפיכת התשובות הטקסטואליות לקוליות, ואתם על הגל.
אנחנו חיים בעידן תור הזהב של הפיתוח וה-AI.
כל הכבוד ל-Matt Shumer על הפיתוח, מי שרוצה להתנסות: https://github.com/mshumer/OpenDeepResearcher
הגישה שלו מאוד פשוטה, הוא מקבל שאילתא מהמשתמש ואז:
1. מבצע חיפוש באמצעות שימוש ב-SERPAPI, מעיין בתוצאות ומנסה להבין לבד מה התוצאות הרלוונטיות
2. לאחר מכן הוא מחלץ את התוכן של העמודים הרלוונטיים
3. אם הוא חושב שצריך להעמיק אז הוא פונה שוב לעמודים הרלוונטיים עם שאילתא חדשה שהוא יוצר לעצמו
4. לבסוף הוא משתמש בכל הקונטקסט שנאגר בתהליך כדי לייצר דוח
5. הוא משתמש ב-OpenRouter, אתר שמנגיש המון מודלים, כך שאפשר לשלב איזה מודל שרוצים, ולמתקדמים אפשר אפילו לשלב טכניקות בחירת מודל בצורה אוטומטית
תחשבו על זה, בלי קהילת קוד המקור הפתוח היינו נעולים ליצרנים מסחריים. בזכות הקהילה הזו, תמיד לוקחים את היכולות הכי חדשות והופכים אותן לזמינות לציבור ובחינם.
עכשיו דמיינו שאתם רוצים ליצור אפליקציה משלכם שבה משתמש מזין שאילתא וסוכן AI מבצע מחקר מעמיק על אותו נושא ומחזיר את התשובה. אפשר לתחום את הסוכן לתחומי ידע נישתיים, כמו שירות לקוחות למוצר מסוים, או אפילו לתחומים טיפוליים - למשל, מומחה לוגותרפיה, פסיכואנליטיקאי, פסיכותרפיסט, יועץ לענייני הגירה, יועץ מיסוי, יועץ משפטי וכדומה. כל מה שצריך לעשות הוא ליצור ״פרסונות״, שזה נורא פשוט כי זה סה״כ כתיבת הגדרת ה-System Prompt (החלק בפרומפט שנותן זהות למודל השפה), וחיבור לקוד החינמי הזה, והופ: יש לכם ישות שיודעת לחשוב ממש. עכשיו חברו את זה ליכולת לדבר עם המודל הזה, באמצעות תמלול דיבור לטקסט ושליחתו למודל, או הפיכת התשובות הטקסטואליות לקוליות, ואתם על הגל.
אנחנו חיים בעידן תור הזהב של הפיתוח וה-AI.
כל הכבוד ל-Matt Shumer על הפיתוח, מי שרוצה להתנסות: https://github.com/mshumer/OpenDeepResearcher
GitHub
GitHub - mshumer/OpenDeepResearcher
Contribute to mshumer/OpenDeepResearcher development by creating an account on GitHub.
👍3
היום קלוד איבד את הכתר לטובת o3-mini-high של OpenAI - והסיבה דרמטית למפתחים! 🤯
אחד הדברים הכי חשובים - וגם הכי פחות מדוברים - זה היכולת שלנו לשלוט במבנה התשובה שאנחנו מקבלים ממודל השפה. נניח שאנחנו כותבים הנחיה כלשהי, מודל השפה מחזיר תשובה בשפה חופשית אבל אנחנו צריכים שהתשובה תחזור בצורה ספציפית. לדוגמא: נניח שאנחנו בונים אפליקציה שמנבאת מחירי טיסות על בסיס תקופה, חברות תעופה פעילות, אטרקטיביות היעד וכדומה.
אנחנו יכולים לכתוב הנחיה כזו:
אתה מומחה תעופה. אתה מקבל מידע על נמל התעופה שממריאים ממנו, היעד, תאריך, ועל בסיס זה אתה מחזיר לי הערכה של עלות.
לאחר מכן אנחנו מעבירים למודל גם נתונים מהקלט של המשתמש, כמו: אני רוצה לטוס מישראל לניו זילנד במרץ 2025.
בשלב הזה, בהנחה שמודל השפה יודע לבד את שמות שדות התעופה לפי קודים רשמיים, ואת המחירים ההיסטוריים, הוא ישיב לנו משהו כמו: בהחלט, על בסיס הנתונים שסיפקת אני רואה ש… בלה בלה בלה.
זה בסדר. אבל! אם אנחנו רוצים לקבל את התשובה במבנה ספציפי כמו:
מוצא (כשדה טקסט)
יעד (כשדה טקסט)
מחיר משוער בדולרים (כשדה מספרי)
וכל זה בתור מבנה שנקרא JSON שבעצם מחזיר תשובה מסודרת:
{ destination: NZ, Departure: TLV, Predicted Price: 1200$}
למה זה חשוב? כי אז אנחנו יכולים לקחת כל ערך בתשובה ולשלב אותה גם הלאה בפרומפטים נוספים, כמו למשל פרומפט המשך שמוודא שהתוצאות תקינות, לא מכילות ביטויים פוגעניים, ורלוונטיות וכדומה.
ולאחר מכן גם נוכל להחזיר את התוצאה ולהציג אותה למשתמש שלנו. היכולת לעשות את זה ולשלוט גם במבנה שחוזר אלינו אבל גם לוודא ולאמת את סוג מבנה הנתונים שאנחנו מקבלים, מתאפשר ביתר קלות בעזרת Structured Output של OpenAI בשילוב PyDantic שיודע לשלוט בסוג המשתנה המוחזר (להגדיר מה טקסט, מה מספר וכדומה - ולוודא שזה מה שחוזר בפועל)
בדוקומנטציה של OpenAI מפורט איך אפשר להגדיר את זה. בעבר היינו משתמשים ב-Function Calling או ב-JSON Mode, אבל Structured Output עם PyDantic זה ה-דבר!
וחזרה לרישא. כהרגלי, ניסיתי עם קלוד האהוב לבנות את הקוד, והופתעתי לגלות כמה הוא נכשל. שוב ושוב. מנגד, השתמשתי ב-o3-mini-high החדש של OpenAI, שלמרות שטעה בפעם הראשונה, היות והוא יכול לקבל קישורים ולגלוש - הפניתי אותו לדוקומנטציה והוא הבין ותיקן. לקלוד אין אפשרות לצאת החוצה כרגע. חיסרון מובהק.
יתירה מכך, גם לאחר שניסיתי לתקן עם קלוד, כרגיל, הוא לא הצליח להבין. מנגד, o3 כבר נתן לי פתרונות שלמים שעובדים. הופתעתי, ובצער רב נראה שנכון לעת הזו אני והמנוי של קלוד ניאלץ להיפרד כל אחד לדרכו. אני גם שמח לראות שמודל החשיבה o3 עובד טוב בקוד כי בסוף GPT ארגוני נפוץ בחברות, ומודל שסופסוף עובד - עוזר לנו עם פרטיות, כפי שנדרש.
אז תזכרו: o3-mini-high עובד יפה מאוד עם קוד, ו-Structured Output בשילוב PyDantic זה וואו לשליטה בפלט של LLMs. אלה בעיות של העולם האמיתי, וזה מה שמבדיל בין משחקים וקשקושים לבין מציאת פתרונות למוצרים אמיתיים מבוססי AI, וכך מטמיעים LLM הלכה למעשה.
מקווה שקיבלתם ערך,
יובל
אחד הדברים הכי חשובים - וגם הכי פחות מדוברים - זה היכולת שלנו לשלוט במבנה התשובה שאנחנו מקבלים ממודל השפה. נניח שאנחנו כותבים הנחיה כלשהי, מודל השפה מחזיר תשובה בשפה חופשית אבל אנחנו צריכים שהתשובה תחזור בצורה ספציפית. לדוגמא: נניח שאנחנו בונים אפליקציה שמנבאת מחירי טיסות על בסיס תקופה, חברות תעופה פעילות, אטרקטיביות היעד וכדומה.
אנחנו יכולים לכתוב הנחיה כזו:
אתה מומחה תעופה. אתה מקבל מידע על נמל התעופה שממריאים ממנו, היעד, תאריך, ועל בסיס זה אתה מחזיר לי הערכה של עלות.
לאחר מכן אנחנו מעבירים למודל גם נתונים מהקלט של המשתמש, כמו: אני רוצה לטוס מישראל לניו זילנד במרץ 2025.
בשלב הזה, בהנחה שמודל השפה יודע לבד את שמות שדות התעופה לפי קודים רשמיים, ואת המחירים ההיסטוריים, הוא ישיב לנו משהו כמו: בהחלט, על בסיס הנתונים שסיפקת אני רואה ש… בלה בלה בלה.
זה בסדר. אבל! אם אנחנו רוצים לקבל את התשובה במבנה ספציפי כמו:
מוצא (כשדה טקסט)
יעד (כשדה טקסט)
מחיר משוער בדולרים (כשדה מספרי)
וכל זה בתור מבנה שנקרא JSON שבעצם מחזיר תשובה מסודרת:
{ destination: NZ, Departure: TLV, Predicted Price: 1200$}
למה זה חשוב? כי אז אנחנו יכולים לקחת כל ערך בתשובה ולשלב אותה גם הלאה בפרומפטים נוספים, כמו למשל פרומפט המשך שמוודא שהתוצאות תקינות, לא מכילות ביטויים פוגעניים, ורלוונטיות וכדומה.
ולאחר מכן גם נוכל להחזיר את התוצאה ולהציג אותה למשתמש שלנו. היכולת לעשות את זה ולשלוט גם במבנה שחוזר אלינו אבל גם לוודא ולאמת את סוג מבנה הנתונים שאנחנו מקבלים, מתאפשר ביתר קלות בעזרת Structured Output של OpenAI בשילוב PyDantic שיודע לשלוט בסוג המשתנה המוחזר (להגדיר מה טקסט, מה מספר וכדומה - ולוודא שזה מה שחוזר בפועל)
בדוקומנטציה של OpenAI מפורט איך אפשר להגדיר את זה. בעבר היינו משתמשים ב-Function Calling או ב-JSON Mode, אבל Structured Output עם PyDantic זה ה-דבר!
וחזרה לרישא. כהרגלי, ניסיתי עם קלוד האהוב לבנות את הקוד, והופתעתי לגלות כמה הוא נכשל. שוב ושוב. מנגד, השתמשתי ב-o3-mini-high החדש של OpenAI, שלמרות שטעה בפעם הראשונה, היות והוא יכול לקבל קישורים ולגלוש - הפניתי אותו לדוקומנטציה והוא הבין ותיקן. לקלוד אין אפשרות לצאת החוצה כרגע. חיסרון מובהק.
יתירה מכך, גם לאחר שניסיתי לתקן עם קלוד, כרגיל, הוא לא הצליח להבין. מנגד, o3 כבר נתן לי פתרונות שלמים שעובדים. הופתעתי, ובצער רב נראה שנכון לעת הזו אני והמנוי של קלוד ניאלץ להיפרד כל אחד לדרכו. אני גם שמח לראות שמודל החשיבה o3 עובד טוב בקוד כי בסוף GPT ארגוני נפוץ בחברות, ומודל שסופסוף עובד - עוזר לנו עם פרטיות, כפי שנדרש.
אז תזכרו: o3-mini-high עובד יפה מאוד עם קוד, ו-Structured Output בשילוב PyDantic זה וואו לשליטה בפלט של LLMs. אלה בעיות של העולם האמיתי, וזה מה שמבדיל בין משחקים וקשקושים לבין מציאת פתרונות למוצרים אמיתיים מבוססי AI, וכך מטמיעים LLM הלכה למעשה.
מקווה שקיבלתם ערך,
יובל
🔥12❤2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
איך אפשר ליצור אפליקציית AI שהופכת לסוכן טיסות, ב-2 דקות, ברכבת?
אמנם כבר כתבתי כמה פעמים על PartyRock של AWS שמאפשרת ליצור אפליקציות מבוססות LLM ברגעים ספורים, אבל החלטתי להקליט פרק חדש של ״פרודוקטיביות ברכבת עם יובל״ (אחלה שם תודו), הפעם עם סאונד, כדי להדגים איך הקסם הזה קורה ברגעים ספורים ובחינם. אם טרם ניסיתם - למה אתם מחכים?
אמנם כבר כתבתי כמה פעמים על PartyRock של AWS שמאפשרת ליצור אפליקציות מבוססות LLM ברגעים ספורים, אבל החלטתי להקליט פרק חדש של ״פרודוקטיביות ברכבת עם יובל״ (אחלה שם תודו), הפעם עם סאונד, כדי להדגים איך הקסם הזה קורה ברגעים ספורים ובחינם. אם טרם ניסיתם - למה אתם מחכים?
👍3❤2🔥1
Media is too big
VIEW IN TELEGRAM
הקלטתי לכם במיוחד: 3 דקות עם כל מה שאתם צריכים לדעת על GenSpark! הכלי שלדעתי *הכי מוצלח* במשימו של מחקר מעמיק והצלבת עובדות!! 🤩
רוצים להלביש את עצמכם בבגד מסוים? אפשרי
רוצים לקבל מקורות עם אסמכתאות ממורקרות? אפשרי
רוצים שהוא יבצע מחקר מקיף בעצמו על נושא מסוים ויקרא עשרות ומאות מקורות ויסכם לכם? אפשרי
רוצים להתכתב על המחקר שהוא יצר עבורכם? אפשרי
רוצים להשתמש בזה בחינם בכפוף לכמות מוגבלת? אפשרי
רוצים ליצור תמונות יפות עם AI? גם אפשרי
אחרי שכל זה אפשרי איתו, מה שנשאר זה רק לצפות ב-3 דקות, להירשם אליו וליהנות! זה המקום גם לציין לשבח את Avihai Eliasi היקר, מרצה ה-AI הנפלא, שבזכותו נחשפתי מלכתחילה לכלי המצוין הזה שרק הולך ומשתפר כל הזמן!!
מקווה שקיבלתם ערך, אם כן - אשמח לפרגון בלייק.
יובל
רוצים להלביש את עצמכם בבגד מסוים? אפשרי
רוצים לקבל מקורות עם אסמכתאות ממורקרות? אפשרי
רוצים שהוא יבצע מחקר מקיף בעצמו על נושא מסוים ויקרא עשרות ומאות מקורות ויסכם לכם? אפשרי
רוצים להתכתב על המחקר שהוא יצר עבורכם? אפשרי
רוצים להשתמש בזה בחינם בכפוף לכמות מוגבלת? אפשרי
רוצים ליצור תמונות יפות עם AI? גם אפשרי
אחרי שכל זה אפשרי איתו, מה שנשאר זה רק לצפות ב-3 דקות, להירשם אליו וליהנות! זה המקום גם לציין לשבח את Avihai Eliasi היקר, מרצה ה-AI הנפלא, שבזכותו נחשפתי מלכתחילה לכלי המצוין הזה שרק הולך ומשתפר כל הזמן!!
מקווה שקיבלתם ערך, אם כן - אשמח לפרגון בלייק.
יובל
👍16❤2🔥1
כשאנחנו בונים פתרונות AI אנחנו בלא מודע דוהרים אל תוך סוגיה חשובה: Vendor Lock, אנחנו נועלים את עצמנו ליצרן אחד בלבד
תחשבו על זה. תכננתם מוצר, אפיינתם אותו, התחלתם פיתוח, הכל עובד כמו שעון, כל התלויות שבקוד שלכם מנגנים ביחד בהרמוניה. אבל אז, מודל השפה שבחרתם להשתמש בו, החליט שקריאות ה-API ישתנו. המבנה יהיה אחרת, המודל הנוכחי כבר הופך ללא נתמך, כדי לשדרג למודל החדש צריך לעדכן את הקוד, המחיר משתנה, ואתם - לא רוצים לזעזע את המערכת - ממשיכים להשתמש בו. משנים מה שצריך בקוד, וממשיכים עם המערכת הנוכחית. איזה באסה!
במקרים יותר קיצוניים: אולי מי שמנגיש את המודלים בכלל סוגר את העסק? ואז מה יהיה עלינו? ומה אם השתמשנו עד עכשיו ב-GPT אבל אנחנו רוצים את קלוד או DeepSeek?
כדי להתמודד עם הבעיה הזו, צריך מראש, עוד בשלבי התכנון להחליט אם מלכתחילה בצורה מודעת משתמשים במודל שנועל אותנו ליצרן מסוים?
או שאולי נרצה להשתמש בשירותי LLM מוחצנים. זאת אומרת, חברות כמו Together AI או OpenRouter או DataBricks או AI Foundry של Microsoft או BedRock של AWS - כל אחת מהחברות האלה עשו משהו מאוד יפה: אנחנו פונים בקוד לכתובת אחת בלבד, וכל מה שצריך לשנות זה את שם המודל. לא את אופן פניית ה-API בפועל, אלא רק את שם המודל. זה הכל. למה זה טוב?
כי אנחנו יכולים לעבור בין מודלים ולא להישבר מכל עדכון. נכון, אנחנו עדיין נעולים לחברה מסוימת, אבל אנחנו יכולים בתוך החברה הזו לבחור מודלים אחרים כרצוננו, ובמקרי קיצון לעבור חברה.
ההבנה של Vendor Lock היא חשובה כשמנסים לתכנן מוצר אמיתי שמשלב מודל שפה גדול בתוכו. זה, לצד הצורך לבחון את איכות התשובות של המודל באמצעות כלי Evaluation כפי שפירטתי בפוסט נפרד, עוזרים לנו להתקדם משלב המשחקים לשלב המעשים. משלב שמו לשלב של מוצר פעיל שמוכן לשימוש ההמונים.
כרגיל, שמח לשתף בתהליך הדברים שאני לומד ומקווה שגם אתם מוצאים בכך ערך, בין אם אתם מפתחים, מאפייני מוצר, מעצבי מערכות או כל תפקיד אחר.
שתהיה שבת שלום בתפילה לבשורות טובות לכולנו.
יובל
תחשבו על זה. תכננתם מוצר, אפיינתם אותו, התחלתם פיתוח, הכל עובד כמו שעון, כל התלויות שבקוד שלכם מנגנים ביחד בהרמוניה. אבל אז, מודל השפה שבחרתם להשתמש בו, החליט שקריאות ה-API ישתנו. המבנה יהיה אחרת, המודל הנוכחי כבר הופך ללא נתמך, כדי לשדרג למודל החדש צריך לעדכן את הקוד, המחיר משתנה, ואתם - לא רוצים לזעזע את המערכת - ממשיכים להשתמש בו. משנים מה שצריך בקוד, וממשיכים עם המערכת הנוכחית. איזה באסה!
במקרים יותר קיצוניים: אולי מי שמנגיש את המודלים בכלל סוגר את העסק? ואז מה יהיה עלינו? ומה אם השתמשנו עד עכשיו ב-GPT אבל אנחנו רוצים את קלוד או DeepSeek?
כדי להתמודד עם הבעיה הזו, צריך מראש, עוד בשלבי התכנון להחליט אם מלכתחילה בצורה מודעת משתמשים במודל שנועל אותנו ליצרן מסוים?
או שאולי נרצה להשתמש בשירותי LLM מוחצנים. זאת אומרת, חברות כמו Together AI או OpenRouter או DataBricks או AI Foundry של Microsoft או BedRock של AWS - כל אחת מהחברות האלה עשו משהו מאוד יפה: אנחנו פונים בקוד לכתובת אחת בלבד, וכל מה שצריך לשנות זה את שם המודל. לא את אופן פניית ה-API בפועל, אלא רק את שם המודל. זה הכל. למה זה טוב?
כי אנחנו יכולים לעבור בין מודלים ולא להישבר מכל עדכון. נכון, אנחנו עדיין נעולים לחברה מסוימת, אבל אנחנו יכולים בתוך החברה הזו לבחור מודלים אחרים כרצוננו, ובמקרי קיצון לעבור חברה.
ההבנה של Vendor Lock היא חשובה כשמנסים לתכנן מוצר אמיתי שמשלב מודל שפה גדול בתוכו. זה, לצד הצורך לבחון את איכות התשובות של המודל באמצעות כלי Evaluation כפי שפירטתי בפוסט נפרד, עוזרים לנו להתקדם משלב המשחקים לשלב המעשים. משלב שמו לשלב של מוצר פעיל שמוכן לשימוש ההמונים.
כרגיל, שמח לשתף בתהליך הדברים שאני לומד ומקווה שגם אתם מוצאים בכך ערך, בין אם אתם מפתחים, מאפייני מוצר, מעצבי מערכות או כל תפקיד אחר.
שתהיה שבת שלום בתפילה לבשורות טובות לכולנו.
יובל
👍9🔥2
טיפ זהב לפיתוח ו-AI: הכירו את קבצי ההנחיות הסודיים!
בבית או במשרד יש דפוסי התנהגות קבועים: להדליק את האור בכניסה, לכבות ביציאה, להשאיר מסודר ונקי אחריך וכו׳. אפשר ליישם זאת באמצעות ״לסמוך על״ מי שמגיע שיתנהג כך מבלי לציין זאת מפורשות, או להכין דף הנחיות של ״חוקי בית / משרד״ כפי שמקובל ב-AirBnB למשל.
אם ניקח זאת לעולמות הפיתוח עם כלי AI, גם שם אנחנו יכולים להנחות את הכלים להתנהג בצורה מסוימת באמצעות כתיבת הנחיות בקובץ שיהיה ״חוקי הקוד״ ואליו כלי ה-AI יפנו בעת הפיתוח.
🖱️הקובץ הזה נתמך ב-Cursor באמצעות יצירה של קובץ בשם cursorules
🌊 כנ״ל ב-Windsurf באמצעות יצירת קובץ בשם windsurfrules
⚡️ כנ״ל ב-bolt (שאפשר לפתוח גם מתוך Lovable) באמצעות יצירת קובץ בשם prompt
והנה ההדגמה של כל זה ב-3 הכלים ב-50 שניות בלבד, תודה ל Kevin Karn הנפלא על הסרטון!
שימוש בכך יכול להיות מאוד משמעותי, אפשר להנחות את הכלי לא לעדכן סתם ספריות, לחלק קוד למקטעים קצרים, לדבר איתנו בעברית בלבד, לפתח בשפת קוד ספציפית וכך הלאה. מאוד שימושי מאוד יעיל!
נ.ב - זה אפשרי גם ב-copilot של GitHub הנפלאים.
שבוע טוב, מקווה שקיבלתם ערך, ובשורות טובות בעזרת השם!
יובל
בבית או במשרד יש דפוסי התנהגות קבועים: להדליק את האור בכניסה, לכבות ביציאה, להשאיר מסודר ונקי אחריך וכו׳. אפשר ליישם זאת באמצעות ״לסמוך על״ מי שמגיע שיתנהג כך מבלי לציין זאת מפורשות, או להכין דף הנחיות של ״חוקי בית / משרד״ כפי שמקובל ב-AirBnB למשל.
אם ניקח זאת לעולמות הפיתוח עם כלי AI, גם שם אנחנו יכולים להנחות את הכלים להתנהג בצורה מסוימת באמצעות כתיבת הנחיות בקובץ שיהיה ״חוקי הקוד״ ואליו כלי ה-AI יפנו בעת הפיתוח.
🖱️הקובץ הזה נתמך ב-Cursor באמצעות יצירה של קובץ בשם cursorules
🌊 כנ״ל ב-Windsurf באמצעות יצירת קובץ בשם windsurfrules
⚡️ כנ״ל ב-bolt (שאפשר לפתוח גם מתוך Lovable) באמצעות יצירת קובץ בשם prompt
והנה ההדגמה של כל זה ב-3 הכלים ב-50 שניות בלבד, תודה ל Kevin Karn הנפלא על הסרטון!
שימוש בכך יכול להיות מאוד משמעותי, אפשר להנחות את הכלי לא לעדכן סתם ספריות, לחלק קוד למקטעים קצרים, לדבר איתנו בעברית בלבד, לפתח בשפת קוד ספציפית וכך הלאה. מאוד שימושי מאוד יעיל!
נ.ב - זה אפשרי גם ב-copilot של GitHub הנפלאים.
שבוע טוב, מקווה שקיבלתם ערך, ובשורות טובות בעזרת השם!
יובל
🔥3👍2
כל תורת האפליקציות וה-LLM על רגל אחת
כל אפליקציות ה-LLM נשענות על אותן היסודות: משתמש שולח בקשה לאפליקציה עם שאלה מסוימת, אם אין לנו תשובה אנחנו יכולים לפנות למודל שפה, LLM, ה-LLM לוקח את השאלה של המשתמש, ממיר אותה לאסימונים, Tokens, משם לייצוג מספרי, רשימת מספרים, וקטור, ואז איתו ניגש למאגר הידע *שלו* שהוא ידע שנשמר בבסיס נתונים *וקטורי*, שם הוא מחפש וקטורים נוספים שקרובים אליו, ואז לפי ההגדרות - מחזיר את הווקטורים שהמרחק בינם לבין השאלה של המשתמש - הכי קטן, כי זה אומר שהם הכי קרובים, הכי דומים.
זו כל התורה על רגל אחת. אבל לתוך התורה הזו, בעולם האמיתי יש עוד המון סוגיות:
1. איזה מודל משמש לביצוע ההמרה מטקסט לאסימונים?
2. ואיזה מודל משמש לביצוע ההמרה מאסימונים לווקטורים?
3. ובאיזו טכניקה אנחנו משתמשים כדי לשלוף את המידע חזרה מבסיס הנתונים (Indexing)?
4. ואיך אנחנו מוודאים שהמידע ששלחנו, והמידע שהחזרנו הוא במבנה שהאפליקציה מצפה לקבל?
לכל אחת מהשאלות האלה יש פתרונות שונים. יש מודלים שונים להמרה לטוקנים, או לווקטורים (מודלים של Embeddings), כנ״ל כל מוצר של בסיס נתונים וקטורי מנסה לפתור את עניין אחזור המידע בצורה אחרת בהתאם ללוגיקת Indexing אחרת, ולגבי שמירה על מבנה התשובות אנחנו יכולים להשתמש ב-Instructor או ב-Structured Output, שמשתמשים ב-PyDantic לוולידציה.
את כל הטוב הזה אפשר לארח על שרת ב-Microsoft Azure, AWS, GCP או אפילו על שרת פרטי משלנו. אם בנינו פיתרון כלשהו, ורוצים לאפשר למשתמשים להשתמש בו - זה נקרא SaaS, תוכנה כשירות. ואם זה פשוט אתר, אז זה נקרא אפליקציית Web, כי זה לא סתם אתר, יש כאן לוגיקה מורכבת יותר.
וזו כל תורת האפליקציות וה-LLM - על רגל אחת!
מקווה שקיבלתם ערך.
יובל
כל אפליקציות ה-LLM נשענות על אותן היסודות: משתמש שולח בקשה לאפליקציה עם שאלה מסוימת, אם אין לנו תשובה אנחנו יכולים לפנות למודל שפה, LLM, ה-LLM לוקח את השאלה של המשתמש, ממיר אותה לאסימונים, Tokens, משם לייצוג מספרי, רשימת מספרים, וקטור, ואז איתו ניגש למאגר הידע *שלו* שהוא ידע שנשמר בבסיס נתונים *וקטורי*, שם הוא מחפש וקטורים נוספים שקרובים אליו, ואז לפי ההגדרות - מחזיר את הווקטורים שהמרחק בינם לבין השאלה של המשתמש - הכי קטן, כי זה אומר שהם הכי קרובים, הכי דומים.
זו כל התורה על רגל אחת. אבל לתוך התורה הזו, בעולם האמיתי יש עוד המון סוגיות:
1. איזה מודל משמש לביצוע ההמרה מטקסט לאסימונים?
2. ואיזה מודל משמש לביצוע ההמרה מאסימונים לווקטורים?
3. ובאיזו טכניקה אנחנו משתמשים כדי לשלוף את המידע חזרה מבסיס הנתונים (Indexing)?
4. ואיך אנחנו מוודאים שהמידע ששלחנו, והמידע שהחזרנו הוא במבנה שהאפליקציה מצפה לקבל?
לכל אחת מהשאלות האלה יש פתרונות שונים. יש מודלים שונים להמרה לטוקנים, או לווקטורים (מודלים של Embeddings), כנ״ל כל מוצר של בסיס נתונים וקטורי מנסה לפתור את עניין אחזור המידע בצורה אחרת בהתאם ללוגיקת Indexing אחרת, ולגבי שמירה על מבנה התשובות אנחנו יכולים להשתמש ב-Instructor או ב-Structured Output, שמשתמשים ב-PyDantic לוולידציה.
את כל הטוב הזה אפשר לארח על שרת ב-Microsoft Azure, AWS, GCP או אפילו על שרת פרטי משלנו. אם בנינו פיתרון כלשהו, ורוצים לאפשר למשתמשים להשתמש בו - זה נקרא SaaS, תוכנה כשירות. ואם זה פשוט אתר, אז זה נקרא אפליקציית Web, כי זה לא סתם אתר, יש כאן לוגיקה מורכבת יותר.
וזו כל תורת האפליקציות וה-LLM - על רגל אחת!
מקווה שקיבלתם ערך.
יובל
❤6
Media is too big
VIEW IN TELEGRAM
זה מטורף שזה חינמי: כלי חדש מאפשר לאמן מודל על כל קול שתרצו, עם טונציות אמיתיות, וליצור טקסט לדיבור איכותי. הוא חינמי, קוד מקור פתוח, ולא יאומן שהוא משוחרר ככה לאוויר העולם!
טרם בדקתי אותו בעברית, מי שרוצה מוזמן להתנסות באתר שלהם, חפשו Zonos Zyphra AI ותגיעו לזה בקלות. אני נדהמתי מהרמה שהגענו אליה בכלים החינמיים!
ערב טוב,
יובל
טרם בדקתי אותו בעברית, מי שרוצה מוזמן להתנסות באתר שלהם, חפשו Zonos Zyphra AI ותגיעו לזה בקלות. אני נדהמתי מהרמה שהגענו אליה בכלים החינמיים!
ערב טוב,
יובל
👍11🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
קשה לעכל שזה אמיתי וזמין בפרודקשן: סוכן הקוד של קרסר יודע לכתוב קוד ולשתול אותו במקום המתאים *וגם לתקן לבד, אוטומטית, שגיאות שהוא מזהה תוך כדי* 🤯😳
אמנם אנו רואים את זה פה ושם בקטנה, אבל השיפורים האחרונים מוסיפים לקרסר כלים, כמו להריץ *לבד* פקודות בטרמינל, לקרוא *לבד* לשרתי MCP(!) - שרתים שמהווים API, שער, למודל השפה להפעיל *כל יישום במחשב*! הסוכן גם יודע לכתוב ולקרוא קוד ואפילו לחפש בכל סביבת הקוד. לבד!
זה לא יאומן. באמת. זו מהפכה דרמטית שבעקבותיה מתחולל שינוי בתפיסה במקצועות הקוד. לא עוד תחום ששמור ליחידי סגולה. להיפך, הוא נגיש יותר, מאפשר ליותר ליצור איתו, ובעיקר מצמיח כנפיים של יצירה ומסיר את כבלי הקשיים הטכניים! שינון מתחלף בהבנה, גאונות מתחלפת בהתמדה. עידן משגע לחיות בו!
אמנם אנו רואים את זה פה ושם בקטנה, אבל השיפורים האחרונים מוסיפים לקרסר כלים, כמו להריץ *לבד* פקודות בטרמינל, לקרוא *לבד* לשרתי MCP(!) - שרתים שמהווים API, שער, למודל השפה להפעיל *כל יישום במחשב*! הסוכן גם יודע לכתוב ולקרוא קוד ואפילו לחפש בכל סביבת הקוד. לבד!
זה לא יאומן. באמת. זו מהפכה דרמטית שבעקבותיה מתחולל שינוי בתפיסה במקצועות הקוד. לא עוד תחום ששמור ליחידי סגולה. להיפך, הוא נגיש יותר, מאפשר ליותר ליצור איתו, ובעיקר מצמיח כנפיים של יצירה ומסיר את כבלי הקשיים הטכניים! שינון מתחלף בהבנה, גאונות מתחלפת בהתמדה. עידן משגע לחיות בו!
🤯1😱1
מנהלי ומעצבי מוצר, מפתחים ומפתחות - הכלי הזה בשבילכם! אתר Creatr מאפשר לפתח אתרים יפהפיים, PoCs ו-MVPs בקלות יתירה!
בדומה ל-Lovable, בכלי הזה אנחנו מפרטים מה אנחנו רוצים, רושמים הנחייה טקסטואלית (פרומפט) - והכלי מתחיל: לחשוב, לייצר קוד, לעבור על הקוד בעצמו, לתקן, להתקין מה שצריך, לבדוק שזה עובד, ואז לתת לנו קישור. יש לו חיבור ל-Supabase ו-GitHub, יש לו אפשרויות מתקדמות כמו שינוי העיצוב (אייקונים, תמונות) מתוך הממשק עצמו, הוספת אלמנטים צד ג’ כמו אובייקטים תלת מימדיים, גלריות, אפקטים ועוד המון דברים שאין ב-Lovable.
כשפנו אלי בהתחלה מהחברה הזו בבקשה שאבחן את המוצר, אמרו לי שהם השקיעו המון ושכדאי לי. הייתי סקפטי אבל כיום לאחר שימוש במוצר שלהם אני חייב להגיד וואו. כרגע יש רשימת המתנה ששווה לכם להירשם אליה, חפשו בגוגל את getcreatr, אני לא יכול לפרסם את הלינק בפוסט כי זה מוריד חשיפה אבל כדאי לכם.
אגב, הקלטתי ברכבת סרטון שלם של הדרכה, רבע שעה שאני מדבר לעצמי, ובסוף זה יצא בלי קול (למה שמשהו יעבוד לי חלק ברכבת למען השם?), אז מצרף לכם רק את התוצר של המשחק: יצירת לוח קאנבן (תכנון משימות), מ-2 פרומפטים! הראשון: צור לי לוח קאנבן, השני: הוסף צבע וחיים.
בדומה ל-Lovable, בכלי הזה אנחנו מפרטים מה אנחנו רוצים, רושמים הנחייה טקסטואלית (פרומפט) - והכלי מתחיל: לחשוב, לייצר קוד, לעבור על הקוד בעצמו, לתקן, להתקין מה שצריך, לבדוק שזה עובד, ואז לתת לנו קישור. יש לו חיבור ל-Supabase ו-GitHub, יש לו אפשרויות מתקדמות כמו שינוי העיצוב (אייקונים, תמונות) מתוך הממשק עצמו, הוספת אלמנטים צד ג’ כמו אובייקטים תלת מימדיים, גלריות, אפקטים ועוד המון דברים שאין ב-Lovable.
כשפנו אלי בהתחלה מהחברה הזו בבקשה שאבחן את המוצר, אמרו לי שהם השקיעו המון ושכדאי לי. הייתי סקפטי אבל כיום לאחר שימוש במוצר שלהם אני חייב להגיד וואו. כרגע יש רשימת המתנה ששווה לכם להירשם אליה, חפשו בגוגל את getcreatr, אני לא יכול לפרסם את הלינק בפוסט כי זה מוריד חשיפה אבל כדאי לכם.
אגב, הקלטתי ברכבת סרטון שלם של הדרכה, רבע שעה שאני מדבר לעצמי, ובסוף זה יצא בלי קול (למה שמשהו יעבוד לי חלק ברכבת למען השם?), אז מצרף לכם רק את התוצר של המשחק: יצירת לוח קאנבן (תכנון משימות), מ-2 פרומפטים! הראשון: צור לי לוח קאנבן, השני: הוסף צבע וחיים.
🔥1