קבלו 3 טרנדים בוערים בעולם הפיתוח וה-AI:
מקום שלישי - חבילה בשם sim מאפשרת לייצר סוכני ai באמצעות יצירת workflows. מערכת מבוססת nodes שמקבלת המון כוכבים בשל היותה יחסית קלה ונוחה.
מקום שני - sim - חבילה שמאפשרת לקחת את כל המכשירים שיש לנו בבית (כמעט) ולהפוך אותם ל AI Cluster כדי להריץ מודלים של AI על חומרה ביתית.
ומקום ראשון (בעיני) - חבילה חדשה ששוחררה ע״י refly ai שלטענתה היא פתרון ה״וייב workflow״ הראשון שמאפשר לג׳נרט workflows לאוטומציות! זה מעניין כי הם מאפשרים לג׳נרט תהליכי אוטומציה ל-n8n ומגדירים את עצמם כמיועדים לאנשים לא טכניים! לא פלא שהם זורחים בצורה מטורפת ברשת.
שיהיה לנו שבוע טוב חודש טוב וחנוכה שמח!! 😍🙏
מקום שלישי - חבילה בשם sim מאפשרת לייצר סוכני ai באמצעות יצירת workflows. מערכת מבוססת nodes שמקבלת המון כוכבים בשל היותה יחסית קלה ונוחה.
מקום שני - sim - חבילה שמאפשרת לקחת את כל המכשירים שיש לנו בבית (כמעט) ולהפוך אותם ל AI Cluster כדי להריץ מודלים של AI על חומרה ביתית.
ומקום ראשון (בעיני) - חבילה חדשה ששוחררה ע״י refly ai שלטענתה היא פתרון ה״וייב workflow״ הראשון שמאפשר לג׳נרט workflows לאוטומציות! זה מעניין כי הם מאפשרים לג׳נרט תהליכי אוטומציה ל-n8n ומגדירים את עצמם כמיועדים לאנשים לא טכניים! לא פלא שהם זורחים בצורה מטורפת ברשת.
שיהיה לנו שבוע טוב חודש טוב וחנוכה שמח!! 😍🙏
Media is too big
VIEW IN TELEGRAM
עכשיו ה-AI גם עוזר לתקוף? הכירו את PentestGPT
https://github.com/GreyDGL/PentestGPT?tab=readme-ov-file
https://github.com/GreyDGL/PentestGPT?tab=readme-ov-file
הסיבה האמיתית לאהוב את ננו בננה פרו: גם הוא לא מבין מה נשים רוצות. ביקשתי ממנו תרשים בצורת שכבות ואינפוגרפיקה יפה של ההבדלים בין מה גברים רוצים למה נשים רוצות. יצא למחקר וחזר עם זה 🤣
אחלה בננה זה!!!
הפרומפט שלי (לבקשת רבים):
צור תמונה שבה רואים שכבות תלת מימדיות של ארכיטקטורה מתחת למכסה המנוע של מה נשים רוצות לעומת מה גברים רוצים. שיהיה בעברית, כמו אינפוגרפיקה, כמו של מתכונים שרואים את המוצר בשכבות.
הרעיון הוא להסביר ממה הכל מורכב, ממש פירוק לגורמים כמו פיצוץ, בפירוק לשכבות אבל בצורה שלא מעמיסה על העין ועל ההבנה, שהמסר עובר מהר ברור - ובעיקר ממש יפה.
תמיד תכלול בתחתית חותמת זכויות יוצרים - Yuval Avidani, AI Builder & Speaker, YUV.AI בפינה עם הדמות שלי (שצירפתי כרפרנס)
—
השראה לסגנון הזה קיבלתי מ-2 מקומות:
1. קבוצת הבננות של Shelly Or בפייסבוק שממש מעולה - היה שם פוסט מצוין על סגנון כזה
2. דנה ישראלי פרסמה לאחרונה קרוסלה מטורפת עם המון פרומפטים וסגנונות וגם מזה קיבלתי השראה - Dana Israeli
אז תודה על ההשראה שלי ודנה, ומחכה לראות מה עוד יצרו עכשיו!
אחלה בננה זה!!!
הפרומפט שלי (לבקשת רבים):
צור תמונה שבה רואים שכבות תלת מימדיות של ארכיטקטורה מתחת למכסה המנוע של מה נשים רוצות לעומת מה גברים רוצים. שיהיה בעברית, כמו אינפוגרפיקה, כמו של מתכונים שרואים את המוצר בשכבות.
הרעיון הוא להסביר ממה הכל מורכב, ממש פירוק לגורמים כמו פיצוץ, בפירוק לשכבות אבל בצורה שלא מעמיסה על העין ועל ההבנה, שהמסר עובר מהר ברור - ובעיקר ממש יפה.
תמיד תכלול בתחתית חותמת זכויות יוצרים - Yuval Avidani, AI Builder & Speaker, YUV.AI בפינה עם הדמות שלי (שצירפתי כרפרנס)
—
השראה לסגנון הזה קיבלתי מ-2 מקומות:
1. קבוצת הבננות של Shelly Or בפייסבוק שממש מעולה - היה שם פוסט מצוין על סגנון כזה
2. דנה ישראלי פרסמה לאחרונה קרוסלה מטורפת עם המון פרומפטים וסגנונות וגם מזה קיבלתי השראה - Dana Israeli
אז תודה על ההשראה שלי ודנה, ומחכה לראות מה עוד יצרו עכשיו!
😁2❤1
מתפוצץ לי המוח מהשוואות בין חבילות של פיתוח סוכני AI. אני מקליט על זה קורס ואני מוצא את עצמי משווה את עצמי לדעת. איזה כאב ראש. החלטתי לצמצם את הרעש והרי הוא לפניכם.
המטרה שלי: להבין באיזו חבילת פיתוח הכי כדאי לי להתרכז. אני רוצה חבילה שיש בה הרבה דברים שמקבלים ישירות, בלי יותר מדי לשבור את הראש על הגדרות, אבל שלא תהיה כזו שגוררת עלויות כבדות של טוקנים (כמו לנגצ'יין למשל ששם יש הכל אבל משלמים יפה יפה כי מאחורי הקלעים יש פרומטים מפלצתיים). ניסיתי להבין איזו חבילה תתן לנו:
- יכולת לעבוד עם ריבוי סוכנים
- אינטגרציה קלה ומהירה לכלים מובנים או כאלה שנרצה לפתח (לרבות שרתי MCP), כמו כלים שמאפשרים חיפוש באינטרנט, הרצת קוד במסוף וכדומה
- ניהול סשן כדי לשמור על זיכרון עם המשתמשים
- שמירה על היסטוריה של שיחות בצורה סבירה או קלה
- נקיות קוד, קל להבנה
- עם אפשרות לקבל נתונים, מטריקות, על מה שקורה לנו עם הסוכנים (Open Telemtry, Observability)
- שיהיה קל לפרוס את הסוכן או הסוכנים לאוויר העולם (Deploy)
זה לא היה כזה פשוט. השוויתי בין: Langchain, Langraph, Autogen, Google Agent SDK, Claude Agent SDK, OpenAI Swarm, PyDantic AI, AWS Strands ועוד
שורה תחתונה, אחרי *המון* בדיקות וחפירות, מבחינתי הסיכום של שלושת הגדולים הוא כזה:
3. מקום שלישי - Langraph. יהיו שיצעקו על זה. ויגידו מה פתאום. לנגרף זו חבילה משגעת שבאה עם כל כך הרבה דברים. אבל עקומת הלמידה שלה מאוד לא פשוטה. היא גורמת להתייאש מהר מאוד. משהו שם מאוד לא ידידותי, לא כיפי, ובדרך כלל כאלה דברים גורמים לייאוש מהר מאוד. אז אפשר לנהל הכל אבל זה לא קל. זה מזכיר את היכולת לתכנת באסמלי כדי לנהל את הזיכרון. אבל למה שנעשה את זה אם יש שפות עיליות קלות וטובות? אז פה יש המון כלים אבל בעיני זה המוצא האחרון (מבין הטובים)
2. מקום שני - זה די מפתיע אבל Claude Agent SDK. אנת'רופיק שינו לחבילה של Claude Code SDK את השם. מאוד אהבתי את החבילה הזו כי היא באה עם ים של פיצ'רים, כולל ניהול סשנים, כלים לשליטה על המחשב ובכלל יש כאן הפתעה גדולה מאוד. החיסרון הוא שאין עבודה עם ריבוי סוכנים בצורה אינטואיטיבית, וגם יש נעילה רק למודלים של אנת'רופיק. שזה בסדר למי שרוצה את האקו-סיסטם של קלוד.
1. מקום ראשון בעיני - וזה גם הפתיע אותי, אבל Strands של AWS. יש מגוון מדריכים שמוסברים היטב, יש ארסנל של כלים שמקבלים בצורה מובנית, אפשר לבחור איזה LLM אנחנו רוצים, יש ניהול סשנים, זיכרון, והקוד לכתיבת סוכנים הוא כל כך נקי ביחס לכל האחרים. הקלות שבה אפשר להגדיר עבודה עם ריבוי סוכנים, לנטר אחר מה שקורה, וכל זה מבלי החיוב לעבוד בכלל עם AWS - זה ממש מטורף, ומאוד מאוד נוח. לעניות דעתי, היות שהמון ארגונים אוהבים את AWS וגם ככה רוצים בפרודקשן לעבוד איתם - יש כאן כוח גדול מאוד כפול: גם חבילה Open Source מטורפת, וגם אפשר להשתמש ב-AgentCore במעטפת שלה כדי לבצע Deploy בצורה הכי נוחה שיש.
לגבי יתר החבילות, כרגע הן לא שם מבחינתי. זו רק דעתי. פרודקשן. נוחות. קלות. הבנה של מה מקבלים. קוד נקי. אין ספק ש-Strands ניצחה. ואגב, השילוב עם קלוד אייג'נט דווקא יכול להיות משגע. שניהם ביחד זה פגז.
כל הכבוד לכם Amazon Web Services (AWS) !!
Keshet Brosh Mor Lankry Eldar Gili Nachum Boaz Ziniman Maish Saidel-Keesing Tal Panchek
המטרה שלי: להבין באיזו חבילת פיתוח הכי כדאי לי להתרכז. אני רוצה חבילה שיש בה הרבה דברים שמקבלים ישירות, בלי יותר מדי לשבור את הראש על הגדרות, אבל שלא תהיה כזו שגוררת עלויות כבדות של טוקנים (כמו לנגצ'יין למשל ששם יש הכל אבל משלמים יפה יפה כי מאחורי הקלעים יש פרומטים מפלצתיים). ניסיתי להבין איזו חבילה תתן לנו:
- יכולת לעבוד עם ריבוי סוכנים
- אינטגרציה קלה ומהירה לכלים מובנים או כאלה שנרצה לפתח (לרבות שרתי MCP), כמו כלים שמאפשרים חיפוש באינטרנט, הרצת קוד במסוף וכדומה
- ניהול סשן כדי לשמור על זיכרון עם המשתמשים
- שמירה על היסטוריה של שיחות בצורה סבירה או קלה
- נקיות קוד, קל להבנה
- עם אפשרות לקבל נתונים, מטריקות, על מה שקורה לנו עם הסוכנים (Open Telemtry, Observability)
- שיהיה קל לפרוס את הסוכן או הסוכנים לאוויר העולם (Deploy)
זה לא היה כזה פשוט. השוויתי בין: Langchain, Langraph, Autogen, Google Agent SDK, Claude Agent SDK, OpenAI Swarm, PyDantic AI, AWS Strands ועוד
שורה תחתונה, אחרי *המון* בדיקות וחפירות, מבחינתי הסיכום של שלושת הגדולים הוא כזה:
3. מקום שלישי - Langraph. יהיו שיצעקו על זה. ויגידו מה פתאום. לנגרף זו חבילה משגעת שבאה עם כל כך הרבה דברים. אבל עקומת הלמידה שלה מאוד לא פשוטה. היא גורמת להתייאש מהר מאוד. משהו שם מאוד לא ידידותי, לא כיפי, ובדרך כלל כאלה דברים גורמים לייאוש מהר מאוד. אז אפשר לנהל הכל אבל זה לא קל. זה מזכיר את היכולת לתכנת באסמלי כדי לנהל את הזיכרון. אבל למה שנעשה את זה אם יש שפות עיליות קלות וטובות? אז פה יש המון כלים אבל בעיני זה המוצא האחרון (מבין הטובים)
2. מקום שני - זה די מפתיע אבל Claude Agent SDK. אנת'רופיק שינו לחבילה של Claude Code SDK את השם. מאוד אהבתי את החבילה הזו כי היא באה עם ים של פיצ'רים, כולל ניהול סשנים, כלים לשליטה על המחשב ובכלל יש כאן הפתעה גדולה מאוד. החיסרון הוא שאין עבודה עם ריבוי סוכנים בצורה אינטואיטיבית, וגם יש נעילה רק למודלים של אנת'רופיק. שזה בסדר למי שרוצה את האקו-סיסטם של קלוד.
1. מקום ראשון בעיני - וזה גם הפתיע אותי, אבל Strands של AWS. יש מגוון מדריכים שמוסברים היטב, יש ארסנל של כלים שמקבלים בצורה מובנית, אפשר לבחור איזה LLM אנחנו רוצים, יש ניהול סשנים, זיכרון, והקוד לכתיבת סוכנים הוא כל כך נקי ביחס לכל האחרים. הקלות שבה אפשר להגדיר עבודה עם ריבוי סוכנים, לנטר אחר מה שקורה, וכל זה מבלי החיוב לעבוד בכלל עם AWS - זה ממש מטורף, ומאוד מאוד נוח. לעניות דעתי, היות שהמון ארגונים אוהבים את AWS וגם ככה רוצים בפרודקשן לעבוד איתם - יש כאן כוח גדול מאוד כפול: גם חבילה Open Source מטורפת, וגם אפשר להשתמש ב-AgentCore במעטפת שלה כדי לבצע Deploy בצורה הכי נוחה שיש.
לגבי יתר החבילות, כרגע הן לא שם מבחינתי. זו רק דעתי. פרודקשן. נוחות. קלות. הבנה של מה מקבלים. קוד נקי. אין ספק ש-Strands ניצחה. ואגב, השילוב עם קלוד אייג'נט דווקא יכול להיות משגע. שניהם ביחד זה פגז.
כל הכבוד לכם Amazon Web Services (AWS) !!
Keshet Brosh Mor Lankry Eldar Gili Nachum Boaz Ziniman Maish Saidel-Keesing Tal Panchek
👍4❤1
למה צריך "גורם אנושי" באמצע העבודה של סוכן AI? איך מיישמים את זה? ובונוס: יצרתי ריפו תרגול - מצורף קישור בתגובה.
כשסוכן AI עובד, במקרים מסוימים מומלץ ואפילו חובה לשלב גורם אנושי באמצע כדי לבקר על מה שקורה. זה נקרא "אדם בתהליך" או Human in the Loop (HITL). הרעיון הוא מאוד פשוט ונמחיש באמצעות דוגמא קלאסית: סוכן AI שעובר על המייל שלנו ומשיב בשמנו.
אם אין גורם אנושי באמצע, מה שיקרה הוא שה-AI ינסח מענה וישלח אותו בעצמו. גם אם יש טעויות. גם אם אין. זה לא משנה. הוא מנהל הכל לבדו.
מנגד, אם משלבים גורם אנושי באמצע, אפשר לבקש מהסוכן שלפני שליחה בפועל - להעביר קודם לאישור גורם אנושי ורק לאחר אישור שכשזה - להפיץ את המייל.
מובן לחלוטין למה זה קריטי במקרה הזה. עכשיו תחשבו על דוגמאות נוספות: אבחנה רפואית, סיוע בכתב הגנה משפטי או אפילו בכתיבת פסק או גזר דין, כתיבת תוכן לסושיאל או ניהול תקציבים. אם הכל אוטומטי - בטוח שנאכל אותה. אם אנחנו משלבים תחנות עצירה - יש לנו יותר סיכוי להצליח.
בהמשך לפוסט שלי מאתמול על סוכני AI, אם נקח לדוגמא שוב את Strands של AWS כי זו החבילה שבחרתי להתמקד בה (זו וקלוד אייג'נט SDK) בקורס שלי, יש משהו שנקרא "פסיקות" (מלשון "להפסיק באמצע"). אנחנו יכולים להגדיר לסוכן שלפני שהוא מריץ כלי מסוים, כמו למשל שליחת מיילים, או מחיקת קבצים או כל מה שאנחנו רוצים - להוסיף עצירה ולפנות לגורם אנושי. רק לאחר האישור - הסוכן יתקדם לפעולה.
אגב, פה יש הבדל בין קלוד אייג'נט לבין סטרנדז. לקלוד אין Human in the loop מוכן, צריך לעבור כמה שלבים כדי להשתמש בכזה. מנגד, לסטרנדז יש יכולת מובנית להמתין למענה (צריך להגדיר כמה דברים אבל זה יותר מובנה). בנוסף, לנגרף תוכננה כדי לאפשר Human in the loop בצורה יעילה, אבל כאמור זו חבילה מאוד מורכבת ופחות כיף להתעסק איתה. ולסיכום, הכנתי לכם את התרשים המצורף ואני מזכיר למי שרוצה - הכנתי גם ריפו של מעבדה ל-AWS Strands, מוזמנים לחקור את הדוגמאות. קישור בתגובה.
כשסוכן AI עובד, במקרים מסוימים מומלץ ואפילו חובה לשלב גורם אנושי באמצע כדי לבקר על מה שקורה. זה נקרא "אדם בתהליך" או Human in the Loop (HITL). הרעיון הוא מאוד פשוט ונמחיש באמצעות דוגמא קלאסית: סוכן AI שעובר על המייל שלנו ומשיב בשמנו.
אם אין גורם אנושי באמצע, מה שיקרה הוא שה-AI ינסח מענה וישלח אותו בעצמו. גם אם יש טעויות. גם אם אין. זה לא משנה. הוא מנהל הכל לבדו.
מנגד, אם משלבים גורם אנושי באמצע, אפשר לבקש מהסוכן שלפני שליחה בפועל - להעביר קודם לאישור גורם אנושי ורק לאחר אישור שכשזה - להפיץ את המייל.
מובן לחלוטין למה זה קריטי במקרה הזה. עכשיו תחשבו על דוגמאות נוספות: אבחנה רפואית, סיוע בכתב הגנה משפטי או אפילו בכתיבת פסק או גזר דין, כתיבת תוכן לסושיאל או ניהול תקציבים. אם הכל אוטומטי - בטוח שנאכל אותה. אם אנחנו משלבים תחנות עצירה - יש לנו יותר סיכוי להצליח.
בהמשך לפוסט שלי מאתמול על סוכני AI, אם נקח לדוגמא שוב את Strands של AWS כי זו החבילה שבחרתי להתמקד בה (זו וקלוד אייג'נט SDK) בקורס שלי, יש משהו שנקרא "פסיקות" (מלשון "להפסיק באמצע"). אנחנו יכולים להגדיר לסוכן שלפני שהוא מריץ כלי מסוים, כמו למשל שליחת מיילים, או מחיקת קבצים או כל מה שאנחנו רוצים - להוסיף עצירה ולפנות לגורם אנושי. רק לאחר האישור - הסוכן יתקדם לפעולה.
אגב, פה יש הבדל בין קלוד אייג'נט לבין סטרנדז. לקלוד אין Human in the loop מוכן, צריך לעבור כמה שלבים כדי להשתמש בכזה. מנגד, לסטרנדז יש יכולת מובנית להמתין למענה (צריך להגדיר כמה דברים אבל זה יותר מובנה). בנוסף, לנגרף תוכננה כדי לאפשר Human in the loop בצורה יעילה, אבל כאמור זו חבילה מאוד מורכבת ופחות כיף להתעסק איתה. ולסיכום, הכנתי לכם את התרשים המצורף ואני מזכיר למי שרוצה - הכנתי גם ריפו של מעבדה ל-AWS Strands, מוזמנים לחקור את הדוגמאות. קישור בתגובה.
❤1
מתי כן צריך סוכן ומתי לא? בואו נראה כמה דוגמאות פרקטיות (ותודה לבננה על עוד אינפוגרפיקה שהצלחתי ליצור איתה - רואים שהתאהבתי? איך לא קיבלתי ג׳ינרוטים בחינם מגוגל עדיין אני לא יודע):
1. אני רוצה לערוך וידאו באמצעות ffmpeg, תוכנה שמריצים בטרמינל עם פקודות מסוימות. רק מה? אין לי מושג מה הפקודות, התחביר די מורכב מכדי לזכור בעל פה, וסביר להניח שיהיו שגיאות לאחר הרצה שאצטרך לתקן שוב ושוב. במקרה כזה, כיוון שיש הרבה משתנים - נוח לתת לסוכן שיודע להריץ תוכנות בטרמינל (כמו קלוד אייג׳נט) להתמודד עם זה.
2. לחברה יש המון דאטה. הדאטה מאוד מבולגן. ניסו להשתמש בביטויים רגולטוריים (regex) כדי לחלץ מידע מסוים ממה שמתקבל. למשל, אם מתקבלת פנייה בשירות הלקוחות - נרצה לחלץ את שם הלקוח, כמו פרטים נוספים. כאן אפשר להשתמש במודלים שיודעים לחלץ מידע (למשל עם NER), או שאפשר לתת לסוכן את המשימה.
3. ארגון רוצה לפתח API שמקבל קובץ שמשתמש מעלה - ושומר אותו בבסיס נתונים וקטורי. יש כאן פעולות מוגדרות וברורות. אין צורך בסוכן לשם כך.
4. אנחנו רוצים לג׳נרט תמונה בסגנון מסוים עם מספר אלמנטים מאוד מוגדר בתמונה. אם לא יהיה לנו סוכן - לא נוכל לוודא ״אוטומטית״ שהתוצר לשביעות רצוננו. אם כן נגדיר סוכן, הוא יוכל להסתכל בתוצר ולהכריע האם הוא הסגנון שרצינו או לא. אם כן - אחלה, אם לא - תחזיר לביצוע, עד שנקבל מה שרצינו.
5. אנחנו רוצים ליצור תכנית עבודה שנתית או לערוך Performance Review. אנחנו נרצה סוכן שמבין את המשימה, מעניין בקונטקסט - מבצע את המשימה ומוודא שהיא עמדה בדרישות.
מבינים לאן אנחנו חותרים פה?
כל מקום שבו יש עמימות (קלט מבולגן, לא יודעים בדיוק איזה פקודות להריץ, צורך להפיק תובנות מדאטה מורכב, הרצת תוכנות עם תיקון שגיאות אוטומטי) - סוכן יעזור לנו מאוד.
מנגד, כל פעולה שאפשר להגדיר עם סט חוקים קבוע ומוגדר - לא רק שלא צריך סוכן, אלא עדיף אפילו שלא להשתמש בכזה כלל. זה סתם בזבוז זמן כסף ומאמצים.
דוגמא טובה לזה: מתכון של מנה במסעדה. אם יש מתכון עם שלבים ברורים - לא צריך את השף. זה מיותר.
מנגד, אם יש מצרכים ואין מושג מה להכין - אז פה צריך את השף שיגיע עם הידע שלו וימציא מנה טעימה.
אם יש לכם דוגמאות פרקטיות לסוכנים אשמח לקרוא בתגובות. מסתבר שבגלל הטרנד שהחל לפני כשלוש שנים, שקשור לסוכני AI, המון פיתחו סוכנים כשלא היה בהם כלל צורך. והיום קיימת מגמה הפוכה - לנסות להסיר סוכנים מיותרים ולחזור ללוגיקה פשוטה יותר איפה שאפשר.
1. אני רוצה לערוך וידאו באמצעות ffmpeg, תוכנה שמריצים בטרמינל עם פקודות מסוימות. רק מה? אין לי מושג מה הפקודות, התחביר די מורכב מכדי לזכור בעל פה, וסביר להניח שיהיו שגיאות לאחר הרצה שאצטרך לתקן שוב ושוב. במקרה כזה, כיוון שיש הרבה משתנים - נוח לתת לסוכן שיודע להריץ תוכנות בטרמינל (כמו קלוד אייג׳נט) להתמודד עם זה.
2. לחברה יש המון דאטה. הדאטה מאוד מבולגן. ניסו להשתמש בביטויים רגולטוריים (regex) כדי לחלץ מידע מסוים ממה שמתקבל. למשל, אם מתקבלת פנייה בשירות הלקוחות - נרצה לחלץ את שם הלקוח, כמו פרטים נוספים. כאן אפשר להשתמש במודלים שיודעים לחלץ מידע (למשל עם NER), או שאפשר לתת לסוכן את המשימה.
3. ארגון רוצה לפתח API שמקבל קובץ שמשתמש מעלה - ושומר אותו בבסיס נתונים וקטורי. יש כאן פעולות מוגדרות וברורות. אין צורך בסוכן לשם כך.
4. אנחנו רוצים לג׳נרט תמונה בסגנון מסוים עם מספר אלמנטים מאוד מוגדר בתמונה. אם לא יהיה לנו סוכן - לא נוכל לוודא ״אוטומטית״ שהתוצר לשביעות רצוננו. אם כן נגדיר סוכן, הוא יוכל להסתכל בתוצר ולהכריע האם הוא הסגנון שרצינו או לא. אם כן - אחלה, אם לא - תחזיר לביצוע, עד שנקבל מה שרצינו.
5. אנחנו רוצים ליצור תכנית עבודה שנתית או לערוך Performance Review. אנחנו נרצה סוכן שמבין את המשימה, מעניין בקונטקסט - מבצע את המשימה ומוודא שהיא עמדה בדרישות.
מבינים לאן אנחנו חותרים פה?
כל מקום שבו יש עמימות (קלט מבולגן, לא יודעים בדיוק איזה פקודות להריץ, צורך להפיק תובנות מדאטה מורכב, הרצת תוכנות עם תיקון שגיאות אוטומטי) - סוכן יעזור לנו מאוד.
מנגד, כל פעולה שאפשר להגדיר עם סט חוקים קבוע ומוגדר - לא רק שלא צריך סוכן, אלא עדיף אפילו שלא להשתמש בכזה כלל. זה סתם בזבוז זמן כסף ומאמצים.
דוגמא טובה לזה: מתכון של מנה במסעדה. אם יש מתכון עם שלבים ברורים - לא צריך את השף. זה מיותר.
מנגד, אם יש מצרכים ואין מושג מה להכין - אז פה צריך את השף שיגיע עם הידע שלו וימציא מנה טעימה.
אם יש לכם דוגמאות פרקטיות לסוכנים אשמח לקרוא בתגובות. מסתבר שבגלל הטרנד שהחל לפני כשלוש שנים, שקשור לסוכני AI, המון פיתחו סוכנים כשלא היה בהם כלל צורך. והיום קיימת מגמה הפוכה - לנסות להסיר סוכנים מיותרים ולחזור ללוגיקה פשוטה יותר איפה שאפשר.
ממשיכים עם הסוכנים: מהן אבני הבניין של סוכן AI? ממה הוא מורכב? התרשים לפניכם. ובקיצור:
1. מודל שפה גדול לבחירתנו - בין אם זה גיפיטי, קלוד או מודל אחר כרצוננו
2. כלים, לרבות שרתי MCP, כאן נותנים לסוכן כוח לפעול באמת. כמו חיבור ל-Figma או Jira וכדומה
3. זהות. שזה פרומפט מערכת. הגדרה ברורה של מי הוא ומה תפקידו בעולם
4. בניית מאגר ידע (והגדרת הטכניקה לשמירת זיכרון)
5. חומות הגנה - שכבה שעוזרת לוודא שהתוכן שמוחזר מהסוכן מדויק לצורך, אינו פוגעני ואינו כולל הטיות וכדומה
6. הערכות, Evaluations, כאן נרצה שכבה שמסתכלת על הביצוע של הסוכן ויודעת להעריך האם הוא טוב או לא
7. שחרור לאוויר העולם! Deploy
יש כל מיני חבילות לפיתוח סוכנים, אבל על זה בפעם הבאה בלי נדר בעזרת השם 💪
1. מודל שפה גדול לבחירתנו - בין אם זה גיפיטי, קלוד או מודל אחר כרצוננו
2. כלים, לרבות שרתי MCP, כאן נותנים לסוכן כוח לפעול באמת. כמו חיבור ל-Figma או Jira וכדומה
3. זהות. שזה פרומפט מערכת. הגדרה ברורה של מי הוא ומה תפקידו בעולם
4. בניית מאגר ידע (והגדרת הטכניקה לשמירת זיכרון)
5. חומות הגנה - שכבה שעוזרת לוודא שהתוכן שמוחזר מהסוכן מדויק לצורך, אינו פוגעני ואינו כולל הטיות וכדומה
6. הערכות, Evaluations, כאן נרצה שכבה שמסתכלת על הביצוע של הסוכן ויודעת להעריך האם הוא טוב או לא
7. שחרור לאוויר העולם! Deploy
יש כל מיני חבילות לפיתוח סוכנים, אבל על זה בפעם הבאה בלי נדר בעזרת השם 💪
👍3
אנטומיית סוכן AI: והפעם בשלל סגנונות - לרבות בסגנון חב״ד 🤩
שימו לב לאינפוגרפיקה שבה רואים דמות של הרבי. יהיו שיחשבו שזו זילות ברבי חס ושלום, אבל הכוונה שלי היא הפוכה - אני מאוד אוהב את הרבי מליובאוויטש ולכן אני מביא אותו כדוגמא והשראה אפילו ב-AI! בפרט שהרבי היה מהנדס אלקטרוניקה ועודד אותנו לחבר את הגשמיות לרוחניות.
אז מחילה אם גרמתי לאנשים להרגיש לא בנוח - רק שתדעו שזה דווקא מאהבה לרבי, ולא חלילה ממשהו הפוך.
תראו איזו המחשה מטריפה של ננו בננה פרו. אין לי מילים. יצרתי דרך מינימקס. ביקשתי מהמודל המחשה של אנטומיה של סוכני AI, כתבתי לו בגדול שאני רוצה מודל שפה כלים וזיכרון, כל פעם בסגנון אחר לפי מה שעלה לי בדימיון, לרבות ברוח חב״ד - והנה 😍
שימו לב לאינפוגרפיקה שבה רואים דמות של הרבי. יהיו שיחשבו שזו זילות ברבי חס ושלום, אבל הכוונה שלי היא הפוכה - אני מאוד אוהב את הרבי מליובאוויטש ולכן אני מביא אותו כדוגמא והשראה אפילו ב-AI! בפרט שהרבי היה מהנדס אלקטרוניקה ועודד אותנו לחבר את הגשמיות לרוחניות.
אז מחילה אם גרמתי לאנשים להרגיש לא בנוח - רק שתדעו שזה דווקא מאהבה לרבי, ולא חלילה ממשהו הפוך.
תראו איזו המחשה מטריפה של ננו בננה פרו. אין לי מילים. יצרתי דרך מינימקס. ביקשתי מהמודל המחשה של אנטומיה של סוכני AI, כתבתי לו בגדול שאני רוצה מודל שפה כלים וזיכרון, כל פעם בסגנון אחר לפי מה שעלה לי בדימיון, לרבות ברוח חב״ד - והנה 😍
❤10🔥3😁3👍1