YUV.AI - בינה מלאכותית בעברית
2.43K subscribers
656 photos
409 videos
37 files
438 links
YUV.AI - בינה מלאכותית בעברית
👉 https://yuv.ai 👈
Download Telegram
הלילה דפקתי את הראש על פיתוח שרת MCP כי לנגרף החליטו שסוכני AI יכולים להשתמש בשרתי MCP מבוססי Streamable HTTP בלבד, אבל למה ומה זה אומר?

כשאנחנו מפתחים שרת MCP (או משתמשים בשרת קיים של מישהו אחר), אנחנו יכולים להגדיר את הדרך שבה הלקוח (הסוכן, קלוד, קרסר וכדומה) יתקשר עם שרת ה-MCP. יש 3 צורות תקשורת:

1. תקשורת מקומית עם stdio - המחשב שלנו מריץ את שרת ה-MCP והתקשורת מתבצעת באופן מקומי
2. תקשורת עם sse - במקרה כזה שרת ה-MCP שלנו לא נמצא מקומית אצלנו אלא מתארח במיקום מרוחק וזמין דרך האינטרנט. השרת מקבל מהלקוח 2 פניות, אחת כדי ליצור את החיבור ולשמור אותו פתוח, והשנייה כדי לשלוח משימות לביצוע לשרת ה-MCP
3. תקשורת עם Streamable HTTP - מה זה אומר? כמו סעיף 2. שרת שמתארח בצורה מרוחקת ואפשר לפנות אליו על גבי האינטרנט. רק שכאן יש חידוש: מספיק לשלוח בקשה אחת והתקשורת נשארת פתוחה לניהול הבקשות ולביצוע המשימות

לנגרף, חבילת יצירת הסוכנים ״המתקדמים״ מבית לנגצ׳יין החליטו לתמוך רק בתצורה 3, שנכנסה לתוקף מסוף מרץ בערך. הבעיה היא שכל שרתי ה-MCP הקיימים עובדים בתצורה 1-2, ולכן צריך למצוא שרתים זמינים מסוג 3 או לפתח לבד, כפי שאני ניסיתי הלילה

עוד מסתבר, שהתקשורת בשרתי MCP, יותר נכון המידע שמועבר בין הלקוח לשרת, עובד אחרת מ-REST API. הוא משתמש ב-JSON-RPC בגרסא 2, שמה שזה אומר - מעבירים את הפרמטרים דרך אובייקט JSON ושם מציינים איזה פעולה להריץ, ערכים שמועברים וכדומה.

שרתי stream עוזרים לנו לעבוד טוב יותר בזמן אמת. כמו צ׳אט שמשיב לנו בזמן אמת אות אחר אות, או מודל קולי שמדברים איתו והוא הופך כל מילה לקובץ שמע ומנגן אותה בזמן אמת (במקום שנחכה שכל הטקסט יהפוך לאודיו). זה מאוד שימושי, אנחנו מתקדמים גם בזה. את כל זה למדתי לעומק הלילה והייתי מוכרח לשתף כי זה יכול לעשות סדר לכולם - בעולם שכולו מבולגן.

מעתה אמרו - לפתח שרתי MCP עם Streamable HTTP ופריסה שלהם בענן - זה הדיבור! וזה מה שמאפשר לפתח סוכן על שזמין דרך לנגרף, שמנהל תקשורת בין סוכנים בתצורת A2A, והם עצמם מחזיקים כלים שהם שרתי MCP מרוחקים.

שמחתי לבלגן, לעשות סדר בבלאגן, ולנסות להשאיר מסודר יותר.
👍62
Media is too big
VIEW IN TELEGRAM
מה עושים אחרי סדנא של 3 שעות על אוטומציות ו-AI לבנק הפועלים? יוצרים ברכבת סוכן AI קולי שיודע לעבור בין שפות אוטומטית, להעביר את השיחה לנציג AI אחר או לנציג אנושי אחר, לתמלל את כל השיחה, להקליט אותה וגם להפעיל כלי אוטומציה כמו הכנה לפגישות על בסיס המיילים והזימונים ביומן, איסוף חשבוניות, סיכום הוצאות לפי איתור במייל, קביעת פגישות ושליחת מיילים ועוד.

קבלו את הדמו, ואוטוטו זה מגיע עם העברית הכי טובה שהייתה פה! זה מעבר לפינה! מאמין שתוך שבועות בודדים כבר יש לנו כזה בעברית רהוטה עם שיבוט קולי! כאן אני מדגים את עצמי מדבר עם לוגאן שלי, שיש לו כמובן את הקול שלי. מה שעשו פה ElevenLabs זה טירוף לא נורמלי!
🔥6🤯4
This media is not supported in your browser
VIEW IN TELEGRAM
אני בהלם של החיים מהיכולות של טקסט לדיבור במודל החדש של ElevenLabs. יצרתי פודקאסט של דקה, אני ומורגן פרימן על Vibe Coding. בעברית. מטקסט. עם שיבוט קולי של שנינו. מרגיש ששנים של ציפייה הגיעו לקיצן - זה *מטורף*!!

יצרתי את זה בעורך הטקסט לדיבור תוך שימוש במודל החדש v3 של ElevenLabs עם מנוי בתשלום (של 5 דולר בחודש). אין לי מילים!
8👍1
אחרי מהפכת הטקסט לדיבור בעברית זה פשוט מתבקש: פודקאסט חדש "AI בגובה האוזניים" שבו אארח דמויות AI לשיחות טכניות וכיפיות על טכנולוגיות ובינה מלאכותית, והכל מטקסט לדיבור ושיבוטי קול - בעברית!


הטיזר עלה וזמין בקישור ב-RSS ובקרוב יופץ גם לספוטיפיי ויתר הפלטפורמות. מוזמנים להאזין בינתיים כאן: https://rss.com/podcasts/yuvai/2070483/
🔥81
אני מרגיש שהחיים שלי התחלקו כרגע ל-2: לפני שהתחלתי לעבוד עם Hubspot בשילוב MCP - ואחרי. הגעתי לשלב שאין מנוס מעבודה "מסודרת" עם מערכת ניהול לקוחות (CRM), בהתחלה פיתחתי לעצמי משהו, אח"כ חקרתי מיליארד כלים, ולבסוף החלטתי ללכת על Hubspot, ב-Tier החינמי שלהם.

אחרי שהקמתי לבד את הלקוחות ואת המשימות, החלטתי לחקור גם את השילוב של MCP כדי לתפעל את האבספוט דרך קלוד וגם לחקור את Connectors של GPT. במקרה הזה GPT אכזב, האבספוט זמין רק אם מפעילים את DEEP RESEARCH שזה מיותר לחלוטין. מנגד, קלוד המלך שיחק אותה בענק. הייתי צריך ליצור אפליקציה פרטית בהאבספוט כדי לקבל מפתח API שאותו הגדרתי בקלוד (בהגדרות המפתחים -> הגדרות MCP בקובץ ה-JSON), נתתי הרשאות לאפליקציה בהאבספוט, ועכשיו לא רק שהכל מסודר לי ב-CRM, אלא שאני יכול לנהל הכל דרך קלוד.

כך למשל, כשראיתי שמה שאני מקבל לא מספיק לי ואני רוצה לשנות דברים אבל לא רוצה להתחיל להתעסק בזה בעצמי כי זה מבזבז לי את הזמן - כאן מגיע ה-MCP ומבצע זאת עבורי, ישירות מקלוד - ובלי קוד!

אם אתם כמוני, וצריכים ניהול לקוחות מסודר עם מעקב מסודר, שתדעו שזה פיתרון אדיר, מניח שזה זמין גם במערכות CRM אחרות בתצורה כזו או אחרת, אבל זה משנה חיים. באמת. תהנו!

שבת שלום שקטה ובטוחה, בתפילה לבשורות טובות!

@HubSpot @AnthropicAI
5
עזבו רגע את איראן - לאבאבל ‏מפרגנים עם 24 שעות בחינם לגמרי!!!

ועכשיו חזרה לאיראן. ברוך הטוב והמיטיב. אנחנו חיים בהיסטוריה ורואים אותה בעיניים. כמו מלחמת ששת הימים - אבל מול איראן ובדור שלנו! איזו גאווה להיות חלק מהעם הזה, כל הכבוד לכוחות הביטחון שלנו, אין מדינה כזו בעולם! ותודה לקדוש ברוך הוא שעושה לנו ניסים ונפלאות!! שלא אחד בלבד עמד עומד ויעמוד עלינו לכלותינו - והקב״ה, וכוחות הביטחון שלנו, מצילנו מידם!!

ולגבי ביטול הלימודים לשבוע הקרוב, מאתגר מאוד, אבל באמת ממליץ לנצל את Lovable - תנו לילדים לבנות עם AI בחינם, תנו להם להתעסק ב-AI ופיתוח ללא קוד. שלא יאבדו את זה משעמום או לחץ, שיתעסקו (וגם אנחנו) בטוב, נעשה טוב. ובע״ה שנזכה להרבה טוב ולשובם המהיר בקרוב.

תזכורת ש-Lovable זה אתר שמאפשר לפתח אתרים ללא קוד, הוא מדהים, והוא פתוח בחינם עד 15.6 בשעה 23:59 בלילה. תהנו! שבוע טוב 🤩
8
שיבוש השגרה מעמיד אותי לראשונה בהתמודדות הזו כעצמאי. מצד אחד, פגישות שבוטלו (וזה מובן), מצד שני המדינה לא נותנת גב - לא בדמות של סיוע כלכלי לעסקים, לא ימי ״חופשה״ או ״מחלה״, אנחנו משלמים ביטוח לאומי ומיסים כחוק אבל לא מקבלים שום דבר בתמורה, ממש שום דבר.

אבל! אני מתסכל על זה גם כהזדמנות. יש כל כך הרבה דברים שממתינים לי על השולחן כדי לטפל בהם כמו פלטפורמת הלמידה שלי, סדרת מיני קורסים שאני רוצה להקליט זמן רב, ושינוי המציאות וביטול ״השגרה״ - גורם לי להמציא את עצמי מחדש, שזה אומר איזה כיף שיש הזדמנות להתעסק סופסוף במה שהנחתי בצד אבל רציתי ככ הרבה זמן. אז אפשר להסתכל על זה כ״איך קשה לחיות פה״ ו״המדינה דופקת אותי״, אבל אפשר גם לנסות להסתכל לכיוון אחר, כי זה ממש לתחושתי שה׳ מסיט את המבט שלי לכיוון אחר כדי שאתעסק עכשיו בדברים האחרים. אני יכול להתכחש ולהתמרמר, או שאני יכול לחשוב מחדש על איך אני ממציא את עצמי.

בכל קושי טמונה הזדמנות. יש לנו היום את Lovable פתוח לכולם בחינם, ויש לנו הזדמנות לחשוב על מה שדחינו כל הזמן ועוד לא הגענו אליו - ולהתחיל לטפל בו. בקיצור, איך המשפט המפורסם אומר? לפעמים ה׳ נותן לנו סטירה - לא כדי להכאיב לנו - אלא כדי להסיט את המבט שלנו לכיוון אחר שיותר טוב לנו שבחיים לא היינו מסתכלים לכיוונו אם לא הייתה מגיעה הסטירה 😬

בתפילה לבשורות טובות לכולם! איך אתם הולכים להגשים את עצמכם היום?
11👍5
Media is too big
VIEW IN TELEGRAM
בין הקלטות לפיתוחים עצרתי כדי להראות לכם שהצלחתי לאמן קולות של סלבס ב-ElevenLabs עם המודל החדש V3, וגם לשלב DeepFake בלייב במצלמה ובקול!
👏7😱1
איפה פלטפורמת n8n ממלכדת אותנו?

מצד אחד - n8n שוחרר כקוד מקור פתוח, מה שנותן תחושה ששווה להשתמש במוצר כי הוא חינמי בהתקנה מקומית. רק מה? המייסד שלהם הסביר שבהתחלה המוצר היה חינמי לגמרי 3 שנים, עד שהם החליטו לפתח פיצ׳רים עבור ארגונים - ועבורם הם רוצים לגבות כסף כדי להרוויח. זכותם.

מבחינתנו - ברגע שרוצים להשתמש בגרסא החינמית בפיצ׳רים חשובים כמו משתנים גלובליים או חיבור ל-Git, או שיתוף פעולה בין חברי וחברות צוות בפרויקט קיים, או אפילו דברים בסיסיים כמו למפות בלוגים בתרחישי האוטומציה… פתאום צריך חשבון בתשלום כדי להשתמש, אפילו שמדובר בגרסא הפתוחה שמותקנת מקומית. לדברי המייסד, הגרסא החינמית מקבילה למנוי ה-Starter בתשלום.

ואז זה מוביל למלכוד: מנוי עולה 20 יורו לחודש אם לוקחים מנוי שנתי, בגרסת הבסיס, כך שנוצר מצב שעובדים עם הכלי בהתלהבות על, ואז מגיעים לנקודות האלה ואו שמשדרגים בעל כורחנו או שמתחילים לבנות הכל מחדש בפלטפורמה אחרת.

בבלוג שלהם, n8n אומרים שצריך להסתכל עליהם לא כאל קוד מקור פתוח אלא כאל גרסת ליבה חינמית, ואם רוצים פיצ׳רים נוספים כמו אלה שהזכרנו - לפתוח את הארנק.

אז פעם הבאה לפני ששוב קופצים בהתלהבות על n8n צריך לזכור גם את הדברים האלה. קל מאוד להתלהב מתרחיש שעובד מקומית כשלא לוקחים בחשבון את הצורך הלוגים, משתני סביבה או משתנים גלובליים, שימוש ב-SSO או בכלל, כל מה שקשור לעולם האמיתי. זה נחמד מאוד למשחק, פחות רלוונטי לעולם האמיתי כשמחפשים פתרון Open Source לוקאלי אמיתי. כנראה שבסוף משתמשים יעדיפו לשלם כדי לעבוד בענן של n8n ולקבל את כל זה. מה שאומר מתחילים בהתלהבות בחינם ומהר מאוד מתחילים לשלם גם אם לא רצינו את זה בהתחלה.

זכותם, שוק חופשי, אבל השקיפות הזו חשובה וחבל שהיא מסתתרת ומגלים אותה כשנתקעים עם צורך אמיתי.
1
היום סופסוף השתמשתי ב-Codex, סוכן הקוד החדש של OpenAI שמשתמש במודל שאומן במיוחד לקודבייסים מאוד גדולים וזמין דרך הדפדפן - אז מה זה בכלל?

בעידן שבו כל השחקנים הרציניים נמצאים במגרש הקוד, לקח ל-OpenAI זמן להיכנס. במגרש הזה יש לנו את סוכני הקוד של קלוד, גיטהאב, אמזון - ועכשיו גם את OpenAI. לא מדובר במודל ״הרגיל״ שיודע לג׳נרט קוד, אלא מדובר בסביבה שבה אפשר לחבר ספריות (ריפוז) מגיטהאב, פרטיות או ציבוריות, לתת לסוכן הקוד גישה לאינטרנט, ולשאול שאלות על כל הקודבייס - וכמובן לאתר באגים בריפוז הקיימים, להציע אופטימיזציות, ליצור Pull Request וממש לבצע את כל השלבים עד לשלב ה-Merge שתלוי בבקרה ידנית.

מנגד, הסוכן של גיטהאב קופיילוט, מתחבר מאוד יפה לכל האקוסיסטם של גיטהאב. אפשר לתייג אותו ב-PRs או ב-Issues והוא יצא לדרך לבדו ויעדכן לאחר סיום. גם קלוד קוד בגרסת ה-CLI (טרמינל) יודע לעבוד יפה, הוא לא זול במיוחד אבל הוא מנהל יפה פרויקטים. לעומתם, Codex שאני בדקתי זמין דרך GPT בסרגל הצד ולחיצה על Codex שם תוביל לעמוד החדש. נצטרך ליצור ריפו חדש ידנית בעצמנו בגיטהאב - ורק אח״כ נוכל להשתמש בקודקס. נתחבר עם גיטהאב שלנו, נבחר ספריה, ונבקש מקודקס להשיב על שאלות או לכתוב קוד. מה שיקרה הוא מעניין - סוכן הקוד של OpenAI Codex יעבוד, ירים טרמינל לעצמו, יכתוב את הקוד, יריץ אותו בסביבה סגורה, יבצע בדיקות, ולאחר שסיים יעדכן אותנו שבוצע. אם נשאל אותו שאלות הוא ממש מראה לנו איך הוא מפעיל טרמינל ובודק בעצמו.

לבסוף אנחנו רואים, בתצורת ה״גיטהאב״ הקלאסית את הקוד שנכתב, את מה שהשתנה, כך שזה די נגיש וקל. עם זאת, זה לא נוח שצריך ליצור בעצמנו ריפו, מרגיש שלוקח לכלי המון זמן לעבוד, וגם לא ברור במה הוא טוב יותר מגיטהאב Workspaces או אפילו תשאול מתוך Pinecone או Turbopuffer או Cursor עצמם. זה עוד שחקן במגרש. אני כנראה אחזור אליו בעיקר כדי לבדוק את ההבנה שלו על קודבייסים גדולים. מנגד, אני לא בטוח שבאמת חברות ירגישו בנוח לחבר אותו לסביבת פרודקשן שלהן - ופה דווקא לגיטהאב שוב יתרון גדול. היות והרבה חברות שומרות את הקוד בגיטהאב.

בקיצור, עוד כלי שעוזר להבין קודבייס גדול, לא ברור יתרון כתיבת הקוד שלו. על זה נדע כנראה בהמשך.
👍5
לצערי אני נאלץ לדחות את הכנס שתוכנן ל-30.6 בשל האירועים הביטחוניים. אני עובד על תיאום מועד חדש שבו יהיה ליינאפ אחר אחר אבל תאמינו לי שאני אדאג ואעשה הכל כדי שגם זה יהיה ברמה הכי גבוהה שיש עם הדוברים וסיפורי הלקוחות הכי רלוונטיים ומעניינים שיש!

לשם ההוגנות - כל מי שרכשו כרטיסים - כמובן שהכרטיס נשמר לכם אוטומטית למועד החדש, אני אפיץ במייל עדכון מסודר, ומי שרוצה לבטל את הכרטיס שלו/ה - מוזמנים לשלוח פנייה לכתובת המייל שממנה קיבלתם את אישור ההזמנה - ונטפל. עמכם הסליחה, גם אני מבואס, אבל ככה זה במדינה שלנו. נקווה ונתפלל לטוב 🙏
7👍1
מרעיון של לקוח ל-MVP חי וקיים - תוך חצי רבעון. הכל בזכות v0 + Cursor (עם הבנה טכנית)

לקוח שלי בנה Prototype עם v0 ושלח לי את הקוד - אני לקחתי את זה משם עם Cursor כדי להוסיף צד שרת ולפרוס על AWS בחיבור ל-GitHub. לא האמנתי כמה כאב ראש זה חסך לכולנו.

בגלל שהלקוח עובד בחברה, הוא כבר דאג להגדיר את הצרכים ובאמצעות פרופטינג בנה בעצמו אבטיפוס ממש מרשים. אפילו שאפתני. אבל מבחינתו - זה המוצר. עכשיו צריך להפוך אותו לאמיתי. וכאן אני נכנסתי לתמונה.

לפני הכל - התרשמתי, הופתעתי, וקצת פחדתי. התרשמתי והופתעתי כי זה היה באמת יפה. קצת פחדתי כי הוא בעצם הצליח להוכיח כמה הוא האיץ את תהליכי האיפיון ותכנון המוצר. ממספר חודשים למספר ימים. מטורף.

בשלב הזה אני נכנסתי לתמונה. ובגלל ש-v0 הוא של Vercel, היוצרים של NextJS, הקוד שהלקוח שלח לי (ומבלי שהוא התכוון לכך בכלל) כבר היה פרויקט NextJS, אבל בלי כל הלוגיקה בפועל של ה-LLMs (סוכני AI) ושל השרת ובסיס הנתונים והאותנטיקציה. מה שנותר לי לעשות הוא לפתוח את הפרויקט שלו בקרסר, ולהתחיל להסביר לו מה הפעולות שדורשות צד שרת ואיך אני רוצה אותן. לאחר מכן להוסיף את יתר החיבורים (אני קורא לזה ״חיווט״) יחסית בקלות. ובמהירות רבה כבר הייתה אפליקציה ב-Deploy על AWS שמוכנה ל-QA לקראת שחרור ה-MVP. מחודשים - לימים.

לאחר מכן החלו סבבי תיקונים. הוספת לוגיקה לסוכנים. ועוד Prompt Engineering. לקח עוד מספר שבועות בודדים. כ-2-3, וה-MVP כבר החל לצבור פידבקים ממשתמשים. התהליך הזה, מכלום ושום דבר ל-MVP שהוטמע בחברה, החל והסתיים תוך חצי רבעון, במקום שלושה וחצי רבעונים כפי שספקים טענו שצריך לפרויקט שכזה.

שורה תחתונה, שוב אני רואה את זה בעיניים. מספיקה הבנה טכנית של איך הדברים עובדים - ומשם מנחים את ה-AI מה לבצע, וטסים קדימה. טיסת AI גורמת לכל דבר לקרות. מאיצה תהליכים. משל מדובר במאיץ חלקיקים גרעיני (חייבים להשחיל משהו על איראן, בכל זאת, ענייני דיומא).

אם הלקוח לא היה משתמש ב-v0, או שהוא היה מייצר את הקוד באמצעות חבילות / מסגרות עבודה אחרות שאינן NextJS, עדיין היה אפשר לעבור את התהליך שתיארתי, אבל יש משהו מאוד אינטואיטיבי כשזה v0 - NextJS - ואז עובדים על הקסם האמיתי. ובשבילי זה מרגיש מהיר יותר. הרבה יותר. עובדה שכך גם היה בפועל. יהיו שיגידו בצדק - זה רלוונטי גם אם עובדים ב lovable, bolt, base44, creatr וכו׳. כנראה שאתם צודקים, אבל פה הלקוח הוא זה שבחר את v0 ויצר ״בטעות״ פרויקט NextJS - וכולנו הרווחנו מזה. וגם למדנו ״לטעות״ כך במכוון להבא.

ובנימה זו תודה רבה למי שהמליץ עלי בשושו לתכנית הכוכבים המדהימה של גיטהאב שנקראת GitHub Stars, אין לי מושג מי עשה את זה אבל זה מרגש ותודה רבה!! 🫶🫶🫶
7
Media is too big
VIEW IN TELEGRAM
את זה אתם חייבים לראות: העליתי את ספר החוקים של מדינת ישראל והפכתי אותו לשופט AI שיכול להשיב, לנסח פסקי דין וכל כולו סוכן AI שיכול להיות אפילו שרת MCP בעצמו - והכל בקלות וללא קוד ודרך PINECONE!

קחו לכם 4 דקות ותהנו ממני ומרגליו הנהדרות של יורש העצר שיודע איך לבלות את הזמן בסגר המדהים שלנו 😂
👏141🔥1