מסיבה שאני לא יודע מה היא, לא מעט אנשים לא משתמשים בכלי ה cli החדש של Gemini (אולי המחודש יהיה יותר נכון להגיד ?)
הרגע הם הוציאו שכלול
מכירים את זה שאתם מדברים עם סוכן ונקטעת השיחה , ואז הוא לא זוכר מה קרה זה
מעכשיו אפשר להמשיך את השיחה הקודמת כאילו לא נגמרה מעולם
גאוני
או לפחות חשוב רצח
תנסו את Gemini cli
הוא עושה הכל
(בערך. חוץ מקפה)
הרגע הם הוציאו שכלול
מכירים את זה שאתם מדברים עם סוכן ונקטעת השיחה , ואז הוא לא זוכר מה קרה זה
מעכשיו אפשר להמשיך את השיחה הקודמת כאילו לא נגמרה מעולם
גאוני
או לפחות חשוב רצח
תנסו את Gemini cli
הוא עושה הכל
(בערך. חוץ מקפה)
הלינק הבא, סופר ייחודי (לטעמי)
כשהושק GROK4, אחת האופציות שלו הייתה מודל הHEAVY, שעולה 300 דולר.
גרוק מריץ 4 סוכנים שונים שהוא מנהל והם עובדים במקביל כדי לתת תוצאה אחת.
מישהו ייצר את heavy אבל עם GEMINI 3 PRO. סוג של.
זה רץ בGOOGLE AI STUDIO
אבל זה די פסיכי - תסתכלו על תהליך העבודה שלו, התוצאה מעניינת מאוד
כשהושק GROK4, אחת האופציות שלו הייתה מודל הHEAVY, שעולה 300 דולר.
גרוק מריץ 4 סוכנים שונים שהוא מנהל והם עובדים במקביל כדי לתת תוצאה אחת.
מישהו ייצר את heavy אבל עם GEMINI 3 PRO. סוג של.
זה רץ בGOOGLE AI STUDIO
אבל זה די פסיכי - תסתכלו על תהליך העבודה שלו, התוצאה מעניינת מאוד
ביקשתי מCOMET (של פרפליקסיטי) לבצע לי שינויים במשחק - דרך הAGENT של KILO CODE (כן, עכשיו זה עובד)
היסטרי, תראו איזה חמוד
אגב, כדי להשלים את הסריה, הוא עובד עם הAPI של מיסטרל נדמה לי
הסבר טיפה פחות מתקדם:
COMET - דפדפן של חברת פרפליקסיטי, יש בו מצב של "עוזר" שיכול לבצע פעולות בדפדפן
KILO CODE זה תחליף לCURSOR או WINDSURF או KIRO, או ANTIGRAVITY, הוא מאפשר עבודה עם מודלים
אתמול יצא לו סוכן שעובד בדפדן, ככה שאפשר לעבוד גם לא דרך המחשב
עכשיו ביקשתי מקומט (הסוכן) של פרפליקסיטי לבצע שינויים ולתכנת בעצם משחק כלשהו בתוך הממשק של KILO CODE בדפדפן, וזה מה שהוא עושה.
היסטרי, תראו איזה חמוד
אגב, כדי להשלים את הסריה, הוא עובד עם הAPI של מיסטרל נדמה לי
הסבר טיפה פחות מתקדם:
COMET - דפדפן של חברת פרפליקסיטי, יש בו מצב של "עוזר" שיכול לבצע פעולות בדפדפן
KILO CODE זה תחליף לCURSOR או WINDSURF או KIRO, או ANTIGRAVITY, הוא מאפשר עבודה עם מודלים
אתמול יצא לו סוכן שעובד בדפדן, ככה שאפשר לעבוד גם לא דרך המחשב
עכשיו ביקשתי מקומט (הסוכן) של פרפליקסיטי לבצע שינויים ולתכנת בעצם משחק כלשהו בתוך הממשק של KILO CODE בדפדפן, וזה מה שהוא עושה.
כל מי ששואל אותי באיזה כלי להתחיל אם אתה לא יודע לעשות כלום - אני אומר v0
מהכלי הכי פחות רלוונטי הוא הפך להיות אחד הכלים השווים ביותר
לא רק שהוא מביא אחלה תוצאות
הוא גם מאפשר שילוב של אינטגרציות בקלות ו פריסה קלילה עוד יותר לשרת
למה אני מזכיר את זה ?
שכלול חדש שלהם (כי הם כל הזמן מחדשים):
שיפרו את העורך קוד
אפשר לייצר תיקיות ורבים
אפשר להפעיל חיפוש לקבצים
אפשר מסך מפוצל בעורך
מזכיר שתוכנית בחינם שלהם היא 5 דולר כל חודש גם בלי לשלם שקל או לשים כרטיס אשראי
(ואם תכנסו בחבר מביא חבר אז החודש הראשון זה 10 ואם תרכשו קרדיטים אז גם שם תקבלו כפול בפעם הראשונה כל עוד זה יהיה מחבר מביא חבר
(גילוי נאות מה שאתם תקבלו במסגרת המבצע גם אני אקבל או שתוכלו לא להרשם דרך הלינק הזה תקבלו רגיל בלי הכפלות )
מהכלי הכי פחות רלוונטי הוא הפך להיות אחד הכלים השווים ביותר
לא רק שהוא מביא אחלה תוצאות
הוא גם מאפשר שילוב של אינטגרציות בקלות ו פריסה קלילה עוד יותר לשרת
למה אני מזכיר את זה ?
שכלול חדש שלהם (כי הם כל הזמן מחדשים):
שיפרו את העורך קוד
אפשר לייצר תיקיות ורבים
אפשר להפעיל חיפוש לקבצים
אפשר מסך מפוצל בעורך
מזכיר שתוכנית בחינם שלהם היא 5 דולר כל חודש גם בלי לשלם שקל או לשים כרטיס אשראי
(ואם תכנסו בחבר מביא חבר אז החודש הראשון זה 10 ואם תרכשו קרדיטים אז גם שם תקבלו כפול בפעם הראשונה כל עוד זה יהיה מחבר מביא חבר
(גילוי נאות מה שאתם תקבלו במסגרת המבצע גם אני אקבל או שתוכלו לא להרשם דרך הלינק הזה תקבלו רגיל בלי הכפלות )
סיכום העדכון ב-Claude Code CLI)
קצת רקע מהיר: Claude Code CLI זה כלי CLI (ממשק שורה פקודה) של Anthropic שמשלב את מודל ה-AI Claude כדי לעזור למפתחים לכתוב, לערוך ולנהל קוד בטרמינל. זה כמו עוזר AI אוטונומי שרץ מקומית, חוסך זמן על משימות שגרתיות ומאפשר "סוכנים" (agents) לבצע פעולות מורכבות.
העדכון מהיום מוסיף תכונות שמשפרות אוטומציה, ביצועים וניהול – מושלם למי שעובד על פרויקטים גדולים ומשתמש ב-AI יומיומי.
אז מה חדש.?
1. Async Subagents (סוכנים משנה אסינכרוניים):
- עכשיו, סוכן ראשי יכול "spawn" סוכנים קטנים שרצים ברקע באופן עצמאי – גם אם הסוכן הראשי נרדם או נגמר.
- למה זה מגניב? למשימות ארוכות כמו ניטור לוגים (יומני שגיאות), המתנה לבילדים (builds) או סריקות תקופתיות (כמו בדיקת GitHub issues כל 30 שניות). זה מפחית את הצורך בהתערבות ידנית ומאפשר workflow מקבילי יותר, בלי לבזבז משאבים על polling ידני.
- במילים פשוטות: ה-AI עכשיו "מרובה משימות" כמו צוות, לא סולו.
2. Instant Compact:
- שיפור דרמטי במהירות של "compacting" – תהליך שבו ה-AI מצמצם ומסדר את ההקשר (context) כדי למנוע הצפה מטקסט ארוך.
- עכשיו זה לוקח שניות במקום דקות, אז אתה לא נתקע מחכה. אידיאלי למי שעובד עם קוד גדול או שרשורים ארוכים, כי זה שומר על זרימה חלקה בלי הפסקות.
3. Customer Session Names (שמות סשנים מותאמים):
- אפשר להשתמש בפקודה
- בנוסף: קיצורי מקלדת במסך
- למה זה שימושי? אם אתה עובד על כמה פרויקטים במקביל (כמו app אחת ב-React ו-backend ב-Node), זה מקל על מעבר בין סביבות ומפחית בלבול.
4. Usage Stats (/stats):
- פקודה חדשה שמייצרת ויזואליזציה (גרף פשוט) של השימוש היומי: כמה סשנים, streak (רצף שימוש), ומודלים מועדפים.
- זה כולל נתונים על טוקנים (יחידות חישוב AI) – עוזר לעקוב אחרי עלויות (אם אתה בתוכנית בתשלום) ולנתח הרגלי עבודה.
איך להתחיל? רץ
בקיצור: העדכון הופך את Claude Code ליותר חכם, יעיל ומאורגן – פחות ניהול ידני, יותר קוד אמיתי. אם אתה ב-dev, תנסה ותראה איך זה משנה את היום-יום. 🚀
קצת רקע מהיר: Claude Code CLI זה כלי CLI (ממשק שורה פקודה) של Anthropic שמשלב את מודל ה-AI Claude כדי לעזור למפתחים לכתוב, לערוך ולנהל קוד בטרמינל. זה כמו עוזר AI אוטונומי שרץ מקומית, חוסך זמן על משימות שגרתיות ומאפשר "סוכנים" (agents) לבצע פעולות מורכבות.
העדכון מהיום מוסיף תכונות שמשפרות אוטומציה, ביצועים וניהול – מושלם למי שעובד על פרויקטים גדולים ומשתמש ב-AI יומיומי.
אז מה חדש.?
1. Async Subagents (סוכנים משנה אסינכרוניים):
- עכשיו, סוכן ראשי יכול "spawn" סוכנים קטנים שרצים ברקע באופן עצמאי – גם אם הסוכן הראשי נרדם או נגמר.
- למה זה מגניב? למשימות ארוכות כמו ניטור לוגים (יומני שגיאות), המתנה לבילדים (builds) או סריקות תקופתיות (כמו בדיקת GitHub issues כל 30 שניות). זה מפחית את הצורך בהתערבות ידנית ומאפשר workflow מקבילי יותר, בלי לבזבז משאבים על polling ידני.
- במילים פשוטות: ה-AI עכשיו "מרובה משימות" כמו צוות, לא סולו.
2. Instant Compact:
- שיפור דרמטי במהירות של "compacting" – תהליך שבו ה-AI מצמצם ומסדר את ההקשר (context) כדי למנוע הצפה מטקסט ארוך.
- עכשיו זה לוקח שניות במקום דקות, אז אתה לא נתקע מחכה. אידיאלי למי שעובד עם קוד גדול או שרשורים ארוכים, כי זה שומר על זרימה חלקה בלי הפסקות.
3. Customer Session Names (שמות סשנים מותאמים):
- אפשר להשתמש בפקודה
/rename כדי לתת שמות אישיים לסשנים קודמים – במקום להיזכר רק לפי תאריך/ID.- בנוסף: קיצורי מקלדת במסך
/resume – 'R' לשינוי שם, 'P' לתצוגה מקדימה.- למה זה שימושי? אם אתה עובד על כמה פרויקטים במקביל (כמו app אחת ב-React ו-backend ב-Node), זה מקל על מעבר בין סביבות ומפחית בלבול.
4. Usage Stats (/stats):
- פקודה חדשה שמייצרת ויזואליזציה (גרף פשוט) של השימוש היומי: כמה סשנים, streak (רצף שימוש), ומודלים מועדפים.
- זה כולל נתונים על טוקנים (יחידות חישוב AI) – עוזר לעקוב אחרי עלויות (אם אתה בתוכנית בתשלום) ולנתח הרגלי עבודה.
איך להתחיל? רץ
claude update בטרמינל כדי לקבל את הגרסה החדשה – הכל זמין עכשיו.בקיצור: העדכון הופך את Claude Code ליותר חכם, יעיל ומאורגן – פחות ניהול ידני, יותר קוד אמיתי. אם אתה ב-dev, תנסה ותראה איך זה משנה את היום-יום. 🚀
https://cursor.com/changelog/2-2
Cursor 2.2, הגרסה החדשה של עורך הקוד הפופולרי המונע בינה מלאכותית, יצאה עם שני שיפורים משמעותיים שמשנים את חוויית הפיתוח: מצב Debug Mode ומצב Plan Mode משופר.
הכוכב האמיתי הוא Debug Mode – הכלי הראשון מסוגו שמאפשר ל-AI לראות בזמן אמת את כל מה שקורה בתוך הקוד הרץ. במקום שהמפתח יצטרך להעתיק לוגים, להסביר באגים ידנית או לכתוב הדפסות זמניות, Cursor מוסיף אינסטרומנטציה אוטומטית לקוד, אוסף את כל הלוגים והמשתנים, ומזרים אותם ישירות לסוכן הבינה המלאכותית שמתקן את הבאג תוך שניות – גם כשמדובר בבעיות שרת מורכבות או קוד בשפות שונות.
בנוסף, Plan Mode קיבל שדרוג רציני: עכשיו אפשר ליצור דיאגרמות Mermaid ישירות בתוך רשימת המשימות, ולפצל כל משימה לכמה סוכני AI מקבילים. המערכת מפעילה תחרות אוטומטית בין הסוכנים, בוחרת את הפתרון הטוב ביותר ומסבירה למה הוא עדיף – מה שמאפשר פתרון מהיר ויעיל במיוחד של בעיות מורכבות.
לי אישית החלק הראשון מזכיר נורא את antigravity של גוגל
Cursor 2.2, הגרסה החדשה של עורך הקוד הפופולרי המונע בינה מלאכותית, יצאה עם שני שיפורים משמעותיים שמשנים את חוויית הפיתוח: מצב Debug Mode ומצב Plan Mode משופר.
הכוכב האמיתי הוא Debug Mode – הכלי הראשון מסוגו שמאפשר ל-AI לראות בזמן אמת את כל מה שקורה בתוך הקוד הרץ. במקום שהמפתח יצטרך להעתיק לוגים, להסביר באגים ידנית או לכתוב הדפסות זמניות, Cursor מוסיף אינסטרומנטציה אוטומטית לקוד, אוסף את כל הלוגים והמשתנים, ומזרים אותם ישירות לסוכן הבינה המלאכותית שמתקן את הבאג תוך שניות – גם כשמדובר בבעיות שרת מורכבות או קוד בשפות שונות.
בנוסף, Plan Mode קיבל שדרוג רציני: עכשיו אפשר ליצור דיאגרמות Mermaid ישירות בתוך רשימת המשימות, ולפצל כל משימה לכמה סוכני AI מקבילים. המערכת מפעילה תחרות אוטומטית בין הסוכנים, בוחרת את הפתרון הטוב ביותר ומסבירה למה הוא עדיף – מה שמאפשר פתרון מהיר ויעיל במיוחד של בעיות מורכבות.
לי אישית החלק הראשון מזכיר נורא את antigravity של גוגל
Cursor
Debug Mode, Plan Mode Improvements, Multi-Agent Judging, and Pinned Chats · Cursor
כל האינטרנט בבאז על זה שמחר יוצא chat got 5.2 הידוע בכינויו garlic
נחכה ונראה.
נחכה ונראה.
5V)
הדגם הקודם, GLM-4.5V (ששוחרר באוגוסט 2025), כבר היה חזק מאוד בהבנת תמונות וסרטונים, עם ביצועים מצוינים ב-42 מבחנים ויזואליים ויכולות כמו חשיבה צעד-אחר-צעד (Chain-of-Thought). אבל GLM-4.6V מביא שיפורים משמעותיים שמקדמים אותו צעד קדימה, בעיקר בתחום הסוכנים האוטומטיים והשימוש בכלים:
- הרחבת חלון הקונטקסט: עכשיו 128,000 טוקנים (לעומת 128K בדגם הקודם, אבל עם אימון טוב יותר על נתונים ארוכים), מה שמאפשר עיבוד סרטונים ארוכים יותר (עד שעה) או מסמכים של 150 עמודים בבת אחת, בלי איבוד מידע.
- קריאה טבעית לפונקציות ויזואליות (Native Function Calling): זה החידוש הגדול ביותר – בדגם הקודם, הסוכנים היו צריכים להמיר תמונות לטקסט קודם (מה שגורם לאיבוד מידע ועיכובים), אבל עכשיו המודל מעביר נתונים ויזואליים ישירות לכלים חיצוניים, כמו חיפוש באינטרנט או יצירת גרפים. זה מקצר את התהליך ומשפר את הדיוק ב-15% במשימות סוכנים.
- שיפור בביצועים ספציפיים: במבחן MathVista (מתמטיקה ויזואלית) – 88.2% לעומת 84.6%; ב-WebVoyager (סוכנים בגלישה) – 81.0% לעומת 68.4% במודלים דומים; וב-Ref-L4-test (הבנת התייחסויות בתמונות) – 88.9% עם דיוק גבוה יותר בהקשרים (grounding fidelity). בסך הכול, שיפור של 5-10% במשימות מורכבות כמו בניית קוד או ניתוח נתונים.
- אופטימיזציה לסוכנים: הדגם החדש מתמקד יותר ב"פעולה" מאשר רק "חשיבה" – הוא יכול לשלב תוצאות מכלים (כמו תמונות מחיפוש) ישירות לתהליך ההיגיון, מה שהופך אותו למתאים יותר לאפליקציות עסקיות כמו חיפוש ויזואלי או יצירת דוחות
אוטומטיים.
בקיצור, GLM-4.6V הופך את הדגם הקודם ממשהו ש"מבין" תמונות למשהו ש"פועל" עליהן, עם פחות טעויות ומהירות גבוהה יותר.
#### קישורים רשמיים וחשובים
- הפוסט הרשמי ב-X (טוויטר):
- הבלוג הטכני המלא (עם טבלאות וגרפים):
- דף HuggingFace של הדגמים:
– GLM-4.6V-Flash-9B:
– GLM-4.6V-Plus-106B:
- GitHub רשמי עם דוגמאות קוד והרצה:
- דוגמאות אונליין (דרך ChatGLM.cn):
הדגם הקודם, GLM-4.5V (ששוחרר באוגוסט 2025), כבר היה חזק מאוד בהבנת תמונות וסרטונים, עם ביצועים מצוינים ב-42 מבחנים ויזואליים ויכולות כמו חשיבה צעד-אחר-צעד (Chain-of-Thought). אבל GLM-4.6V מביא שיפורים משמעותיים שמקדמים אותו צעד קדימה, בעיקר בתחום הסוכנים האוטומטיים והשימוש בכלים:
- הרחבת חלון הקונטקסט: עכשיו 128,000 טוקנים (לעומת 128K בדגם הקודם, אבל עם אימון טוב יותר על נתונים ארוכים), מה שמאפשר עיבוד סרטונים ארוכים יותר (עד שעה) או מסמכים של 150 עמודים בבת אחת, בלי איבוד מידע.
- קריאה טבעית לפונקציות ויזואליות (Native Function Calling): זה החידוש הגדול ביותר – בדגם הקודם, הסוכנים היו צריכים להמיר תמונות לטקסט קודם (מה שגורם לאיבוד מידע ועיכובים), אבל עכשיו המודל מעביר נתונים ויזואליים ישירות לכלים חיצוניים, כמו חיפוש באינטרנט או יצירת גרפים. זה מקצר את התהליך ומשפר את הדיוק ב-15% במשימות סוכנים.
- שיפור בביצועים ספציפיים: במבחן MathVista (מתמטיקה ויזואלית) – 88.2% לעומת 84.6%; ב-WebVoyager (סוכנים בגלישה) – 81.0% לעומת 68.4% במודלים דומים; וב-Ref-L4-test (הבנת התייחסויות בתמונות) – 88.9% עם דיוק גבוה יותר בהקשרים (grounding fidelity). בסך הכול, שיפור של 5-10% במשימות מורכבות כמו בניית קוד או ניתוח נתונים.
- אופטימיזציה לסוכנים: הדגם החדש מתמקד יותר ב"פעולה" מאשר רק "חשיבה" – הוא יכול לשלב תוצאות מכלים (כמו תמונות מחיפוש) ישירות לתהליך ההיגיון, מה שהופך אותו למתאים יותר לאפליקציות עסקיות כמו חיפוש ויזואלי או יצירת דוחות
אוטומטיים.
בקיצור, GLM-4.6V הופך את הדגם הקודם ממשהו ש"מבין" תמונות למשהו ש"פועל" עליהן, עם פחות טעויות ומהירות גבוהה יותר.
#### קישורים רשמיים וחשובים
- הפוסט הרשמי ב-X (טוויטר):
- הבלוג הטכני המלא (עם טבלאות וגרפים):
- דף HuggingFace של הדגמים:
– GLM-4.6V-Flash-9B:
– GLM-4.6V-Plus-106B:
- GitHub רשמי עם דוגמאות קוד והרצה:
- דוגמאות אונליין (דרך ChatGLM.cn):
X (formerly Twitter)
Z.ai (@Zai_org) on X
GLM-4.6V Series is here🚀
- GLM-4.6V (106B): flagship vision-language model with 128K context
- GLM-4.6V-Flash (9B): ultra-fast, lightweight version for local and low-latency workloads
First-ever native Function Calling in the GLM vision model family
Weights:
- GLM-4.6V (106B): flagship vision-language model with 128K context
- GLM-4.6V-Flash (9B): ultra-fast, lightweight version for local and low-latency workloads
First-ever native Function Calling in the GLM vision model family
Weights:
אני תמיד חופר לכם על glm 4.6 שיכול להחליף את הדגמים של אנתרופיק ב Claude code
אז הם הוציאו דגם חדש. למעשה שניים :
חברת Z.ai, שזה שיתוף פעולה בין אוניברסיטת צ'ינגהואה בסין וחברת Zhipu AI, פרסמה סדרה חדשה של מודלי בינה מלאכותית פתוחים לקהל הרחב בשם GLM-4.6V. אלה מודלים שמסוגלים לעבד לא רק טקסט, אלא גם תמונות וסרטונים, וזה כולל כמה חידושים ראשונים מסוגם בעולם המודלים הפתוחים. ההכרזה הזו חשובה כי היא מביאה יכולות מתקדמות שמתחרות במודלים מסחריים גדולים כמו Gemini 3 של גוגל (ששוחרר בנובמבר 2025) או Claude, אבל כאן הכול זמין בחינם לקהילה.
#### הדגמים החדשים ששוחררו
יש שני דגמים עיקריים בסדרה:
1. GLM-4.6V-Flash (מודל קטן עם כ-9 מיליארד פרמטרים פעילים)
זה מודל מהיר וקל משקל, שמתאים במיוחד למשימות שדורשות תגובה מהירה. הוא יכול לטפל בכמות גדולה של מידע בבת אחת (עד 128,000 יחידות מידע, כמו טקסט ארוך או סרטונים). הדגם הזה מיועד לשימוש יומיומי, כמו אפליקציות בטלפון או במחשב, והוא עובד טוב גם במכשירים לא הכי חזקים.
2. GLM-4.6V-Plus (מודל גדול עם כ-106 מיליארד פרמטרים, מבנה מיוחד שנקרא Mixture of Experts)
זה הדגם החזק ביותר בסדרה, שמיועד למשימות מורכבות יותר. גם הוא יכול לטפל בכמות גדולה של מידע (128,000 יחידות), והוא מצטיין בעיבוד דברים כמו מסמכים ארוכים, סרטונים של עשרות דקות, או יצירת כלים אוטומטיים. החידוש הגדול כאן הוא שהוא הראשון בעולם הפתוח שמאפשר "קריאה לפונקציות" ישירות מתוך ניתוח תמונה או סרטון – כלומר, הוא יכול להפעיל כלים חיצוניים כמו חישובים או חיפושים על סמך מה שהוא רואה.
שימו לב: אמנם הדגמים זמינים להורדה חופשית, אבל להריץ את הדגם הגדול (Plus) דורש מחשב חזק מאוד עם כרטיסי מסך מיוחדים, ולא כל מחשב ממוצע יוכל להתמודד עם זה בקלות. הדגם הקטן (Flash) יותר נגיש למשתמשים רגילים.
#### ביצועים ובדיקות השוואתיות
המודלים האלה נבדקו במבחנים סטנדרטיים שונים, והתוצאות מראות שהם מצליחים יותר ממודלים דומים אחרים. לגבי ההשוואה ל-Gemini 3: זה נכון ש-Gemini 3 Pro (ששוחרר בנובמבר 2025) הוא מודל חזק מאוד, עם יכולות מתקדמות בהיגיון מורכב, עיבוד וידאו ותמיכה בחלון קונטקסט גדול (עד מיליון טוקנים). הוא מצטיין במשימות כמו פתרון בעיות מדעיות קשות או יצירת קוד מורכב, ומקבל ציונים גבוהים במבחנים כמו MMMU-Pro (לעיבוד תמונות) ו-WebDev Arena (לבניית אתרים). עם זאת, GLM-4.6V מציע יתרונות משלו: הוא זול יותר (כ-5-7 פעמים פחות בעלות על טוקנים), פתוח לחלוטין (אפשר להוריד ולהתאים אישית), ומצטיין במשימות ויזואליות ספציפיות כמו הבנת מסמכים או סוכנים אוטומטיים. לדוגמה, במבחנים כמו MMBench (הבנת תמונות כללית), GLM-4.6V מקבל 88.8% – קרוב מאוד ל-Gemini 3 Flash אבל עם ביצועים טובים יותר במודלים פתוחים דומים. בסופו של דבר, GLM-4.6V לא עוקף את Gemini 3 בכל דבר, אבל הוא אלטרנטיבה חזקה וזולה יותר, במיוחד למשימות ויזואליות ועסקיות.
דוגמאות נוספות לביצועים:
- במבחן כללי להבנת תמונות וטקסט (MMBench V1): 88.8% הצלחה – זה גבוה יותר ממודלים פתוחים כמו Qwen2-VL-7B, ואפילו מהדגם הקודם של Z.ai עצמם.
- במשימה של יצירת קוד ממסך (Design2Code): 88.6% – זה כולל לקחת צילום מסך של אתר או אפליקציה ולהפוך אותו לקוד תכנותי אמיתי, מה שמאוד קשה.
- במבחנים אחרים כמו הבנת סרטונים (VideoMME), מתמטיקה חזותית (MathVista), או זיהוי טעויות בתמונות (HallusionBench): הם במקום ראשון או שני בין כל המודלים הפתוחים. זה אומר שהם טובים יותר בהבנת עולם אמיתי, כמו לנתח תרשימים, טבלאות או סצנות מסרטונים.
הבדיקות האלה נעשו על ידי גופים חיצוניים, והתוצאות מפורטות בבלוג שלהם עם גרפים וטבלאות להשוואה.
#### יכולות חדשות ומפורטות
הסדרה הזו מביאה כמה יכולות פרקטיות שמקלות על שימוש יומיומי:
- עיבוד מסמכים מורכבים: יכול לנתח דפים ארוכים עם טבלאות, גרפים, טפסים או תרשימים – למשל, לקרוא חשבונית, להבין את הנתונים ולחשב סכומים אוטומטית.
- הבנת סרטונים ארוכים: מסוגל לצפות בסרטון של עשרות דקות ולסכם אותו, לענות על שאלות ספציפיות (כמו "מה קרה בדקה ה-15?") או לזהות אובייקטים ואירועים.
- קריאה לפונקציות ופלט מובנה: זה אומר שהמודל יכול להפעיל כלים חיצוניים ישירות – לדוגמה, לראות תמונה של משוואה מתמטית ולפתור אותה בעזרת מחשבון, או לנתח תמונה של אתר וליצור קוד HTML תואם. זה שימושי במיוחד לבניית אפליקציות אוטומטיות או "סוכנים" שפועלים לבד.
- תמיכה בפלט מסודר: המודל יכול להחזיר תשובות בצורה מובנית, כמו רשימות או טבלאות, במקום טקסט חופשי בלבד.
- שימושים נוספים: מתאים למשימות כמו זיהוי טעויות בתמונות (האם זה הזיה או אמיתי?), עיבוד תמונות מדעיות, או יצירת תוכן מבוסס ויזואלי.
#### החידושים לעומת הדגם הישן (GLM-4.
אז הם הוציאו דגם חדש. למעשה שניים :
חברת Z.ai, שזה שיתוף פעולה בין אוניברסיטת צ'ינגהואה בסין וחברת Zhipu AI, פרסמה סדרה חדשה של מודלי בינה מלאכותית פתוחים לקהל הרחב בשם GLM-4.6V. אלה מודלים שמסוגלים לעבד לא רק טקסט, אלא גם תמונות וסרטונים, וזה כולל כמה חידושים ראשונים מסוגם בעולם המודלים הפתוחים. ההכרזה הזו חשובה כי היא מביאה יכולות מתקדמות שמתחרות במודלים מסחריים גדולים כמו Gemini 3 של גוגל (ששוחרר בנובמבר 2025) או Claude, אבל כאן הכול זמין בחינם לקהילה.
#### הדגמים החדשים ששוחררו
יש שני דגמים עיקריים בסדרה:
1. GLM-4.6V-Flash (מודל קטן עם כ-9 מיליארד פרמטרים פעילים)
זה מודל מהיר וקל משקל, שמתאים במיוחד למשימות שדורשות תגובה מהירה. הוא יכול לטפל בכמות גדולה של מידע בבת אחת (עד 128,000 יחידות מידע, כמו טקסט ארוך או סרטונים). הדגם הזה מיועד לשימוש יומיומי, כמו אפליקציות בטלפון או במחשב, והוא עובד טוב גם במכשירים לא הכי חזקים.
2. GLM-4.6V-Plus (מודל גדול עם כ-106 מיליארד פרמטרים, מבנה מיוחד שנקרא Mixture of Experts)
זה הדגם החזק ביותר בסדרה, שמיועד למשימות מורכבות יותר. גם הוא יכול לטפל בכמות גדולה של מידע (128,000 יחידות), והוא מצטיין בעיבוד דברים כמו מסמכים ארוכים, סרטונים של עשרות דקות, או יצירת כלים אוטומטיים. החידוש הגדול כאן הוא שהוא הראשון בעולם הפתוח שמאפשר "קריאה לפונקציות" ישירות מתוך ניתוח תמונה או סרטון – כלומר, הוא יכול להפעיל כלים חיצוניים כמו חישובים או חיפושים על סמך מה שהוא רואה.
שימו לב: אמנם הדגמים זמינים להורדה חופשית, אבל להריץ את הדגם הגדול (Plus) דורש מחשב חזק מאוד עם כרטיסי מסך מיוחדים, ולא כל מחשב ממוצע יוכל להתמודד עם זה בקלות. הדגם הקטן (Flash) יותר נגיש למשתמשים רגילים.
#### ביצועים ובדיקות השוואתיות
המודלים האלה נבדקו במבחנים סטנדרטיים שונים, והתוצאות מראות שהם מצליחים יותר ממודלים דומים אחרים. לגבי ההשוואה ל-Gemini 3: זה נכון ש-Gemini 3 Pro (ששוחרר בנובמבר 2025) הוא מודל חזק מאוד, עם יכולות מתקדמות בהיגיון מורכב, עיבוד וידאו ותמיכה בחלון קונטקסט גדול (עד מיליון טוקנים). הוא מצטיין במשימות כמו פתרון בעיות מדעיות קשות או יצירת קוד מורכב, ומקבל ציונים גבוהים במבחנים כמו MMMU-Pro (לעיבוד תמונות) ו-WebDev Arena (לבניית אתרים). עם זאת, GLM-4.6V מציע יתרונות משלו: הוא זול יותר (כ-5-7 פעמים פחות בעלות על טוקנים), פתוח לחלוטין (אפשר להוריד ולהתאים אישית), ומצטיין במשימות ויזואליות ספציפיות כמו הבנת מסמכים או סוכנים אוטומטיים. לדוגמה, במבחנים כמו MMBench (הבנת תמונות כללית), GLM-4.6V מקבל 88.8% – קרוב מאוד ל-Gemini 3 Flash אבל עם ביצועים טובים יותר במודלים פתוחים דומים. בסופו של דבר, GLM-4.6V לא עוקף את Gemini 3 בכל דבר, אבל הוא אלטרנטיבה חזקה וזולה יותר, במיוחד למשימות ויזואליות ועסקיות.
דוגמאות נוספות לביצועים:
- במבחן כללי להבנת תמונות וטקסט (MMBench V1): 88.8% הצלחה – זה גבוה יותר ממודלים פתוחים כמו Qwen2-VL-7B, ואפילו מהדגם הקודם של Z.ai עצמם.
- במשימה של יצירת קוד ממסך (Design2Code): 88.6% – זה כולל לקחת צילום מסך של אתר או אפליקציה ולהפוך אותו לקוד תכנותי אמיתי, מה שמאוד קשה.
- במבחנים אחרים כמו הבנת סרטונים (VideoMME), מתמטיקה חזותית (MathVista), או זיהוי טעויות בתמונות (HallusionBench): הם במקום ראשון או שני בין כל המודלים הפתוחים. זה אומר שהם טובים יותר בהבנת עולם אמיתי, כמו לנתח תרשימים, טבלאות או סצנות מסרטונים.
הבדיקות האלה נעשו על ידי גופים חיצוניים, והתוצאות מפורטות בבלוג שלהם עם גרפים וטבלאות להשוואה.
#### יכולות חדשות ומפורטות
הסדרה הזו מביאה כמה יכולות פרקטיות שמקלות על שימוש יומיומי:
- עיבוד מסמכים מורכבים: יכול לנתח דפים ארוכים עם טבלאות, גרפים, טפסים או תרשימים – למשל, לקרוא חשבונית, להבין את הנתונים ולחשב סכומים אוטומטית.
- הבנת סרטונים ארוכים: מסוגל לצפות בסרטון של עשרות דקות ולסכם אותו, לענות על שאלות ספציפיות (כמו "מה קרה בדקה ה-15?") או לזהות אובייקטים ואירועים.
- קריאה לפונקציות ופלט מובנה: זה אומר שהמודל יכול להפעיל כלים חיצוניים ישירות – לדוגמה, לראות תמונה של משוואה מתמטית ולפתור אותה בעזרת מחשבון, או לנתח תמונה של אתר וליצור קוד HTML תואם. זה שימושי במיוחד לבניית אפליקציות אוטומטיות או "סוכנים" שפועלים לבד.
- תמיכה בפלט מסודר: המודל יכול להחזיר תשובות בצורה מובנית, כמו רשימות או טבלאות, במקום טקסט חופשי בלבד.
- שימושים נוספים: מתאים למשימות כמו זיהוי טעויות בתמונות (האם זה הזיה או אמיתי?), עיבוד תמונות מדעיות, או יצירת תוכן מבוסס ויזואלי.
#### החידושים לעומת הדגם הישן (GLM-4.
X (formerly Twitter)
Z.ai (@Zai_org) on X
GLM-4.6V Series is here🚀
- GLM-4.6V (106B): flagship vision-language model with 128K context
- GLM-4.6V-Flash (9B): ultra-fast, lightweight version for local and low-latency workloads
First-ever native Function Calling in the GLM vision model family
Weights:
- GLM-4.6V (106B): flagship vision-language model with 128K context
- GLM-4.6V-Flash (9B): ultra-fast, lightweight version for local and low-latency workloads
First-ever native Function Calling in the GLM vision model family
Weights:
nVision Digital AI בינה מלאכותית, טכנולוגיה חידושים, vibe coding ומה שבינהם
כל האינטרנט בבאז על זה שמחר יוצא chat got 5.2 הידוע בכינויו garlic נחכה ונראה.
וכל האינטרנט צדק
לפני כמה דקות יצא gpt5.2
מה השתפר משמעותית ב-GPT-5.2**
המודל החדש (דצמבר 2025) קופץ קדימה בעיקר בהיגיון קשה ובביצועים מקצועיים: הוא פתר 100% מהשאלות בתחרות המתמטיקה AIME 2025, השיג 74.9% ב-SWE-bench (קידוד אמיתי), 70.9% במבחן GDPval (עבודת ידע ב-44 מקצועות – כמעט כפול מבן אדם מומחה ועושה את זה פי 11 יותר מהר), והפחית 38% הזיות רגילות ופי 6 הזיות במסמכים ארוכים. בנוסף יש שלוש גרסאות מובחנות: Instant (מהיר לשיחה יומיומית), Thinking (היגיון + כלים + יצירת אקסלים ומצגות) ו-Pro (דיוק מקסימלי לקידוד ומחקר מדעי כבד).
מה זה אומר בפועל למשתמש?
ביחס ל-5.1 (שיצא רק חודש לפניו והיה יותר “חברותי ומהיר בשיחה”), 5.2 הרבה יותר אמין וחזק במשימות אמיתיות – קוד שרץ נכון מהפעם הראשונה, ניתוח מסמכים ומסדי נתונים ארוכים בלי לטעות, ויכולת לבנות זרימות עבודה מורכבות עם כלים חיצוניים. הוא גם זול יותר להרצה, מגיב מהר יותר במשימות כבדות, וסוף סוף מפחית את התופעה של “סירוב מוגזם” שהרגיזה הרבה משתמשים. בקיצור – זה לא עוד עדכון קטן, אלא הצעד שבו ChatGPT חוזר להוביל ביכולות “עבודה אמיתית” מול Gemini 3 Pro ו-Claude Opus 4.5.
לפני כמה דקות יצא gpt5.2
מה השתפר משמעותית ב-GPT-5.2**
המודל החדש (דצמבר 2025) קופץ קדימה בעיקר בהיגיון קשה ובביצועים מקצועיים: הוא פתר 100% מהשאלות בתחרות המתמטיקה AIME 2025, השיג 74.9% ב-SWE-bench (קידוד אמיתי), 70.9% במבחן GDPval (עבודת ידע ב-44 מקצועות – כמעט כפול מבן אדם מומחה ועושה את זה פי 11 יותר מהר), והפחית 38% הזיות רגילות ופי 6 הזיות במסמכים ארוכים. בנוסף יש שלוש גרסאות מובחנות: Instant (מהיר לשיחה יומיומית), Thinking (היגיון + כלים + יצירת אקסלים ומצגות) ו-Pro (דיוק מקסימלי לקידוד ומחקר מדעי כבד).
מה זה אומר בפועל למשתמש?
ביחס ל-5.1 (שיצא רק חודש לפניו והיה יותר “חברותי ומהיר בשיחה”), 5.2 הרבה יותר אמין וחזק במשימות אמיתיות – קוד שרץ נכון מהפעם הראשונה, ניתוח מסמכים ומסדי נתונים ארוכים בלי לטעות, ויכולת לבנות זרימות עבודה מורכבות עם כלים חיצוניים. הוא גם זול יותר להרצה, מגיב מהר יותר במשימות כבדות, וסוף סוף מפחית את התופעה של “סירוב מוגזם” שהרגיזה הרבה משתמשים. בקיצור – זה לא עוד עדכון קטן, אלא הצעד שבו ChatGPT חוזר להוביל ביכולות “עבודה אמיתית” מול Gemini 3 Pro ו-Claude Opus 4.5.
והוספתי לכם גם סקירה מהירה של מה חדש בCHATGPT 5.2
תוכלו לקרוא את זה פה
בעברית, בצורה מסודרת, וברורה כולל השוואה (נטענת) למתחרים
תוכלו לקרוא את זה פה
בעברית, בצורה מסודרת, וברורה כולל השוואה (נטענת) למתחרים
Nadav Fux’s Notion on Notion
🚀הושק מודל GPT-5.2 | Notion
⚡ הווריאנטים החדשים
מצחיק להגיד את זה, ש SONNET 4.5 כבר פחות מרגיש מרגש, בגלל שיש את OPUS4.5, את GEMINI 3 PRO והיום יצא GPT5.2
אבל, האתר החביב הזה מציע (בגירסת הPREVIEW \בטא שלהם) להשתמש בSONNET 4.5 (יחד עם עוד כמה מודלים) לגמרי בחינם.
https://cto.new/
מי שמתעניין, רוצה לנסות מוזמן.
(כבר שאלתי - מי לא אוהב חינם? :)
ואני מזכיר שוב - יש לכם המון כלים בחינם לגמרי...
1. קילו קוד עם 4 מודלים בחינם לחלוטין
2. אנטיגרביטי, כולל המודלים הכי מתקדמים (חוץ מGPT5.2 כמו אופוס 4.5 וג'ימיני 3 פרו)
3. ממשק WINDSURF יש שני מודלים בחינם + קרדיטים למודלים בתשלום
4. ממשק GEMINI CLI נותן מכסה נדיבה.
5. ממשק GOOGLE AI STUDIO נותן לכם שימוש בחינם במגבלות נדיבות
6. GOOGLE FIREBASE גם כן
אבל, האתר החביב הזה מציע (בגירסת הPREVIEW \בטא שלהם) להשתמש בSONNET 4.5 (יחד עם עוד כמה מודלים) לגמרי בחינם.
https://cto.new/
מי שמתעניין, רוצה לנסות מוזמן.
(כבר שאלתי - מי לא אוהב חינם? :)
ואני מזכיר שוב - יש לכם המון כלים בחינם לגמרי...
1. קילו קוד עם 4 מודלים בחינם לחלוטין
2. אנטיגרביטי, כולל המודלים הכי מתקדמים (חוץ מGPT5.2 כמו אופוס 4.5 וג'ימיני 3 פרו)
3. ממשק WINDSURF יש שני מודלים בחינם + קרדיטים למודלים בתשלום
4. ממשק GEMINI CLI נותן מכסה נדיבה.
5. ממשק GOOGLE AI STUDIO נותן לכם שימוש בחינם במגבלות נדיבות
6. GOOGLE FIREBASE גם כן
cto.new
cto.new - Completely free AI code agent
cto.new is the world's first completely free AI code agent. Use the latest frontier models from Anthropic, OpenAI and more. No credit card or API keys required.
לא נעלמתי
אני פשוט קצת חולה ועם טלפון עם מסך שבור (בדיוק כשיצאו השבוע המון הכרזות)
אבל כדי שלא נאבד בכלל את הקצב נספר שלפני כמה דקות הושק Gemini flash 3
מה זה אומר ?
שיהיה גם נאנו בננה עם flash 3
זה אומר מודל זול יותר גם לקידוד , גם לעריכת תמונות , גם מכסות גדולות יותר בגוגל והכי חשוב גם זול יותר כ api לשילוב באפליקציות וב- workflows
אני פשוט קצת חולה ועם טלפון עם מסך שבור (בדיוק כשיצאו השבוע המון הכרזות)
אבל כדי שלא נאבד בכלל את הקצב נספר שלפני כמה דקות הושק Gemini flash 3
מה זה אומר ?
שיהיה גם נאנו בננה עם flash 3
זה אומר מודל זול יותר גם לקידוד , גם לעריכת תמונות , גם מכסות גדולות יותר בגוגל והכי חשוב גם זול יותר כ api לשילוב באפליקציות וב- workflows
שלל עדכונים היום,
נתחיל בקצת כסף
יש האקתון עם פרסים די שווים עד 5,000 דולר לפרס ראשון
כדי להשתתף צריך לפתח ב you ware
מניח שרובכם לא שמעתם על הכלי 😃
https://contra.com/community/topic/youwarechallenge/guidelines
תחשבו lovable, bolt או כל דבר אחר דומה - בדיוק אותו הדבר
יש להם גם תוכנית חינם
מוזמנים לבדוק אותם
https://www.youware.com/subscription
נתחיל בקצת כסף
יש האקתון עם פרסים די שווים עד 5,000 דולר לפרס ראשון
כדי להשתתף צריך לפתח ב you ware
מניח שרובכם לא שמעתם על הכלי 😃
https://contra.com/community/topic/youwarechallenge/guidelines
תחשבו lovable, bolt או כל דבר אחר דומה - בדיוק אותו הדבר
יש להם גם תוכנית חינם
מוזמנים לבדוק אותם
https://www.youware.com/subscription
Contra
#youwarechallenge on Contra
Create your own production application with YouBase. Backend Included. See guidelines for full details.
דיברתי מדי פעם על REPLIT, אם YOUWARE זה משהו שלא התפרסם יותר מדי בארץ (ויש עשרות כלים כאלה שאני מכיר וסביר שיש מאות שאני לא) אז יש תמיד את הגדולים והמוכרים, וREPLIT הוא אחד מהם, הם מקבלים תשומת לב, פרסום, השקעות...
עד היום לא חיבבתי את REPLIT (ואני עדיין לא) אבל מעבר למנכל לא סימפטי לישראל, התוכנית שלהם הייתה הכי גרועה למי שרוצה ליצור משהו בחינם, בלי התחייבות, היום הם שינו את זה.
לפני שעה, הם הציגו תוכנית STARTER חדשה שבה יש מכסות חינמיות, ואם תשימו לב לא כתוב כמה, ועם וידיאו מרגש שהם רוצים לתת לכל אחד הזדמנות. אז עשיתי ניסוי, הלכתי (הם הגבילו לתוכנית החינמית רק ל WEB APP) אמרתי סבבה, ניסיתי והמסקנות הן - אל תגעו במקרה כזה בDESIGN MODE, זה יגמור לכם את "הקרדיטים" ולא יעשה כלום (כמו בתמונה), המערכת נותנת בחינם את FAST MODE (מה שהם נתנו לפני כחודש...), עשיתי עוד ניסוי במנוי חדש, וביקשתי שיבנה לי אפליקציה למעקב אחרי מניות, הוא חיבר את זה לYAHOO FINANCE לבד, ויצר לי אפליקציה למעקב אחרי מניות בשוט אחד, לבד, עם חיבור המכסה היומית) הוסיף ניתוח לפי חדשות. נחמד. אגב, האיפוס מסתבר ב2 בלילה, שעון ישראל.
עד היום לא חיבבתי את REPLIT (ואני עדיין לא) אבל מעבר למנכל לא סימפטי לישראל, התוכנית שלהם הייתה הכי גרועה למי שרוצה ליצור משהו בחינם, בלי התחייבות, היום הם שינו את זה.
לפני שעה, הם הציגו תוכנית STARTER חדשה שבה יש מכסות חינמיות, ואם תשימו לב לא כתוב כמה, ועם וידיאו מרגש שהם רוצים לתת לכל אחד הזדמנות. אז עשיתי ניסוי, הלכתי (הם הגבילו לתוכנית החינמית רק ל WEB APP) אמרתי סבבה, ניסיתי והמסקנות הן - אל תגעו במקרה כזה בDESIGN MODE, זה יגמור לכם את "הקרדיטים" ולא יעשה כלום (כמו בתמונה), המערכת נותנת בחינם את FAST MODE (מה שהם נתנו לפני כחודש...), עשיתי עוד ניסוי במנוי חדש, וביקשתי שיבנה לי אפליקציה למעקב אחרי מניות, הוא חיבר את זה לYAHOO FINANCE לבד, ויצר לי אפליקציה למעקב אחרי מניות בשוט אחד, לבד, עם חיבור המכסה היומית) הוסיף ניתוח לפי חדשות. נחמד. אגב, האיפוס מסתבר ב2 בלילה, שעון ישראל.