nVision Digital AI בינה מלאכותית, טכנולוגיה חידושים, vibe coding ומה שבינהם
448 subscribers
376 photos
17 videos
1 file
391 links
הערוץ שמביא לכם חדשות על כל מה שחדש בתחום הAI, וה vibe coding , מודלים, כלים, וחידושים
Download Telegram
מתנצל על החוסר עדכון
המון עבודה ומעט מדי זמן

עדכון בקטנה
פרטים בהמשך
מילה קטנה למי שרוצה לעבוד עם SONNET החדש והוא עדיין מראה לו SONNET 4.5
תכניסו את הפקודה הבאה וזה יפתור את הבעיה
claude --model sonnet
1🔥1
טוב. מן בסתם ב20 דקות לא הספקתי לבדוק אותו אבל ביקשתי מהai לסכם לי את ההכרזה ולמה הוא מיוחד ואיך הוא מול האחרים.

מוזמנים כמובן לבצע את הבדיקה שלכם אבל זה מה שהם אומרים (עם ההערות שלי) :

ג'מיני 3.1 פרו הוא מודל בינה מלאכותית חדש מגוגל שאמור להתמודד עם בעיות חדשות ומסובכות, כאלה שדורשות חשיבה מופשטת כמו זיהוי דפוסים או ארגון מידע בצורה יצירתית.

מה שמעניין בו זה שהוא לא סתם עונה על שאלות פשוטות, אלא מצליח לפתור משימות שמזכירות חידות ויזואליות או תהליכים מורכבים, כמו לדמיין רעיונות בעזרת אנימציות.

זה הופך אותו לכלי שימושי בחיים האמיתיים, למשל במחקר, בעסקים או אפילו בחינוך, כי הוא עוזר להבין דברים מסובכים בצורה פשוטה יותר. אנשים רגילים יכולים להשתמש בו כדי לארגן נתונים או להמחיש רעיונות, בלי צורך בידע טכני עמוק.
(הערה שלי ? עד עכשיו לא ראיתי פה משהו שלא קרה קודם ….)


החידוש העיקרי לעומת הגרסה הקודמת, ג'מיני 3 פרו, הוא שיפור דרמטי בביצועים. בגרסה הקודמת, המודל קיבל רק 31% במבחן ARC-AGI-2, שזה מבחן קשה שמודד יכולת להתמודד עם בעיות לא מוכרות.

עכשיו, ג'מיני 3.1 פרו קפץ ל-77%, יותר מכפול! זה אומר שהוא למד להתאים את עצמו טוב יותר למצבים חדשים, עם שיפורים באלגוריתמים שמאפשרים חשיבה עמוקה יותר וזיהוי דפוסים מהיר. בניגוד לקודם, שנתקע לפעמים במשימות בלתי צפויות, החדש מצטיין בזרימות עבודה דינמיות, כמו יצירת הדמיות או פתרון בעיות מורכבות בצעדים לוגיים.
(ושוב הערה שלי - בואו ננסה ונראה איך הוא יתמודד. עם מה שרק אופוס פתר …)

בהשוואה למודלים אחרים, ג'מיני 3.1 פרו עולה על קלוד אופוס 4.6, שקיבל 68.8% באותו מבחן – כלומר, ג'מיני יותר טוב בהיגיון מופשט. אופוס 4.6 חזק במשימות ארוכות טווח ומשתמש במשאבים בצורה יעילה, אבל ג'מיני לוקח את ההובלה בפתרון בעיות חדשות.

לגבי קודקס 5.3, שהוא מודל ממוקד קוד מבית אופן איי איי, הוא מצטיין בביצועים קודינג כמו 77.3% במבחן טרמינל-בנץ' 2.0, אבל במבחנים כלליים כמו ARC-AGI-2, הציון שלו נמוך יותר (פחות מ-68.8%), כי הוא מתמחה יותר בפיתוח תוכנה מאשר בחשיבה ויזואלית כללית. בסופו של דבר, ג'מיני 3.1 פרו בולט כמודל רב-תכליתי יותר למשימות מגוונות.


ואני מסכם ? תנסו ותראו. בסוף לצערי אופוס 4.6 עד היום מצליח איפה שכולם נכשלו. ננסה ונראה. שיהיה אחלה ערב לכולם ל
1
אם אתם ״vibe coders״ וגם רוצים לשלב סרטונים באתר שלכם, ההודעה הזו בשבילכם:

Replit השיקה לאחרונה כלי AI חדש בשם Replit Animation, שמאפשר ליצור סרטוני אנימציה מקצועיים תוך דקות ספורות באמצעות כתיבה (במילים אחרות פרומפט) בשפה טבעית.

הכלי מופעל על ידי מודל Gemini 3.1 Pro של גוגל שיצא ממש עכשיו, והוא משולב ישירות בפלטפורמת Replit – פשוט נכנסים ללשונית "App", בוחרים באופציית Animation או כותבים בקשה כמו "animated video about...", וה-AI מייצר אנימציה מלאה עם תנועה, טקסט, מוזיקה וקריינות.

יש אפילו בונוס מאחר ש-Replit אף הכריזה על תחרות עם פרס של 5,000 דולר לסרטון הכי ויראלי שנוצר בכלי.

אני מזכיר שאפשר להשתמש בימינו ברפליט בחינם (עם מגבלות) ברמה היומית - לא בדקתי אם זה תקף לאנימציות.

https://x.com/replit/status/2024578806208745637?s=46
1
שלום חברים, רוצים חודש של REPLIT CORE בחינם?

לא יודע עד כמה הקוד הזה יחזיק מעמד, אבל בבקשה - תבחרו מנוי חודשי, ותכניסו את הקוד AIADVANTAGE

(מזכיר שאם לא תרצו להמשיך, תבטלו...)

בהצלחה!
אני משתף לכם תרגום של פוסט (קצת ביקורתי) של אנדרי קרפתי על Openclaw. מצד שני, הוא מדבר גם על ההזדמנויות המגניבות שיש עם סוכנים כמו Openclaw (ודומיו).

למי שלא מכיר, עבד בעבר בOPENAI, בחור מבריק, אחד האנשים בחוד החנית של הLLM, ובכללי הבחור שטבע את המושג Vibe coding. אמל"כ - הוא ממש בעד :)

"קניתי מק מיני חדש כדי להתעסק כמו שצריך עם claws בסוף השבוע. המוכר בחנות אפל אמר לי שהם נמכרים כמו לחמניות טריות וכול אחד מבולבל 🙂

אני בהחלט קצת חשדן לגבי הרצת OpenClaw במיוחד – לתת את הנתונים הפרטיים/מפתחות שלי ל־400 אלף שורות קוד של "מפלצת ווייב-קודדת" שמותקפת בקנה מידה גדול ממש לא מושך אותי. כבר רואים דיווחים על מופעים חשופים, פרצות RCE, הרעלת שרשרת אספקה, skills זדוניים או פגועים ב-registry – זה מרגיש כמו מערב פרוע אמיתי וסיוט אבטחה.

אבל אני כן ממש אוהב את הקונספט, ואני חושב שבדיוק כמו ש-LLM agents היו שכבה חדשה מעל LLMs, Claws הן עכשיו שכבה חדשה מעל LLM agents – לוקחות את האורקסטרציה, התזמון, ההקשר, קריאות לכלים וסוג של התמדה (persistence) לרמה הבאה.

מסתכל מסביב, ונראה שהרעיון הכללי ברור, אז מתחילות לצוץ המון claws קטנות יותר. לדוגמה, בסריקה מהירה NanoClaw נראית ממש מעניינת בכך שהמנוע המרכזי שלה הוא בערך 4000 שורות קוד (נכנס גם לי לראש וגם לסוכני AI, אז זה מרגיש ניתן לניהול, לביקורת, גמיש וכו') ומריץ הכול ב-containers כברירת מחדל.

אני גם ממש אוהב את הגישה שלהם לקונפיגורציה – זה לא נעשה דרך קבצי קונפיג, אלא דרך skills! לדוגמה, /add-telegram מורה לסוכן ה-AI שלך איך לשנות את הקוד עצמו כדי לשלב טלגרם. לא נתקלתי בזה קודם וזה קצת הפיל לי את הלסת מוקדם יותר היום כגישה חדשה מופעלת-ע"י-AI למניעת בלגן בקונפיגים ומפלצות if-then-else. בעצם – המטא החדש המרומז הוא לכתוב את הריפוזיטורי הכי forkable שאפשר ואז ש-skills יעשו fork ממנו לכל קונפיגורציה אקזוטית שתרצה. ממש מגניב.

בכל מקרה יש עוד המון אחרים – למשל nanobot, zeroclaw, ironclaw, picoclaw (צוחק על הקידומות). יש גם אלטרנטיבות שמארחות בענן אבל האמת שלא ממש בא לי עליהן כי זה מרגיש הרבה יותר קשה להתעסק איתן. במיוחד setup מקומי מאפשר חיבור קל למכשירי אוטומציה ביתית ברשת המקומית. ואני לא יודע, יש משהו אסתטי ממש מחמם לב בזה שיש מכשיר פיזי "רוח רפאים" של בית דיגיטלי אישי קטן ששוכן בו.

עדיין לא בטוח ב-100% איך הסטאפ שלי ייראה בסוף, אבל Claws הן שכבה חדשה, מדהימה ומעוררת התרגשות בערימת ה-AI.

https://x.com/karpathy/status/2024987174077432126?s=20

מזכיר אגב, שאם יש לכם openclaw אתם מוזמנים גם לקבוצה בפייסבוק https://www.facebook.com/groups/openclawisrael/
1
אז מה קורה כשחברת ענק מגלה שחברות סיניות משתמשות במודל שלה לאימון המודלים שלהם בניגוד לתנאי השימוש שלה ?


בגדול - אנתרופיק מאשימה את חברות הבינה המלאכותיות בסין שהן יצרו חשבונות פיקטיביים ומתקשרות דרכם עם המודל כדי (נגדיר את זה בפשטות ) לגנוב אותו.

שימו לב שהם משתמשים במילים ״אמריקן״ ומזכירים את הצבא הסיני ככה שמדובר פה על משהו שקל להפוך אותו לאסקלציה לתחום המדיני / צבאי.

https://x.com/anthropicai/status/2025997931589881921?s=46
לפני שעתיים base44 הציגה עוד שלב מגניב באבולוציה שלה : תשלומים.

עכשיו אפשר לקבל תשלומים עבור שירותים / אתרים / אפליקציות ישירות בbase 44

עוד צעד בהפיכה של האפליקציה למפלצת של ממש.

לטעמי - מאז המכירה לwix קצב הפיתוח שלה די מטורף ויחסית לכלים דומים היא נמצאת בטופ 3 בקטגוריה שלה ומטפסת מהר למעלה.

https://x.com/ms_base44/status/2025997130306064503?s=46
אז היום Cursor AI משיקה Cloud Agents – סוכנים שכותבים, בודקים ומדגימים קוד באוטונומיה מלאה

אז Cursor השיקה עכשיו את Cloud Agents – סוכנים שמתחברים לבד לקודבס שלכם, מפעילים VM Linux מאובטח בענן, מבצעים שינויים אמיתיים, בודקים אותם (כולל הרצת האפליקציה ולחיצות), ומחזירים PR מוכן + סרטון הדגמה מקצועי (עם logs, screenshots ווידאו של התהליך)

לא יודע מה איתכם אבל זה קטע כשהם עושים סרטון. מזכיר את אנטי גרביטי.

הכל זמין מכל מקום: web, mobile, Slack, GitHub – latency נמוך בטירוף לשולחן מרוחק, והסוכנים יכולים לרוץ במקביל בלי להעמיס על המחשב שלכם.

דוגמה: "הוסף פיצ'ר חיפוש ב-Next.js" → הסוכן לומד את הפרויקט, כותב, בודק ומחזיר וידאו שמראה את האפליקציה בפעולה.

איך זה משנה את החיים?
במקום רק הצעות קוד – אתם מקבלים agent שעובד כמו מתכנת אמיתי: מתכנן, מבצע, מתקן באגים ומדגים.
זה מקצר ביקורות קוד, דיבוגים ומפגשים ארוכים – במיוחד בפרויקטים גדולים.

וזה הזמן להזכיר שיש גם את Jules שעושה את אותו הדבר מינוס הסרטון

השוואה מהירה למתחרים העיקריים (פברואר 2026):

• Google Antigravity (נובמבר 2025,) – agent-first אמיתי מבוסס Gemini 3, חזק בניהול סוכנים מרובים במקביל, תכנון + ביצוע אסינכרוני, browser מובנה. גם שם יש לו יכולת לבצע צילום וידיאו אבל לא באותה צורה בדיוק של "ווידאו דמו" מובנה כמו Cursor, אבל מצוין למשימות מורכבות ומקבילות.
• Amazon Kiro (2025, spec-driven) – מעולה ל-enterprise/production עם דגש על specifications לפני קוד, bug-fix אוטומטי ו-best practices של AWS.אין וידיאו למיטב ידעתי או משהו דומה שם".
• GitHub Copilot – זול ($10), משתלב בכל IDE, Agent Mode טוב – אבל פחות עצמאי בענן, אין וידאו דמו מובנה והחוויה פחות "magic" מ-Cursor.
• Windsurf – מהיר מאוד לקודבסים ענקיים (Cascade agents), תמורה מעולה ($15), אבל חסר את ה-Computer Use המלא והווידאו של Cursor.
אז יש מצב שCursor ירגיש כרגע הכי "חלק ומעשי" לשימוש יומיומי – אבל המירוץ ב-2026 מטורף!

מצורף סרטון הדגמה

https://x.com/leerob/status/2026369424450523348?s=46

#CursorAI #AICoding #DevelopersIL #AgenticAI #AIForDev
מעכשיו - קלוד קוד בשלט רחוק.

עכשיו ההתמכרות נמשכת בכל מקום 😂
לפני חצי שעה בערך
Perplexity משיקה את Perplexity Computer – האם זה צעד משמעותי לקראת "מערכת הפעלה AI" אמיתית?

מדובר על פלטפורמה חדשה שמאחדת 19 מודלי AI שונים תחת ממשק אחד, ומאפשרת לבצע פרויקטים שלמים מסוף עד סוף באופן אוטונומי ומקבילי.

מה זה בעצם עושה?
המשתמש מתאר מטרה מורכבת (למשל: "חקר שוק + תכנון מוצר + כתיבת קוד frontend/backend + אינטגרציה עם Stripe + דיפלוי ל-Vercel + הגדרת monitoring"), והמערכת:
- מפרקת את המשימה לעשרות (או מאות) sub-tasks
- מנתבת כל חלק למודל הכי מתאים (Opus משמש כ"מנהל פרויקט" ראשי)
- מריצה agents במקביל
- משלבת תוצאות ומחזירה פרויקט שלם, מתפקד ומתוחזק
כל זה תרשו לי לסייג לכאורה כמובן.

אז מה לכאורה הדברים שבאמת מבדילים אותה מדברים דומים אצל מתחרים שהם לא רק buzzwords?

- זיכרון מתמשך (persistent memory) – שומרת קונטקסט ארוך-טווח: קבצים, היסטוריית שינויים, API keys, סגנון קוד מועדף, תיקוני באגים קודמים

- מאות connectors מאובטחים – GitHub, Google Drive, Slack, Figma, AWS, Vercel ועוד – בלי העתק-הדבק סיסמאות בכל פעם

- שליטה מלאה בעלויות – מודל תשלום לפי שימוש (credits), אתה בוחר אילו מודלים להפעיל בכל שלב, מגדיר תקציב יומי/חודשי

- אבטחה מהיסוד – secure-by-default, ללא שיתוף נתונים חיצוני אלא אם כן אתה מאשר

כרגע,זמין מיידית למנויי Max דרך האתר (perplexity.ai/computer).
- 10,000 credits לחודש כחלק מהמנוי
- בונוס השקה: +20,000 credits חד-פעמיים (תוקף 30 יום)
- שימוש מעבר לכך → תשלום לפי צריכה

אם נסכם - זה לא אמור להיות עוד "AI coding tool" כמו Cursor – זה infrastructure שמנהל ומסיים פרויקטים שלמים באופן עצמאי (לכאורה), עם זיכרון אישי וממשק מאובטח.

לפרטים + ניסיון אם יש לכם מנוי max במקרה : perplexity.ai/computer
🤣1
אז חברת Anthropic ידידתנו רכשה את Vercept – חברת AI שפיתחה יכולות מתקדמות לשליטה במחשב.

מי הם בעצם Vercept?
מדובר סטארט-אפ (מבוסס סיאטל) שבנה ממשק AI למחשב – טכנולוגיה שמאפשרת למודל AI "לראות" את מסך המחשב, להזיז עכבר, ללחוץ על כפתורים, להקליד, לגלוש ולבצע פעולות בתוכנות שונות (כגון דפדפנים, כלי עריכה, אפליקציות משרדיות וכו').

המטרה: לאפשר למשתמשים לתאר משימות בשפה טבעית וה-AI מבצע אותן ישירות על המחשב.

מניח שכולם יודעים מי זו Anthropic?
היוצרים של Claude code ושל המודלים הכי חזקים לתכנות בעולם.

מה המשמעות של הרכישה?
הטכנולוגיה של Vercept צפויה להשתלב ב-Claude כדי לשפר משמעותית את יכולת ה"computer use" – כלומר, היכולת של Claude לבצע פעולות רב-שלביות ישירות בממשקי מחשב אמיתיים (במקום רק להציע טקסט או קוד).
הצוות של Vercept מצטרף לאנטרופיק, והמוצר העצמאי שלהם ייסגר במהלך השבועות הקרובים.

הרכישה מתרחשת על רקע התקדמות מהירה ביכולות ה"computer use" של Claude. לדוגמה, בגרסה האחרונה (Claude Sonnet 4.6) ששוחררה לפני כשבועות ספורים, Anthropic דיווחה על שיפור משמעותי בביצועים במבחני סימולציה של שליטה במחשב (כגון OSWorld), עם ציונים שהגיעו לכ-72.5% – לעומת אחוזים בודדים בתחילת הדרך ב-2024.
שילוב הטכנולוגיה של Vercept צפוי לאפשר ל-Claude לבצע משימות מורכבות יותר בסביבות מחשב אמיתיות, תוך שמירה על גישה זהירה וממוקדת בטיחות – עקרון מרכזי בפעילות של Anthropic. זהו צעד שממקם את החברה בתחרות מול פיתוחים דומים בתחום סוכני AI אוטונומיים.

זה צעד נוסף בכיוון של AI agents – מערכות שמסוגלות לפעול באופן עצמאי בסביבות דיגיטליות מורכבות. Anthropic מדגישה שהשילוב יתבצע תוך שמירה על העקרונות של פיתוח AI אחראי ובטוח.

ועכשיו קחו את ההודעה לפני כמה דקות של פרפליקסיטי ותראו לאן השוק מתכנס. כל אחד בצורה שלו.



Anthropic: https://www.anthropic.com/news/acquires-vercept

#AI #Claude #Anthropic #ComputerUse #AIAgents
ערב טוב
המון הכרזות שיצאו אתמול, היום נשתדל לעבור עליהן אחת אחת ונקווה שלא נפספס כלום (וזה לא באמת יקרה, אני אפספס המון, אבל ככה זה עם תחום הבינה המלאכותית, יש פשוט ימים שזה לא נגמר...)

נתחיל 😁
החברים בMINIMAX הסינית, (היום עם מודל 2.5)
מציעים מגוון תוכניות של קידוד (למי שרוצה להשתמש בסוכן קוד בעלויות זולות לינק ב https://nvision.me)
אבל, הרבה לא יודעים, יש גם סוכן ממש, שאפשר להפעיל שם
אתמול הם השיקו את MAXCLAW שהוא מבחינתם סוכן שמקביל לOPENCLAW בלי שצריך לפרוס שום דבר על שרת.

זמין פה https://agent.minimax.io

אני אציין, כפי שניתן לראות בצילום המצורף, שאפשר להשתמש בו בחינם ב200 קרדיטים יומיים (או לשלם ולקבל קרדיטים חודשי)

אבל הגרסה הזו של MAXCLAW דורשת שתרשמו לגרסה בתשלום של השירות.

אבל יש פה בונוס לא קטן, https://agent.minimaxi.com/experts

מה זה הEXPERTS בעצם?
הם סוכני AI ייעודיים וממוקדים מאוד, שנבנים על ידי הקהילה והצוות הרשמי, ומשמשים לביצוע משימות ספציפיות בצורה יעילה בלי צורך לכתוב פרומפטים ארוכים בכל פעם מחדש.
הם פועלים בתוך הפלטפורמה , ומאפשרים שיתוף פעולה בין סוכנים מרובים כדי לטפל במשימות מורכבות כמו בניית אתרים, ניתוח פיננסי, כתיבת תוכן שיווקי, יצירת מצגות מקצועיות, מחקר שוק, עריכת מסמכים, הכנת חומרי לימוד אקדמיים, עיצוב ויזואלי ועוד. יש אלפים כאלה (מעל 10,000 לפי עדכונים קודמים)
הכוח של האינטרנט לפעמים מפחיד.
אז לפני כמה ימים סיפרתי פה על דיווח שאנתרופיק טוענת שסין מנסה להוציא מידע מתוך המודלים שלה לשימושים של הAI , לשימושים צבאיים וכו' (נשים בצד שזה קורה בסמיכות לזה שיש סוג של סכסוך בינם לבין ממשל טראמפ שרוצה להשתמש במודלים שלהם לשימושים צבאיים ומעקב בלי קשר)

שלשום מישהו החליט לפרסם דאטה סט עם עשרות אלפי שיחות שלו עם CLAUDE + בנה כלי שמעודד אחרים לעשות את אותו הדבר, כדי שאפשר יהיה להשתמש במידע הזה שמכיל בעצם את ההתנהלות של OPUS 4.6 מול משתמשים, ומעודד אחרים לעשות את זה.

מאמין שזה עובר על הTOS של אנתרופיק, אבל לא בטוח מה בדיוק הם יכולים לעשות.
וכמו שהוא כתב :
Deepseek got called out for scraping 150k Claude messages. So I'm releasing 155k of my personal Claude Code messages with Opus 4.5.

I'm also open sourcing tooling to help you fetch your data, redact sensitive info & make it discoverable on HF - link below to liberate your data!


https://x.com/peteromallet/status/2026401030066549049?s=20
אחרי הרבה דיבורים על זה ביממה האחרונה ברשת
הרגע השיקו את NANO BNANA 2