קבלו ארבעה שימושים ממש ממש מגניבים של ננו בננה שראיתי בשרשור של ג׳וש וודוורד, סמנכ״ל בגוגל שאחראי על זה:
1. אם מעלים תמונות של דמויות - אבל גם סקיצה של איך כל דמות אמורה לעמוד - המודל ימקם אותם כמו שצריך בפריים!
2. שחזור צבעים בתמונות - העלו כל תמונה ישנה ותבקשו לשחזר את הצבעים.
3. בגלל שלמודל יש את הידע של גוגל, אפשר להעלות כל תמונה מגוגל מפות ולבקש annotations על האובייקטים - ונקבל תמונה עם הערות בצורה מגניבה.
4. יצירת מודלים תלת מימדיים מתמונת רפרנס.
והאם ידעתם שהמודל האדיר הזה זול יותר משמעותית ב-76% ממודל התמונות של OpenAI?
Josh Woodward 💪🤩
1. אם מעלים תמונות של דמויות - אבל גם סקיצה של איך כל דמות אמורה לעמוד - המודל ימקם אותם כמו שצריך בפריים!
2. שחזור צבעים בתמונות - העלו כל תמונה ישנה ותבקשו לשחזר את הצבעים.
3. בגלל שלמודל יש את הידע של גוגל, אפשר להעלות כל תמונה מגוגל מפות ולבקש annotations על האובייקטים - ונקבל תמונה עם הערות בצורה מגניבה.
4. יצירת מודלים תלת מימדיים מתמונת רפרנס.
והאם ידעתם שהמודל האדיר הזה זול יותר משמעותית ב-76% ממודל התמונות של OpenAI?
Josh Woodward 💪🤩
❤7👍2
Media is too big
VIEW IN TELEGRAM
שעות אחרונות לדיל! https://academy.yuv.ai
הגענו לתקופה שבה ההייפ כבר הרבה אחרי התייצבות. יש פומו, אבל אין התלהבות גדולה כבר. אפילו מודלים ענקיים ומוצלחים מלהיבים לכמה שעות או ימים וזהו.
מבינים שיש סוכני AI, ו-n8n וקרסר וכו. אפילו המודלים הגדולים כבר הגיעו לרוויה ולא מצליחים להיות חכמים יותר. ועכשיו הגיעה התקופה ששואלים את השאלות הכי קשות: האם AI בכלל משתלם לנו כלכלית?
איפה כל ההבטחות של 10x בתפוקה ובהכנסות? אם אפילו קלוד ו OpenAI מפסידים הון עתק כל שנה רק כדי לשמור על האורות דולקים ולהמשיך לגלגל את העסק - מה זה אומר על החברות שמנסות להטמיע AI?
את השאלות האלה אני פוגש אצל לקוחות שאני עובד איתם. שאלות טובות. אני רואה מגמה של עניין רב להטמיע כלי AI בצוותי פיתוח, הכשרות וסדנאות, לתת כלים, להנגיש, כדי לקדם את התהליכים מהר יותר. והאמת היא שזה חשוב מאוד מאוד. מפתחים שמשכילים לאמץ AI, וארגונים שמשכילים להביא הטמעות וסדנאות גיטהאב קופיילוט / קלוד קוד / קרסר לארגונים, רק ירוויחו בגדול. ועוד אמת לאמיתה היא מוטיבציה לאמץ את הכלים האלה בקרב העובדים. עד שלא נפתח את העניין של המוטיבציה בקרב העובדים לאמץ את הטכנולוגיה - בין אם ע״י מתן כלים והכשרות, בין אם ע״י שינוי הגדרות התפקיד וממש לאלץ עובדים לעבוד עם כלי AI ביום יום (לטובתם ולטובת הארגון), ובין אם ע״י שיחות מוטיבציה ופגישות ייעוץ פרטניות עם משאבי אנוש. HRBP.
נגמר ההייפ.
הידע כבר הפך לנפוץ ונגיש כמעט אצל כולם.
היתרון כרגע הוא לא במרדף פומואיסטי אחר כלים, אלא דווקא במיצוי הפוטנציאל של הכלים הקיימים. גיטהאב קופיילוט זו מתנה אדירה למי שיודע לעבוד איתו בארגונים, בין אם דרך VSCode או IntelliJ או כל JetBrains.
מיצוי פוטנציאל אפשרי ע״י הטמעה נכונה, אתגרים, ליווי, הכשרות, עידוד ומוטיבציה. זו השקעה שאפשר לקצור את הפירות בטווח די מהיר אם עושים את זה נכון. לא להפחיד את העובדים - אלא לעזור להם להבין שהכלים באמת יאיצו להם את הדרך. מחקר של מקינזי כבר הוכיח ש-90% שמחים יותר, עם תפוקה טובה יותר, ומרגישים יותר סיפוק בעבודה עם כלי AI בעולם הפיתוח.
ה-AI מונח בקרן זווית. עכשיו רק לממש את הפוטנציאל שלו. זה שם המשחק. כמו המודלים של התמונות והווידאו, כבר הבנו שזה פה ושזה קיים ושזה אחלה. עכשיו השאלה היא מה אפשר באמת להפיק מזה וכמה זה בעל ערך רב יותר? ואין ספק שאפשר ועוד איך.
ובקרב ארגונים שאני מלווה כבר רואים את ההתלהבות ואת האימוץ ואת ההשפעה, כיף גדול.
מבינים שיש סוכני AI, ו-n8n וקרסר וכו. אפילו המודלים הגדולים כבר הגיעו לרוויה ולא מצליחים להיות חכמים יותר. ועכשיו הגיעה התקופה ששואלים את השאלות הכי קשות: האם AI בכלל משתלם לנו כלכלית?
איפה כל ההבטחות של 10x בתפוקה ובהכנסות? אם אפילו קלוד ו OpenAI מפסידים הון עתק כל שנה רק כדי לשמור על האורות דולקים ולהמשיך לגלגל את העסק - מה זה אומר על החברות שמנסות להטמיע AI?
את השאלות האלה אני פוגש אצל לקוחות שאני עובד איתם. שאלות טובות. אני רואה מגמה של עניין רב להטמיע כלי AI בצוותי פיתוח, הכשרות וסדנאות, לתת כלים, להנגיש, כדי לקדם את התהליכים מהר יותר. והאמת היא שזה חשוב מאוד מאוד. מפתחים שמשכילים לאמץ AI, וארגונים שמשכילים להביא הטמעות וסדנאות גיטהאב קופיילוט / קלוד קוד / קרסר לארגונים, רק ירוויחו בגדול. ועוד אמת לאמיתה היא מוטיבציה לאמץ את הכלים האלה בקרב העובדים. עד שלא נפתח את העניין של המוטיבציה בקרב העובדים לאמץ את הטכנולוגיה - בין אם ע״י מתן כלים והכשרות, בין אם ע״י שינוי הגדרות התפקיד וממש לאלץ עובדים לעבוד עם כלי AI ביום יום (לטובתם ולטובת הארגון), ובין אם ע״י שיחות מוטיבציה ופגישות ייעוץ פרטניות עם משאבי אנוש. HRBP.
נגמר ההייפ.
הידע כבר הפך לנפוץ ונגיש כמעט אצל כולם.
היתרון כרגע הוא לא במרדף פומואיסטי אחר כלים, אלא דווקא במיצוי הפוטנציאל של הכלים הקיימים. גיטהאב קופיילוט זו מתנה אדירה למי שיודע לעבוד איתו בארגונים, בין אם דרך VSCode או IntelliJ או כל JetBrains.
מיצוי פוטנציאל אפשרי ע״י הטמעה נכונה, אתגרים, ליווי, הכשרות, עידוד ומוטיבציה. זו השקעה שאפשר לקצור את הפירות בטווח די מהיר אם עושים את זה נכון. לא להפחיד את העובדים - אלא לעזור להם להבין שהכלים באמת יאיצו להם את הדרך. מחקר של מקינזי כבר הוכיח ש-90% שמחים יותר, עם תפוקה טובה יותר, ומרגישים יותר סיפוק בעבודה עם כלי AI בעולם הפיתוח.
ה-AI מונח בקרן זווית. עכשיו רק לממש את הפוטנציאל שלו. זה שם המשחק. כמו המודלים של התמונות והווידאו, כבר הבנו שזה פה ושזה קיים ושזה אחלה. עכשיו השאלה היא מה אפשר באמת להפיק מזה וכמה זה בעל ערך רב יותר? ואין ספק שאפשר ועוד איך.
ובקרב ארגונים שאני מלווה כבר רואים את ההתלהבות ואת האימוץ ואת ההשפעה, כיף גדול.
❤4👍1
מתכונן להרצאה חשובה מאוד שלי מחר אצל CodeValue , בה אדבר על איך השתמשתי ב-AI כדי לעזור ללקוחות שליוויתי להאיץ את תהליכי הפיתוח שלהם. x100. במעשים ולא בדיבורים. מה למדתי מזה? מה עבד? מה פחות? ובעיקר - איך עובדים עם ה-AI אחרי ההייפ?
אם אתם מגיעים אשמח שתבואו להגיד שלום ותשאירו פה לייק או תגובה שאדע למי לצפות, ועד אז אני עושה כל מה שאני יכול כדי שההרצאה תהיה הכי מעניינת ופרקטית שאפשר. על A2A, MCP, AWS ושאר מיני כיף!
אם אתם מגיעים אשמח שתבואו להגיד שלום ותשאירו פה לייק או תגובה שאדע למי לצפות, ועד אז אני עושה כל מה שאני יכול כדי שההרצאה תהיה הכי מעניינת ופרקטית שאפשר. על A2A, MCP, AWS ושאר מיני כיף!
👍3❤1🔥1
לקראת ההרצאה שלי מחר בפני מאות מפתחים ומפתחות אני מדייק את המסר עוד ועוד. מספר על איך השתמשתי ב-AI במסגרת הפרויקט שבו החלפתי בית תוכנה שלם כדי לדלוור פי 10 יותר מהר. ללקוח הסקוטי שלי!
זה לא שאני עילוי או גאון. זה שאני מבין איך לנצח על כלי AI כדי ליצור הרמוניה של קוד שיוביל לפרויקט בר קיימא, מוכן לפרודקשן. כמות הקש שאכלתי בדרך היא בלתי נתפסת. על המעבר מקרסר לקלוד קוד. על כך שלעניות דעתי, Vibe Coder לעולם לא יוכל להחליף בית תוכנה, אבל AI Developer כן. ההבדל ביניהם הוא שלאחד אין ניסיון וידע - בעוד שלאחר כן כי הוא התחיל מפיתוח קלאסי אבל אימץ כלי AI לפיתוח ולכן אצה לו הדרך.
יש דברים שאין בהם חידוש גדול. כמו איך לתכנן תשתית של פרויקט ואיך לנהל תקשורת ועבודת צוות עם הפרודקט וכדומה. אבל! מה שיש בו חידוש גדול הוא דווקא אחר ההבנה של הפרויקט. כמו למשל לקחת את הפרוטוטייפ שהלקוח פיתח בעצמו עם AI - ולנסות להבין איפה פה נצטרך לפתח סוכני AI, איך נדאג שהם יעבדו יציב גם בפרודקשן? איך נפרוס אותם בענן? באיזה MCP להשתמש ואיך?
ומה תכלס אפשר לקחת גם בתור ארגונים שלרוב מטמיעים דווקא את גיטהאב קופיילוט?
הרבה דברים מאוד מעניינים לדבר עליהם. על זאת ועוד, מחר בע״ה בהרצאה שלי 🫶
זה לא שאני עילוי או גאון. זה שאני מבין איך לנצח על כלי AI כדי ליצור הרמוניה של קוד שיוביל לפרויקט בר קיימא, מוכן לפרודקשן. כמות הקש שאכלתי בדרך היא בלתי נתפסת. על המעבר מקרסר לקלוד קוד. על כך שלעניות דעתי, Vibe Coder לעולם לא יוכל להחליף בית תוכנה, אבל AI Developer כן. ההבדל ביניהם הוא שלאחד אין ניסיון וידע - בעוד שלאחר כן כי הוא התחיל מפיתוח קלאסי אבל אימץ כלי AI לפיתוח ולכן אצה לו הדרך.
יש דברים שאין בהם חידוש גדול. כמו איך לתכנן תשתית של פרויקט ואיך לנהל תקשורת ועבודת צוות עם הפרודקט וכדומה. אבל! מה שיש בו חידוש גדול הוא דווקא אחר ההבנה של הפרויקט. כמו למשל לקחת את הפרוטוטייפ שהלקוח פיתח בעצמו עם AI - ולנסות להבין איפה פה נצטרך לפתח סוכני AI, איך נדאג שהם יעבדו יציב גם בפרודקשן? איך נפרוס אותם בענן? באיזה MCP להשתמש ואיך?
ומה תכלס אפשר לקחת גם בתור ארגונים שלרוב מטמיעים דווקא את גיטהאב קופיילוט?
הרבה דברים מאוד מעניינים לדבר עליהם. על זאת ועוד, מחר בע״ה בהרצאה שלי 🫶
❤1
Media is too big
VIEW IN TELEGRAM
משהו מאוד טוב עובר על ComfyUI, התוכנה אחת הכי מסובכות ולא אינטואיטיביות שקיימות המאפשרות להשתמש במודלים פתוחים לג'נרט תמונות ו\או סרטונים ו\או אודיו עם AI!
המשהו הטוב הזה הוא שבגרסא העדכנית יש תפריט שאפשר פשוט לבחור מה רוצים - ומקבלים מיד workflow מוכן! רק לאשר להוריד את המודלים הנחוצים - וזהו. בהינתן מחשב חזק מספיק, הכל הפך לנגיש בטירוף!
המשהו הטוב הזה הוא שבגרסא העדכנית יש תפריט שאפשר פשוט לבחור מה רוצים - ומקבלים מיד workflow מוכן! רק לאשר להוריד את המודלים הנחוצים - וזהו. בהינתן מחשב חזק מספיק, הכל הפך לנגיש בטירוף!
👍5
אחרי כמה ימים אינטנסיביים מאוד שלי עם ננו בננה: אמאלה ואבאלה! קבלו תמונה אמיתית מהספריה הלאומית של ה״בן איש חי״, רבנו יוסף חיים זכר צדיק לברכה. תוך שניה המודל הפך את התמונה לבצע ושמר על תווי הפנים, ובפרומפט נוסף הוא גם העיף את הקו השחור המציק שיש בתמונה המקורית.
שני פרומפטים בלבד, ותמונות מקוריות מקבלות חיים. אין טירוף כזה בעולם. שנים שאני מנסה אחזור צבע באיכות גבוהה ולוקח את הבן איש חי כניסיון, וזו פעם ראשונה שנשמטה לי הלסת עד כדי כך!
המודל זמין דרך aigoogle studio בחינם, פשוט אין דברים כאלה. רק חבל שאיכות התוצר מאוד ירודה יחסית. ואין upscale איכותי שלא מעוות את הפנים.
שני פרומפטים בלבד, ותמונות מקוריות מקבלות חיים. אין טירוף כזה בעולם. שנים שאני מנסה אחזור צבע באיכות גבוהה ולוקח את הבן איש חי כניסיון, וזו פעם ראשונה שנשמטה לי הלסת עד כדי כך!
המודל זמין דרך aigoogle studio בחינם, פשוט אין דברים כאלה. רק חבל שאיכות התוצר מאוד ירודה יחסית. ואין upscale איכותי שלא מעוות את הפנים.
❤14
איך יכול להיות שמודל מלפני 3 שנים מייצר את הברקודים היפים האלה והוא מנצח את ננו בננה החדש והמטורף של גוגל? ולמה מודלים פתוחים לעולם יהיו עוצמתיים יותר עבורנו מכל מודל דגל אחר?
לקראת הכנס שלי אני מעצב בעצמי את מה שצריך. אני לא מעצב אבל אני יודע לנגן על כלי AI כך שזה אפשרי יותר. כחלק מהעיצוב רציתי ברקוד מעניין ולא משעמם. נזכרתי בטרנד חזק שהיה לפני שנתיים ובו משתמשים במודל של סטייבל דיפיוז׳ן הישן (1.5) יחד עם מודל ששולט ביצירת התמונות (ControlNet). ניסיתי להיזכר איך עובדים איתו שוב, ובמקביל פתחתי את ננו בננה.
צריך לומר, כל מודל והחוזקות שלו. ננו בננה הוא מודל עריכה. ככזה, הוא אמור להיות מודל שמקבל משימה לבצע שינוי בתמונה ולבצע אותה בהצלחה. והוא באמת עושה את זה. אלא מאי? מה אם אנחנו רוצים שהעריכה של התמונה תהיה ליצור ברקודים מרהיבים ויפהפיים?
כאן אנחנו בבעיה. מהניסוי שלי ברור שהוא לא אומן על זה. ובניגוד לפלאקס שניתן לאמן לורות בקלות, לננו בננה אי אפשר, ולפלאקס אין מודל קיים שיכול לבצע את זה. וכך, למרות שקיים מודל ישן מאוד, מסתבר שבגלל שבזמנו אימנו מודל על טכניקות של QR, זה הכי טוב שיש לנו כיום! מודל מ-2022 מנצח את המודלים שנתנו לו נוק אאוט ב-2024-2025!
איך זה קורה בפועל?
- מתקינים את אוטומטיק 1111 הישן והטוב
- מתקינים תוספים של ControlNet
- מורידים את המודלים של סטייבל 1.5, ואת המודלים השונים שרוצים
- מורידים את מודל הקונטרול נט שיודע להסתיר טקסטים ותמונות ולשלב אותם בתמונות חדשות
- משחקים עם המשקולות של הנחיות המודל ושל ה-ControlNet הרלוונטי עד שמגיעים לזה!
וכשמגיעים לזה מרגישים ששערי השמיים נפתחו. זה מה שגרם לי להיות ער עד 4 בלילה מהתלהבות ממש כמו בימים ההם. ועכשיו? יש לי כבר רעיונות לאמן מודל כזה שיתאים למודלים החדשים שיש כיום ויהפכו הכל ליותר קל.
זו הסיבה שלעולם המודלים הפתוחים יהיו יותר עוצמתיים, כמו qwen, wan, flux, מאשר המודלים הסגורים והמצויינים. לא כי הם מבצעים טוב יותר - אלא כי אפשר לאמן אותם על מה שאנחנו רוצים! מה ששוב מחזיר אותנו למקום של ידע זה כוח, ואימון מודלים זה לחולל קסמים עם AI!!!!
מה חושבים על הברקודים שלי? (ייתכן ועד הכנס אחליף לאחרים)
לקראת הכנס שלי אני מעצב בעצמי את מה שצריך. אני לא מעצב אבל אני יודע לנגן על כלי AI כך שזה אפשרי יותר. כחלק מהעיצוב רציתי ברקוד מעניין ולא משעמם. נזכרתי בטרנד חזק שהיה לפני שנתיים ובו משתמשים במודל של סטייבל דיפיוז׳ן הישן (1.5) יחד עם מודל ששולט ביצירת התמונות (ControlNet). ניסיתי להיזכר איך עובדים איתו שוב, ובמקביל פתחתי את ננו בננה.
צריך לומר, כל מודל והחוזקות שלו. ננו בננה הוא מודל עריכה. ככזה, הוא אמור להיות מודל שמקבל משימה לבצע שינוי בתמונה ולבצע אותה בהצלחה. והוא באמת עושה את זה. אלא מאי? מה אם אנחנו רוצים שהעריכה של התמונה תהיה ליצור ברקודים מרהיבים ויפהפיים?
כאן אנחנו בבעיה. מהניסוי שלי ברור שהוא לא אומן על זה. ובניגוד לפלאקס שניתן לאמן לורות בקלות, לננו בננה אי אפשר, ולפלאקס אין מודל קיים שיכול לבצע את זה. וכך, למרות שקיים מודל ישן מאוד, מסתבר שבגלל שבזמנו אימנו מודל על טכניקות של QR, זה הכי טוב שיש לנו כיום! מודל מ-2022 מנצח את המודלים שנתנו לו נוק אאוט ב-2024-2025!
איך זה קורה בפועל?
- מתקינים את אוטומטיק 1111 הישן והטוב
- מתקינים תוספים של ControlNet
- מורידים את המודלים של סטייבל 1.5, ואת המודלים השונים שרוצים
- מורידים את מודל הקונטרול נט שיודע להסתיר טקסטים ותמונות ולשלב אותם בתמונות חדשות
- משחקים עם המשקולות של הנחיות המודל ושל ה-ControlNet הרלוונטי עד שמגיעים לזה!
וכשמגיעים לזה מרגישים ששערי השמיים נפתחו. זה מה שגרם לי להיות ער עד 4 בלילה מהתלהבות ממש כמו בימים ההם. ועכשיו? יש לי כבר רעיונות לאמן מודל כזה שיתאים למודלים החדשים שיש כיום ויהפכו הכל ליותר קל.
זו הסיבה שלעולם המודלים הפתוחים יהיו יותר עוצמתיים, כמו qwen, wan, flux, מאשר המודלים הסגורים והמצויינים. לא כי הם מבצעים טוב יותר - אלא כי אפשר לאמן אותם על מה שאנחנו רוצים! מה ששוב מחזיר אותנו למקום של ידע זה כוח, ואימון מודלים זה לחולל קסמים עם AI!!!!
מה חושבים על הברקודים שלי? (ייתכן ועד הכנס אחליף לאחרים)
😱1
המוח.pdf
10.6 MB
קבלו קסם: האוכל שבתמונות האלה נראה כמו אוכל מקרוב. גם אם מתרחקים, המוח לא רואה את הכתב. אבל! ברגע שאתם מבינים מה כתוב פה, המוח משפר באופן מיידי את הניחוש הכי טוב שלו לפרשנות של מה שהוא רואה, מה שאומר שמהרגע שהמוח ראה והבין - אין איך לחזור אחורה ו"למחוק" את זה.
ברגע שתראו את הכיתוב - לא תוכלו לחזור אחורה. פלא הבריאה וכמה יש לנו ללמוד מיצירותיו של השם יתברך. מבשרי אחזה א-לוק. יצרתי את זה באמצעות יצירת תמונת טקסט בקנבה, לאחר מכן השתמשתי בסטייבל דיפיוז'ן 1.5 עם קונטרול נט של QR ועם משחק בפרמטרים ובפרומפטים קיבלתי את מה שמופיע כאן.
שבת שלום!!
ברגע שתראו את הכיתוב - לא תוכלו לחזור אחורה. פלא הבריאה וכמה יש לנו ללמוד מיצירותיו של השם יתברך. מבשרי אחזה א-לוק. יצרתי את זה באמצעות יצירת תמונת טקסט בקנבה, לאחר מכן השתמשתי בסטייבל דיפיוז'ן 1.5 עם קונטרול נט של QR ועם משחק בפרמטרים ובפרומפטים קיבלתי את מה שמופיע כאן.
שבת שלום!!
❤3🔥2
חברת Qwen הכריזה על מודל שפה חדש וענק של *טריליון* פרמטרים שצריך 25 כרטיסי H100 כדי להריץ אותו לוקאלית. רק מה? המודלים הגדולים של ה-AI (של שפה) לא באמת יכולים להשתפר כבר כי הם למדו מכל הידע הגלוי. אין עוד ידע חדש - אין מה לשפר במודל הבסיס עצמו. מה כן משפרים? את המעטפת.
מוסיפים פיצ׳רים כמו ״חשיבה עמוקה״, או מצב ״למידה״ או גימיקים מגניבים כמו NotebookLM, או משלבים אותם במחוללי תמונות כמו ננו בננה, או מנסים לשלב אותם ברובוטיקה פרקטית, או שמאמנים רשת גדולה יותר עם מספר גדול יותר של פרמטרים. כל מניפולציה עובדת כדי לנסות להראות שהשתפרנו.
בניגוד לכך, המודל הכי חזק שיש לנו היום בקוד, קלוד אופוס 4.1, לצד קלוד סונט 4, ולצד GPT 5 או לצד המודלים הקוליים של GPT, מרגישים שמשהו מאוד לא טוב עובר עליהם. הם לא עונים לעניין, לא משיבים כהלכה, פתאום יוצאים מהקשר, משלבים שפות זרות בתשובות (ערבית באמצע משפטים בעברית, עברית שבורה ורצוצה). הניגוד הזה, של שחרור מודלים חדשים כשבמקביל המודלים הקיימים יורדים באיכות - אומרים דרשני. ובתוך כל זה אנתרופיק מגייסת 15 מיליארד דולר של השקעה, כשהיא אפילו לא רווחית. ספק תהיה בשנים הקרובות. כל זה רק מעלה שוב את השאלה הגדולה: האם מעבר לכיף - AI משתלם בכלל לארגונים? ועזבו ארגונים, האם לחברות ה-AI עצמן משתלם להשאיר את האורות דולקים או שאנחנו לקראת קריסה של החברות האלה שרק תחזוקת המודלים תדרוש בקרוב יותר חשמל ממה שיש לכדור הארץ להציע, שלא לדבר על הנזק לאקלים, ולכן כבר מדברים על ייצור חשמל בטכניקות שונות לרבות מהחלל 🤯
שיהיה לנו שבוע טוב ובשורות טובות, ותזכרו. לא להתלהב מגודל מודלים, מהכרזות שמעוררות פומו. תמיד להסתכל בעומק הדברים ולנסות להבין מתי באמת יש חידוש גדול ומתי זה עוד בלוף. למשל פה עם Qwen, בטבלה שהם פרסמו הם משווים לקלוד אבל במודל ישן יותר וללא חשיבה. העיקר שיש טריליון פרמטרים 🤣
ואגב. רק כדי שנבין. בדר״כ פרמטר הוא בפורמט float32, ז״א 32 סיביות, 32 ביטים, שהם 4 בתים (בייטים). לפרמטר אחד! עכשיו תכפילו את זה בטריליון ותקבלו את המשקל של המודל ותבינו כמה חשמל או כוח מחשוב צריך כדי להריץ אותו וכמה עלה לאמן אותו. מטורף. וכל זה בשביל מה?
מוסיפים פיצ׳רים כמו ״חשיבה עמוקה״, או מצב ״למידה״ או גימיקים מגניבים כמו NotebookLM, או משלבים אותם במחוללי תמונות כמו ננו בננה, או מנסים לשלב אותם ברובוטיקה פרקטית, או שמאמנים רשת גדולה יותר עם מספר גדול יותר של פרמטרים. כל מניפולציה עובדת כדי לנסות להראות שהשתפרנו.
בניגוד לכך, המודל הכי חזק שיש לנו היום בקוד, קלוד אופוס 4.1, לצד קלוד סונט 4, ולצד GPT 5 או לצד המודלים הקוליים של GPT, מרגישים שמשהו מאוד לא טוב עובר עליהם. הם לא עונים לעניין, לא משיבים כהלכה, פתאום יוצאים מהקשר, משלבים שפות זרות בתשובות (ערבית באמצע משפטים בעברית, עברית שבורה ורצוצה). הניגוד הזה, של שחרור מודלים חדשים כשבמקביל המודלים הקיימים יורדים באיכות - אומרים דרשני. ובתוך כל זה אנתרופיק מגייסת 15 מיליארד דולר של השקעה, כשהיא אפילו לא רווחית. ספק תהיה בשנים הקרובות. כל זה רק מעלה שוב את השאלה הגדולה: האם מעבר לכיף - AI משתלם בכלל לארגונים? ועזבו ארגונים, האם לחברות ה-AI עצמן משתלם להשאיר את האורות דולקים או שאנחנו לקראת קריסה של החברות האלה שרק תחזוקת המודלים תדרוש בקרוב יותר חשמל ממה שיש לכדור הארץ להציע, שלא לדבר על הנזק לאקלים, ולכן כבר מדברים על ייצור חשמל בטכניקות שונות לרבות מהחלל 🤯
שיהיה לנו שבוע טוב ובשורות טובות, ותזכרו. לא להתלהב מגודל מודלים, מהכרזות שמעוררות פומו. תמיד להסתכל בעומק הדברים ולנסות להבין מתי באמת יש חידוש גדול ומתי זה עוד בלוף. למשל פה עם Qwen, בטבלה שהם פרסמו הם משווים לקלוד אבל במודל ישן יותר וללא חשיבה. העיקר שיש טריליון פרמטרים 🤣
ואגב. רק כדי שנבין. בדר״כ פרמטר הוא בפורמט float32, ז״א 32 סיביות, 32 ביטים, שהם 4 בתים (בייטים). לפרמטר אחד! עכשיו תכפילו את זה בטריליון ותקבלו את המשקל של המודל ותבינו כמה חשמל או כוח מחשוב צריך כדי להריץ אותו וכמה עלה לאמן אותו. מטורף. וכל זה בשביל מה?
👍5