YUV.AI - בינה מלאכותית בעברית
2.43K subscribers
657 photos
410 videos
37 files
439 links
YUV.AI - בינה מלאכותית בעברית
👉 https://yuv.ai 👈
Download Telegram
Media is too big
VIEW IN TELEGRAM
לוחמה פסיכולוגית וחוסר אמון במה שאנו רואים או מספרים לנו - זו המציאות החדשה שלנו שמפלחת את הלבבות של כל המשפחות.

אנו עדים לתודעת כזב שמחלחלת מכל ערוץ, זה הופך יותר ויותר קשה - למה מאמינים ולמה לא?

תראו למשל את הכלי החדש שמצאתי, שהוא יקר להחריד, אבל התוצאות שלו מדברות בעד עצמן. ככה נראה DeepFake באיכות 4K. לא ראיתי עדיין משהו ברמה הזו, וזה מטריד להחריד. וזמין!

שנדע רק טוב, בטח בימים כאלה. ושנזכור לא להאמין יותר לשום דבר ממה שאנו רואים, כי זה כבר כאן.

בשורות טובות.
יובל
😱2
סיכום ההכרזה של OpenAI - מציג רק את ההתרשמות שלי מעיקרי הדברים:
1. מודל חדש הוצג, GPT 4o שזמין בחינם לכל המשתמשים
2. ⁠המודל זמין גם למפתחים דרך API
3. ⁠המודל מזהה גם וידאו גם טקסט וגם אודיו
4. ⁠המודל מצליח להשיב לדיבור תוך הבעת רגש והתאמת הטונציה (יש פה טכניקה חדשה של דיבור, ללא עיכובים)
5. ⁠הכרזה על תוכנה למחשב במקום שימוש בדפדפן

תהיות שלי ברמת אבטחת מידע וסייבר:
1. התקנת תוכנה על המחשב - משמעותה הרצת קוד על חומרה, שזה אומר שיכול להיות שזו הדרך של OpenAI להתחיל ״לחגוג״ על משאבים של משתמשים בדומה לכריית ביטקוין כדי להתחיל לנצל את משאבי המחשוב שלהם, כי הרי אין מתנות חינם
2. ⁠התקנת תוכנה על המחשב גם אומרת שהמודל יתחיל ללמוד על מערכות הפעלה. מזכיר את ראביט למישהו? לדעתי יש פה הרמה שקטה לאימון מודל ממערכות הפעלה ושימוש של משתמשים במחשב עצמו. זה פתח לאימון מודל על ממשקים
3. ⁠למה זה מעניין אותם? כי ככה מתחילים לשעוט לעבר AGI, בינה מלאכותית כללית, וככה הופכים את המודלים הגדולים של השפה לא רק למנבאי טקסט אלא לגורם מפתח שמנווט בין כלים שונים, כמו מערכת הפעלה ממש. הרי פורסם שאלטמן מנסה לסגור עסקאות ענק שקשורות למשאבי מחשוב, בהיקף אדיר, אז להשתמש במחשבים של המשתמשים זה רעיון מבריק.
4. ⁠שיתוף הפעולה עם אפל - לא באמת בשביל חוויה טובה יותר במקום סירי, אלא עסקה מסתורית כדי לקבל גישה לדאטה של משתמשי אפל, ברמת מערכת ההפעלה.

תחזית קצת שחורה אבל חייבים להסתכל גם על בין השורות ולא רק על הזיקוקים.

סך הכל, ההכרזה הייתה קצרה, חסרת כריזמה אבל גם מעניינת ברמה הטכנית. אין ספק שחברות כמו DeepGram או Assembly AI וגדולות נוספות ספגו טלטלה אדירה הערב. ליבי איתן. אבל גם שמח על היכולת החדשה.

יובל אבידני
👍81
דווין לומד קורסים במקומי! 😱

אחרי ההכרזה של OpenAI אתמול, גבר אצלי החשק לצלול לעומק עם מולטי-מודליות (מודל שאומן על סוגים שונים של מידע - לא רק טקסט. אלא גם וידאו תמונות ואודיו). שלא במקרה, קיבלתי מייל על קורס חדש של מולטימודליות של אנדרו אינג ובמקביל עוד מייל מהחבר׳ה של Devin על כך שהוסיפו אותי לקבוצה חדשה של סוקרים טכניים עם יכולת לעבוד בצוות על אותה משימה.

ראיתי בזה כבר יותר מדי רמזים. נכנסתי לדווין וביקשתי ממנו להתחבר לקורס. ללמוד אותו. לסכם אותו. לפתח אתר שמשתמש במודל כזה כדי להדגים יכולות חיפוש עם מולטימודליות. והנה, גלש. התחבר לקורס עם הפרטים שנתתי לו, עכשיו הוא צופה בקורס וכותב לי סיכום באורך של 15 עמודים ואח״כ יתחיל בפיתוח.

אעדכן. אבל זה פשוט ולמי שתהה - כך נראית חלק מתוכנית העבודה שהוא כתב לעצמו

- בואו לערוץ העדכונים החדש שלי בוואצאפ: https://whatsapp.com/channel/0029Vaf1TtmLikg7KtQOrI27
😱4
זה חזק ממני ואני חייב לשתף ולכן: וובינר *חינם* של על Devin. מהנדס התוכנה הראשון בהיסטוריה שכולו AI!

אסביר עליו הכל לעומק. תקבלו חשיפה בלעדית מהגישה הבלעדית שקיבלתי ותבינו את המהפכה בעיניים.

הערב, סביב 21:00 בזום. אשלח קישור בערוץ החדש של הקהילה שלי בוואצאפ. רוצים גם? הצטרפו לערוץ!

https://whatsapp.com/channel/0029Vaf1TtmLikg7KtQOrI27
👍7
סיכום ההכרזה הערב של גוגל:

מודל יצירת תמונות חדש - שלא זמין לאף אחד
מודל וידאו חדש - שלא זמין לאף אחד
מודל מוזיקה חדש - שלא זמין לאף אחד
משאבי ענן חדשים יותר - שלא זמינים לאף אחד
יכולת של ג׳ימיני לחפש באמצעות סימונים על תמונות - זמין לאנדרואיד בלבד
יכולת של ג׳ימיני לנתח וידאו בזמן אמת בדומה למה שהוצג אתמול ע״י OpenAI - לא זמין לאף אחד
יכולת של ג׳ימיני לראות את העולם עם משקפיים של גוגל ולהשיב - מוצר שלא קיים ותוכנה שלא זמינה לאף אחד

מה כן היה? אחלה דמואים מוכנים מראש, קישור להרשמה לבקשת גישה מוקדמת לכלים, שלא זמינים לאף אחד וספק מתי בכלל יהיו. לדברי גוגל רק מעטים מאוד יקבלו גישה בשבועות הקרובים.

אחלה אירוע השקה ואחלה הכרזות!!!!
🤣9👍31😢1
רעידת אדמה הלילה: איליה סוצקבר, ממייסדי OpenAI, המדען הראשי, עוזב את החברה.

להערכתי, הקרב שהתגלע בין אלטמן לסוצקובר הישראלי, הגיע לרתיחה עם פיטורי אלטמן שהסעירו את הרשת. החברה החזירה את אלטמן וכעת איליה הוא זה שעוזב. מדובר בצעד מאוד קשה מהטעמים הבאים:

1. לאיליה באמת אכפת מבינה מלאכותית שפועלת לטובת האנושות. בעוד שאלטמן מקדם אג׳נדות מסחריות מובהקות, איליה פועל מתוך רצון לשנות את האנושות לטובה.
2. ⁠איליה מתנגד לשימוש ב-AI במתכונתה המסחרית הגורפת, ומאוד לא אוהב את ה״מסחרה״ סביב המודלים ואת ההינעלות על חוזים עם מייקרוסופט ושות׳, אלטמן בעד וגם דוחף לזה.
3. ⁠איליה התנגד להכרזה של אלטמן על מונטיזציה מ GPTs, ובכלל - סבור שמסוכן שכל הכח יהיה בידיים של חברה מסחרית, שזה פתח לצרות צרורות ומנוגד לעקרונות החברה
4. ⁠מדובר בתחילתה של הדרדרות מוסרית היות וכעת אין מבוגר אחראי ברמה של איליה שיכול לבלום את קצב ההתמסחרות. זו פגיעה קשה באיזונים והבלמים של הבינה מול הרצון להתעשר ולהתמסחר. נוסיף לכך את פרישתם של צוות מהנדסי OpenAI שהקימו את אנתרופיק וקלוד, וגם את פרישתו של אנדרי קפארתי הגאון, ובשקט בשקט אנו עדים להפיכה שלטונית אמיתית. זה אירוע דרמטי ברמות שקשה להסביר.
5. ⁠לא יחלוף עוד זמן רב עד שמנהיגי החברה יזומנו לשימוע בפני הקונגרס האמריקאי על ריכוזיות בדומה למה שצוקרברג עובר בפייסבוק

לדעתי מישהו צריך להתעורר בדחיפות. לא מן הנמנע שמאסק, שהוא זה שעודד את איליה מלכתחילה לעזוב את Google Brain ולהקים את OpenAI ישקיע בו שוב עם כל רעיון שיהיה לו.

שתמיד נזכור לא להיות מסונוורים מאף חברה ולהישאר מאוד ביקורתיים למהלכים משמעותיים כאלה.

יובל.
👍6🔥2
יש לנו פה 905 מנויים אבל בקבוצת הדיונים בטלגרם יש רק 156! בואו תצטרפו לקבוצת הדיונים פה, יש פה תותחים!!!

https://t.me/yavidani
מסע הלמידה שלי נמשך והפעם אני מאתגר את עצמי ליצור מודל שמסוגל להטמיע טקסט על תמונות - בעברית.

כבר תקופה ארוכה מאוד שאני מתמוגג מנחת מהיכולת של אידאוגרם להטמיע טקסטים כחלק מתהליך הדיפיוז׳ן של יצירת תמונות עם בינה מלאכותית. הרבה פעמים תהיתי לעצמי למה אין עדיין עברית ומתי תהיה אם בכלל?

אז לפני כמה דקות נתתי לדווין משימה ואני מאוד סקרן לראות מה יעלה בגורלה, אבל על הדרך למדתי המון דברים. למשל, שלאידאוגרם יש מדריך מאוד מסודר שמסביר איך ליצור פונטים שונים, להטמיע נכון טקסטים בתמונה. או גם שיש חבר׳ה מאוד מוכשרים בעולם שכידוע, עוד מזמן, אימנו מודל (לורה) על לוגואים וטקסטים, כמו Harroglass או AnyText ודומיהם.

אני מניח שאני לא מחדש הרבה לכולם פה, אבל לידע כללי, כדי לאמן מודל על סגנון מסוים, נניח על תמונות שלנו, יש לנו כלים כמו Kohya ו DreamBooth, שמה שהם עושים בסוף זה לנצל את המחקר שהוכיח ש-LoRA, קרי: שימוש ביחסית מעט דאטה להמשך אימון של מודל קיים, עובד מצוין על אף היות משקל הלורה קטן פי 10 ממשקל המודל.

מה זה אומר? שאפשר לאמן מודל ״קטן״ ולהשתמש בו תוך כדי הרצת מודל ״גדול״. אנו בעצם מעשירים את היכולת של מודל הבסיס ומעניקים אפשרות להוסיף סגנונות בין אם זה טקסט או דברים אחרים. קהילת המאמנים פיתחה המון מודלים - ובחינם.

אז אם אנחנו רוצים לאמן סגנון משלנו, או טקסטים משלנו, אנחנו צריכים קודם כל לאסוף תמונות. לוודא שהתמונות מדברות בשפה אחת כדי שהמודל יתאמן בהצלחה על הסגנון. לאחר מכן יש עוד תהליך מייגע של יצירת טקסט תואם לכל תמונה, תיאור שלה, ועוד כמה תהליך טכנים מתישים, עד שבסוף מאמנים ומקבלים קובץ לורה, שבו נשתמש בעת הזנת פרומפט למודל, ואז, בשאיפה הקסם יקרה.

הלורה שומרת מילת קסם, שאם נזין אותה לפרומפט הלורה תשתלב ותיכנס לפעולה מיד, ונקבל תמונה עם סגנון הלורה שלנו - בין אם מדובר בתמונות שלנו או טקסט.

יש עוד המון מורכבות, וזה לא רעיון חדש, אבל יהיה מעניין לראות אם דווין ואני נצליח ליצור מודל לורה על עברית. יש למה לצפות!!

ערב נפלא,
יובל.
👍2🔥1