שבוע חדש עם בשורה: חברת AKOOL המדהימה מתחילה לחלק 50 קרדיטים חינם כל חודש!!!!
מדובר בחברה קוריאנית שיש לה את ה FaceSwap בווידאו הכי איכותי שראיתי, אוואטרים ועוד יכולות משוגעות. וואו איזו מתנה!
פשוט להירשם לאתר ולהתחיל להנות!
הכתובת: akool.com
שבוע טוב ובשורות טוב,
יובל אבידני
מדובר בחברה קוריאנית שיש לה את ה FaceSwap בווידאו הכי איכותי שראיתי, אוואטרים ועוד יכולות משוגעות. וואו איזו מתנה!
פשוט להירשם לאתר ולהתחיל להנות!
הכתובת: akool.com
שבוע טוב ובשורות טוב,
יובל אבידני
🔥2❤1👌1
זוכרים את דווין מהנדס התוכנה הראשון שכולו AI? אז הוסיפו לו יכולת של יצירת ״מהלכים״, ומה זה אומר?
שאפשר לרשום בקובץ בצורה מסודרת שלבים שאנחנו רוצים שדווין יבצע, כמו:
1. גלוש לאתר שירונט
2. חפש את השירים של יהודה פוליקר
3. חלץ את כל השירים ושמור אותם בקובץ טקסט
4. היכנס לאתר HuggingFace וחפש מודל שפה קטן
5. אמן מודל באמצעות Fine Tune על השירים שלקחת
6. בדוק שהמודל עובד
7. צור אתר שמאפשר להשתמש במודל, לבקש טקסטים חדשים של שירים
זה נקרא ״מהלך״ שאפשר להוסיף ל״ספר המשחקים״. תיאור בלבד, ודווין יוצא לפעולה. לא רק שזה אפשרי, אלא שבערוץ הסוקרים הטכניים אפילו פתחו אתגר ומעודדים כמה שיותר שימושים כאלה, מבקשים מאיתנו לדווח על הצלחות וכשלונות או ״כמעט הצלחות״, משפרים את דווין כל הזמן, ואפילו יוצרים תחרויות בין הסוקרים הטכניים.
זה כל כך מעניין לראות מה אפשר ליצור איתו. עד כה יצרתי איתו:
1. אתר שמתמלל בלייב ומדפיס למסך את התמלול
2. אתר שממחיש ויזואלית את ההבדלים בין סוגים שונים של למידת מכונה
3. אתר שפונה למודל השפה קוהר ומחזיר קובץ אודיו של תשובה בעברית עם קול שיצרתי של דמות משוכפלת
זה מדהים ורק התחלנו.
בתמונה - צילום מסך מערוץ הסוקרים הטכניים שמפרט על Playbooks.
ערב טוב,
יובל אבידני
שאפשר לרשום בקובץ בצורה מסודרת שלבים שאנחנו רוצים שדווין יבצע, כמו:
1. גלוש לאתר שירונט
2. חפש את השירים של יהודה פוליקר
3. חלץ את כל השירים ושמור אותם בקובץ טקסט
4. היכנס לאתר HuggingFace וחפש מודל שפה קטן
5. אמן מודל באמצעות Fine Tune על השירים שלקחת
6. בדוק שהמודל עובד
7. צור אתר שמאפשר להשתמש במודל, לבקש טקסטים חדשים של שירים
זה נקרא ״מהלך״ שאפשר להוסיף ל״ספר המשחקים״. תיאור בלבד, ודווין יוצא לפעולה. לא רק שזה אפשרי, אלא שבערוץ הסוקרים הטכניים אפילו פתחו אתגר ומעודדים כמה שיותר שימושים כאלה, מבקשים מאיתנו לדווח על הצלחות וכשלונות או ״כמעט הצלחות״, משפרים את דווין כל הזמן, ואפילו יוצרים תחרויות בין הסוקרים הטכניים.
זה כל כך מעניין לראות מה אפשר ליצור איתו. עד כה יצרתי איתו:
1. אתר שמתמלל בלייב ומדפיס למסך את התמלול
2. אתר שממחיש ויזואלית את ההבדלים בין סוגים שונים של למידת מכונה
3. אתר שפונה למודל השפה קוהר ומחזיר קובץ אודיו של תשובה בעברית עם קול שיצרתי של דמות משוכפלת
זה מדהים ורק התחלנו.
בתמונה - צילום מסך מערוץ הסוקרים הטכניים שמפרט על Playbooks.
ערב טוב,
יובל אבידני
🤯8👍2🙏1
Media is too big
VIEW IN TELEGRAM
לוחמה פסיכולוגית וחוסר אמון במה שאנו רואים או מספרים לנו - זו המציאות החדשה שלנו שמפלחת את הלבבות של כל המשפחות.
אנו עדים לתודעת כזב שמחלחלת מכל ערוץ, זה הופך יותר ויותר קשה - למה מאמינים ולמה לא?
תראו למשל את הכלי החדש שמצאתי, שהוא יקר להחריד, אבל התוצאות שלו מדברות בעד עצמן. ככה נראה DeepFake באיכות 4K. לא ראיתי עדיין משהו ברמה הזו, וזה מטריד להחריד. וזמין!
שנדע רק טוב, בטח בימים כאלה. ושנזכור לא להאמין יותר לשום דבר ממה שאנו רואים, כי זה כבר כאן.
בשורות טובות.
יובל
אנו עדים לתודעת כזב שמחלחלת מכל ערוץ, זה הופך יותר ויותר קשה - למה מאמינים ולמה לא?
תראו למשל את הכלי החדש שמצאתי, שהוא יקר להחריד, אבל התוצאות שלו מדברות בעד עצמן. ככה נראה DeepFake באיכות 4K. לא ראיתי עדיין משהו ברמה הזו, וזה מטריד להחריד. וזמין!
שנדע רק טוב, בטח בימים כאלה. ושנזכור לא להאמין יותר לשום דבר ממה שאנו רואים, כי זה כבר כאן.
בשורות טובות.
יובל
😱2
סיכום ההכרזה של OpenAI - מציג רק את ההתרשמות שלי מעיקרי הדברים:
1. מודל חדש הוצג, GPT 4o שזמין בחינם לכל המשתמשים
2. המודל זמין גם למפתחים דרך API
3. המודל מזהה גם וידאו גם טקסט וגם אודיו
4. המודל מצליח להשיב לדיבור תוך הבעת רגש והתאמת הטונציה (יש פה טכניקה חדשה של דיבור, ללא עיכובים)
5. הכרזה על תוכנה למחשב במקום שימוש בדפדפן
תהיות שלי ברמת אבטחת מידע וסייבר:
1. התקנת תוכנה על המחשב - משמעותה הרצת קוד על חומרה, שזה אומר שיכול להיות שזו הדרך של OpenAI להתחיל ״לחגוג״ על משאבים של משתמשים בדומה לכריית ביטקוין כדי להתחיל לנצל את משאבי המחשוב שלהם, כי הרי אין מתנות חינם
2. התקנת תוכנה על המחשב גם אומרת שהמודל יתחיל ללמוד על מערכות הפעלה. מזכיר את ראביט למישהו? לדעתי יש פה הרמה שקטה לאימון מודל ממערכות הפעלה ושימוש של משתמשים במחשב עצמו. זה פתח לאימון מודל על ממשקים
3. למה זה מעניין אותם? כי ככה מתחילים לשעוט לעבר AGI, בינה מלאכותית כללית, וככה הופכים את המודלים הגדולים של השפה לא רק למנבאי טקסט אלא לגורם מפתח שמנווט בין כלים שונים, כמו מערכת הפעלה ממש. הרי פורסם שאלטמן מנסה לסגור עסקאות ענק שקשורות למשאבי מחשוב, בהיקף אדיר, אז להשתמש במחשבים של המשתמשים זה רעיון מבריק.
4. שיתוף הפעולה עם אפל - לא באמת בשביל חוויה טובה יותר במקום סירי, אלא עסקה מסתורית כדי לקבל גישה לדאטה של משתמשי אפל, ברמת מערכת ההפעלה.
תחזית קצת שחורה אבל חייבים להסתכל גם על בין השורות ולא רק על הזיקוקים.
סך הכל, ההכרזה הייתה קצרה, חסרת כריזמה אבל גם מעניינת ברמה הטכנית. אין ספק שחברות כמו DeepGram או Assembly AI וגדולות נוספות ספגו טלטלה אדירה הערב. ליבי איתן. אבל גם שמח על היכולת החדשה.
יובל אבידני
1. מודל חדש הוצג, GPT 4o שזמין בחינם לכל המשתמשים
2. המודל זמין גם למפתחים דרך API
3. המודל מזהה גם וידאו גם טקסט וגם אודיו
4. המודל מצליח להשיב לדיבור תוך הבעת רגש והתאמת הטונציה (יש פה טכניקה חדשה של דיבור, ללא עיכובים)
5. הכרזה על תוכנה למחשב במקום שימוש בדפדפן
תהיות שלי ברמת אבטחת מידע וסייבר:
1. התקנת תוכנה על המחשב - משמעותה הרצת קוד על חומרה, שזה אומר שיכול להיות שזו הדרך של OpenAI להתחיל ״לחגוג״ על משאבים של משתמשים בדומה לכריית ביטקוין כדי להתחיל לנצל את משאבי המחשוב שלהם, כי הרי אין מתנות חינם
2. התקנת תוכנה על המחשב גם אומרת שהמודל יתחיל ללמוד על מערכות הפעלה. מזכיר את ראביט למישהו? לדעתי יש פה הרמה שקטה לאימון מודל ממערכות הפעלה ושימוש של משתמשים במחשב עצמו. זה פתח לאימון מודל על ממשקים
3. למה זה מעניין אותם? כי ככה מתחילים לשעוט לעבר AGI, בינה מלאכותית כללית, וככה הופכים את המודלים הגדולים של השפה לא רק למנבאי טקסט אלא לגורם מפתח שמנווט בין כלים שונים, כמו מערכת הפעלה ממש. הרי פורסם שאלטמן מנסה לסגור עסקאות ענק שקשורות למשאבי מחשוב, בהיקף אדיר, אז להשתמש במחשבים של המשתמשים זה רעיון מבריק.
4. שיתוף הפעולה עם אפל - לא באמת בשביל חוויה טובה יותר במקום סירי, אלא עסקה מסתורית כדי לקבל גישה לדאטה של משתמשי אפל, ברמת מערכת ההפעלה.
תחזית קצת שחורה אבל חייבים להסתכל גם על בין השורות ולא רק על הזיקוקים.
סך הכל, ההכרזה הייתה קצרה, חסרת כריזמה אבל גם מעניינת ברמה הטכנית. אין ספק שחברות כמו DeepGram או Assembly AI וגדולות נוספות ספגו טלטלה אדירה הערב. ליבי איתן. אבל גם שמח על היכולת החדשה.
יובל אבידני
👍8❤1
דווין לומד קורסים במקומי! 😱
אחרי ההכרזה של OpenAI אתמול, גבר אצלי החשק לצלול לעומק עם מולטי-מודליות (מודל שאומן על סוגים שונים של מידע - לא רק טקסט. אלא גם וידאו תמונות ואודיו). שלא במקרה, קיבלתי מייל על קורס חדש של מולטימודליות של אנדרו אינג ובמקביל עוד מייל מהחבר׳ה של Devin על כך שהוסיפו אותי לקבוצה חדשה של סוקרים טכניים עם יכולת לעבוד בצוות על אותה משימה.
ראיתי בזה כבר יותר מדי רמזים. נכנסתי לדווין וביקשתי ממנו להתחבר לקורס. ללמוד אותו. לסכם אותו. לפתח אתר שמשתמש במודל כזה כדי להדגים יכולות חיפוש עם מולטימודליות. והנה, גלש. התחבר לקורס עם הפרטים שנתתי לו, עכשיו הוא צופה בקורס וכותב לי סיכום באורך של 15 עמודים ואח״כ יתחיל בפיתוח.
אעדכן. אבל זה פשוט ולמי שתהה - כך נראית חלק מתוכנית העבודה שהוא כתב לעצמו
- בואו לערוץ העדכונים החדש שלי בוואצאפ: https://whatsapp.com/channel/0029Vaf1TtmLikg7KtQOrI27
אחרי ההכרזה של OpenAI אתמול, גבר אצלי החשק לצלול לעומק עם מולטי-מודליות (מודל שאומן על סוגים שונים של מידע - לא רק טקסט. אלא גם וידאו תמונות ואודיו). שלא במקרה, קיבלתי מייל על קורס חדש של מולטימודליות של אנדרו אינג ובמקביל עוד מייל מהחבר׳ה של Devin על כך שהוסיפו אותי לקבוצה חדשה של סוקרים טכניים עם יכולת לעבוד בצוות על אותה משימה.
ראיתי בזה כבר יותר מדי רמזים. נכנסתי לדווין וביקשתי ממנו להתחבר לקורס. ללמוד אותו. לסכם אותו. לפתח אתר שמשתמש במודל כזה כדי להדגים יכולות חיפוש עם מולטימודליות. והנה, גלש. התחבר לקורס עם הפרטים שנתתי לו, עכשיו הוא צופה בקורס וכותב לי סיכום באורך של 15 עמודים ואח״כ יתחיל בפיתוח.
אעדכן. אבל זה פשוט ולמי שתהה - כך נראית חלק מתוכנית העבודה שהוא כתב לעצמו
- בואו לערוץ העדכונים החדש שלי בוואצאפ: https://whatsapp.com/channel/0029Vaf1TtmLikg7KtQOrI27
😱4
זה חזק ממני ואני חייב לשתף ולכן: וובינר *חינם* של על Devin. מהנדס התוכנה הראשון בהיסטוריה שכולו AI!
אסביר עליו הכל לעומק. תקבלו חשיפה בלעדית מהגישה הבלעדית שקיבלתי ותבינו את המהפכה בעיניים.
הערב, סביב 21:00 בזום. אשלח קישור בערוץ החדש של הקהילה שלי בוואצאפ. רוצים גם? הצטרפו לערוץ!
https://whatsapp.com/channel/0029Vaf1TtmLikg7KtQOrI27
אסביר עליו הכל לעומק. תקבלו חשיפה בלעדית מהגישה הבלעדית שקיבלתי ותבינו את המהפכה בעיניים.
הערב, סביב 21:00 בזום. אשלח קישור בערוץ החדש של הקהילה שלי בוואצאפ. רוצים גם? הצטרפו לערוץ!
https://whatsapp.com/channel/0029Vaf1TtmLikg7KtQOrI27
👍7
הייתה תקלה בקישור הקודם, הכל פה:
https://youtube.com/live/EPhem_MFZjA?feature=share
https://youtube.com/live/EPhem_MFZjA?feature=share
YouTube
בלעדי: הכירו את DEVIN - מהנדס התוכנה הראשון שנולד ב-AI - וקבלו הצצה לגישה הפנימית!
בסרטון הזה אחשוף אתכם לממשק הפנימי של דווין, שקיבלתי אליו גישה בלעדית ואסביר למה לדעתי הוא מיוחד מאוד.
לכל התכנים שלי:
https://linktr.ee/yuvai
לכל התכנים שלי:
https://linktr.ee/yuvai
סיכום ההכרזה הערב של גוגל:
מודל יצירת תמונות חדש - שלא זמין לאף אחד
מודל וידאו חדש - שלא זמין לאף אחד
מודל מוזיקה חדש - שלא זמין לאף אחד
משאבי ענן חדשים יותר - שלא זמינים לאף אחד
יכולת של ג׳ימיני לחפש באמצעות סימונים על תמונות - זמין לאנדרואיד בלבד
יכולת של ג׳ימיני לנתח וידאו בזמן אמת בדומה למה שהוצג אתמול ע״י OpenAI - לא זמין לאף אחד
יכולת של ג׳ימיני לראות את העולם עם משקפיים של גוגל ולהשיב - מוצר שלא קיים ותוכנה שלא זמינה לאף אחד
מה כן היה? אחלה דמואים מוכנים מראש, קישור להרשמה לבקשת גישה מוקדמת לכלים, שלא זמינים לאף אחד וספק מתי בכלל יהיו. לדברי גוגל רק מעטים מאוד יקבלו גישה בשבועות הקרובים.
אחלה אירוע השקה ואחלה הכרזות!!!!
מודל יצירת תמונות חדש - שלא זמין לאף אחד
מודל וידאו חדש - שלא זמין לאף אחד
מודל מוזיקה חדש - שלא זמין לאף אחד
משאבי ענן חדשים יותר - שלא זמינים לאף אחד
יכולת של ג׳ימיני לחפש באמצעות סימונים על תמונות - זמין לאנדרואיד בלבד
יכולת של ג׳ימיני לנתח וידאו בזמן אמת בדומה למה שהוצג אתמול ע״י OpenAI - לא זמין לאף אחד
יכולת של ג׳ימיני לראות את העולם עם משקפיים של גוגל ולהשיב - מוצר שלא קיים ותוכנה שלא זמינה לאף אחד
מה כן היה? אחלה דמואים מוכנים מראש, קישור להרשמה לבקשת גישה מוקדמת לכלים, שלא זמינים לאף אחד וספק מתי בכלל יהיו. לדברי גוגל רק מעטים מאוד יקבלו גישה בשבועות הקרובים.
אחלה אירוע השקה ואחלה הכרזות!!!!
🤣9👍3❤1😢1
רעידת אדמה הלילה: איליה סוצקבר, ממייסדי OpenAI, המדען הראשי, עוזב את החברה.
להערכתי, הקרב שהתגלע בין אלטמן לסוצקובר הישראלי, הגיע לרתיחה עם פיטורי אלטמן שהסעירו את הרשת. החברה החזירה את אלטמן וכעת איליה הוא זה שעוזב. מדובר בצעד מאוד קשה מהטעמים הבאים:
1. לאיליה באמת אכפת מבינה מלאכותית שפועלת לטובת האנושות. בעוד שאלטמן מקדם אג׳נדות מסחריות מובהקות, איליה פועל מתוך רצון לשנות את האנושות לטובה.
2. איליה מתנגד לשימוש ב-AI במתכונתה המסחרית הגורפת, ומאוד לא אוהב את ה״מסחרה״ סביב המודלים ואת ההינעלות על חוזים עם מייקרוסופט ושות׳, אלטמן בעד וגם דוחף לזה.
3. איליה התנגד להכרזה של אלטמן על מונטיזציה מ GPTs, ובכלל - סבור שמסוכן שכל הכח יהיה בידיים של חברה מסחרית, שזה פתח לצרות צרורות ומנוגד לעקרונות החברה
4. מדובר בתחילתה של הדרדרות מוסרית היות וכעת אין מבוגר אחראי ברמה של איליה שיכול לבלום את קצב ההתמסחרות. זו פגיעה קשה באיזונים והבלמים של הבינה מול הרצון להתעשר ולהתמסחר. נוסיף לכך את פרישתם של צוות מהנדסי OpenAI שהקימו את אנתרופיק וקלוד, וגם את פרישתו של אנדרי קפארתי הגאון, ובשקט בשקט אנו עדים להפיכה שלטונית אמיתית. זה אירוע דרמטי ברמות שקשה להסביר.
5. לא יחלוף עוד זמן רב עד שמנהיגי החברה יזומנו לשימוע בפני הקונגרס האמריקאי על ריכוזיות בדומה למה שצוקרברג עובר בפייסבוק
לדעתי מישהו צריך להתעורר בדחיפות. לא מן הנמנע שמאסק, שהוא זה שעודד את איליה מלכתחילה לעזוב את Google Brain ולהקים את OpenAI ישקיע בו שוב עם כל רעיון שיהיה לו.
שתמיד נזכור לא להיות מסונוורים מאף חברה ולהישאר מאוד ביקורתיים למהלכים משמעותיים כאלה.
יובל.
להערכתי, הקרב שהתגלע בין אלטמן לסוצקובר הישראלי, הגיע לרתיחה עם פיטורי אלטמן שהסעירו את הרשת. החברה החזירה את אלטמן וכעת איליה הוא זה שעוזב. מדובר בצעד מאוד קשה מהטעמים הבאים:
1. לאיליה באמת אכפת מבינה מלאכותית שפועלת לטובת האנושות. בעוד שאלטמן מקדם אג׳נדות מסחריות מובהקות, איליה פועל מתוך רצון לשנות את האנושות לטובה.
2. איליה מתנגד לשימוש ב-AI במתכונתה המסחרית הגורפת, ומאוד לא אוהב את ה״מסחרה״ סביב המודלים ואת ההינעלות על חוזים עם מייקרוסופט ושות׳, אלטמן בעד וגם דוחף לזה.
3. איליה התנגד להכרזה של אלטמן על מונטיזציה מ GPTs, ובכלל - סבור שמסוכן שכל הכח יהיה בידיים של חברה מסחרית, שזה פתח לצרות צרורות ומנוגד לעקרונות החברה
4. מדובר בתחילתה של הדרדרות מוסרית היות וכעת אין מבוגר אחראי ברמה של איליה שיכול לבלום את קצב ההתמסחרות. זו פגיעה קשה באיזונים והבלמים של הבינה מול הרצון להתעשר ולהתמסחר. נוסיף לכך את פרישתם של צוות מהנדסי OpenAI שהקימו את אנתרופיק וקלוד, וגם את פרישתו של אנדרי קפארתי הגאון, ובשקט בשקט אנו עדים להפיכה שלטונית אמיתית. זה אירוע דרמטי ברמות שקשה להסביר.
5. לא יחלוף עוד זמן רב עד שמנהיגי החברה יזומנו לשימוע בפני הקונגרס האמריקאי על ריכוזיות בדומה למה שצוקרברג עובר בפייסבוק
לדעתי מישהו צריך להתעורר בדחיפות. לא מן הנמנע שמאסק, שהוא זה שעודד את איליה מלכתחילה לעזוב את Google Brain ולהקים את OpenAI ישקיע בו שוב עם כל רעיון שיהיה לו.
שתמיד נזכור לא להיות מסונוורים מאף חברה ולהישאר מאוד ביקורתיים למהלכים משמעותיים כאלה.
יובל.
👍6🔥2
יש לנו פה 905 מנויים אבל בקבוצת הדיונים בטלגרם יש רק 156! בואו תצטרפו לקבוצת הדיונים פה, יש פה תותחים!!!
https://t.me/yavidani
https://t.me/yavidani
Telegram
יובל אבידני - YUV.AI
קהילת שיתוף תוכן - הכל על AI! אין לפרסם בקבוצה ללא אישור מנהל.
מסע הלמידה שלי נמשך והפעם אני מאתגר את עצמי ליצור מודל שמסוגל להטמיע טקסט על תמונות - בעברית.
כבר תקופה ארוכה מאוד שאני מתמוגג מנחת מהיכולת של אידאוגרם להטמיע טקסטים כחלק מתהליך הדיפיוז׳ן של יצירת תמונות עם בינה מלאכותית. הרבה פעמים תהיתי לעצמי למה אין עדיין עברית ומתי תהיה אם בכלל?
אז לפני כמה דקות נתתי לדווין משימה ואני מאוד סקרן לראות מה יעלה בגורלה, אבל על הדרך למדתי המון דברים. למשל, שלאידאוגרם יש מדריך מאוד מסודר שמסביר איך ליצור פונטים שונים, להטמיע נכון טקסטים בתמונה. או גם שיש חבר׳ה מאוד מוכשרים בעולם שכידוע, עוד מזמן, אימנו מודל (לורה) על לוגואים וטקסטים, כמו Harroglass או AnyText ודומיהם.
אני מניח שאני לא מחדש הרבה לכולם פה, אבל לידע כללי, כדי לאמן מודל על סגנון מסוים, נניח על תמונות שלנו, יש לנו כלים כמו Kohya ו DreamBooth, שמה שהם עושים בסוף זה לנצל את המחקר שהוכיח ש-LoRA, קרי: שימוש ביחסית מעט דאטה להמשך אימון של מודל קיים, עובד מצוין על אף היות משקל הלורה קטן פי 10 ממשקל המודל.
מה זה אומר? שאפשר לאמן מודל ״קטן״ ולהשתמש בו תוך כדי הרצת מודל ״גדול״. אנו בעצם מעשירים את היכולת של מודל הבסיס ומעניקים אפשרות להוסיף סגנונות בין אם זה טקסט או דברים אחרים. קהילת המאמנים פיתחה המון מודלים - ובחינם.
אז אם אנחנו רוצים לאמן סגנון משלנו, או טקסטים משלנו, אנחנו צריכים קודם כל לאסוף תמונות. לוודא שהתמונות מדברות בשפה אחת כדי שהמודל יתאמן בהצלחה על הסגנון. לאחר מכן יש עוד תהליך מייגע של יצירת טקסט תואם לכל תמונה, תיאור שלה, ועוד כמה תהליך טכנים מתישים, עד שבסוף מאמנים ומקבלים קובץ לורה, שבו נשתמש בעת הזנת פרומפט למודל, ואז, בשאיפה הקסם יקרה.
הלורה שומרת מילת קסם, שאם נזין אותה לפרומפט הלורה תשתלב ותיכנס לפעולה מיד, ונקבל תמונה עם סגנון הלורה שלנו - בין אם מדובר בתמונות שלנו או טקסט.
יש עוד המון מורכבות, וזה לא רעיון חדש, אבל יהיה מעניין לראות אם דווין ואני נצליח ליצור מודל לורה על עברית. יש למה לצפות!!
ערב נפלא,
יובל.
כבר תקופה ארוכה מאוד שאני מתמוגג מנחת מהיכולת של אידאוגרם להטמיע טקסטים כחלק מתהליך הדיפיוז׳ן של יצירת תמונות עם בינה מלאכותית. הרבה פעמים תהיתי לעצמי למה אין עדיין עברית ומתי תהיה אם בכלל?
אז לפני כמה דקות נתתי לדווין משימה ואני מאוד סקרן לראות מה יעלה בגורלה, אבל על הדרך למדתי המון דברים. למשל, שלאידאוגרם יש מדריך מאוד מסודר שמסביר איך ליצור פונטים שונים, להטמיע נכון טקסטים בתמונה. או גם שיש חבר׳ה מאוד מוכשרים בעולם שכידוע, עוד מזמן, אימנו מודל (לורה) על לוגואים וטקסטים, כמו Harroglass או AnyText ודומיהם.
אני מניח שאני לא מחדש הרבה לכולם פה, אבל לידע כללי, כדי לאמן מודל על סגנון מסוים, נניח על תמונות שלנו, יש לנו כלים כמו Kohya ו DreamBooth, שמה שהם עושים בסוף זה לנצל את המחקר שהוכיח ש-LoRA, קרי: שימוש ביחסית מעט דאטה להמשך אימון של מודל קיים, עובד מצוין על אף היות משקל הלורה קטן פי 10 ממשקל המודל.
מה זה אומר? שאפשר לאמן מודל ״קטן״ ולהשתמש בו תוך כדי הרצת מודל ״גדול״. אנו בעצם מעשירים את היכולת של מודל הבסיס ומעניקים אפשרות להוסיף סגנונות בין אם זה טקסט או דברים אחרים. קהילת המאמנים פיתחה המון מודלים - ובחינם.
אז אם אנחנו רוצים לאמן סגנון משלנו, או טקסטים משלנו, אנחנו צריכים קודם כל לאסוף תמונות. לוודא שהתמונות מדברות בשפה אחת כדי שהמודל יתאמן בהצלחה על הסגנון. לאחר מכן יש עוד תהליך מייגע של יצירת טקסט תואם לכל תמונה, תיאור שלה, ועוד כמה תהליך טכנים מתישים, עד שבסוף מאמנים ומקבלים קובץ לורה, שבו נשתמש בעת הזנת פרומפט למודל, ואז, בשאיפה הקסם יקרה.
הלורה שומרת מילת קסם, שאם נזין אותה לפרומפט הלורה תשתלב ותיכנס לפעולה מיד, ונקבל תמונה עם סגנון הלורה שלנו - בין אם מדובר בתמונות שלנו או טקסט.
יש עוד המון מורכבות, וזה לא רעיון חדש, אבל יהיה מעניין לראות אם דווין ואני נצליח ליצור מודל לורה על עברית. יש למה לצפות!!
ערב נפלא,
יובל.
👍2🔥1