מוזמנים להגיב פה: https://www.facebook.com/share/p/1GSeq6HaVE/ או בלינקדין: https://www.linkedin.com/posts/%F0%9F%8E%97%EF%B8%8Fyuval-avidani-87081474_%D7%9E%D7%9B%D7%99%D7%A8%D7%99%D7%9D-%D7%90%D7%AA-%D7%96%D7%94-%D7%A9%D7%90%D7%AA%D7%9D-%D7%A8%D7%95%D7%A6%D7%99%D7%9D-%D7%9C%D7%A9%D7%9E%D7%95%D7%A8-%D7%A1%D7%A8%D7%98%D7%95%D7%9F-%D7%9E%D7%94%D7%A8%D7%A9%D7%AA-activity-7417915740697210880-PxNo?utm_source=share&utm_medium=member_desktop&rcm=ACoAAA_IUNQBv1nBtAXW8okhlIl4mhR78WelGB4
Facebook
Log in or sign up to view
See posts, photos and more on Facebook.
הריפו Devika מאת stitionai הוא מהנדס תוכנה AI בקוד פתוח שמטפל במחזור פיתוח שלם - מתכנון ועד דיפלוי. מסתבר שאפשר לתת לו מטרה ברמה גבוהה והוא יפרק אותה לשלבים, יחקור פתרונות, יכתוב קוד, ידבג, ויעשה איטרציות עד שזה עובד. מה שנקרא agentic AI שמשלב כמה מודלים - Claude לתכנון, GPT-4 לקוד, ועם יכולת לגלוש ברשת ולחקור. תחשבו על זה כמו מפתח ג'וניור שיכול לרוץ עם הברייף שלכם. בעיניי, זה משנה את המשחק לפרוטוטייפינג מהיר ופיצ'רים מוגדרים היטב. הקאץ'? עדיין צריך לפקח ולהדריך, במיוחד בארכיטקטורה מורכבת. https://github.com/stitionai/devika
--
לפוסט המלא: https://yuv.ai/blog/devika
--
לפוסט המלא: https://yuv.ai/blog/devika
❤1
הריפו Dexter מאת virattt הוא סוכן אוטונומי למחקר פיננסי ש'חושב' לפני שפועל. מסתבר שהבעיה עם סוכני AI רגילים היא שהם לא עושים ולידציה למה שהם מחזירים - אנחנו מבזבזים שעות על בדיקות צולבות. הריפו פותר את זה עם ארכיטקטורה רב-סוכנית: סוכן תכנון, סוכן פעולה, סוכן ולידציה וסוכן תשובה - תחשבו על זה כמו צוות מחקר שכל אחד עושה את התפקיד שלו. הקטע המדליק הוא שכבת הבטיחות שמונעת לולאות בורחות. בעיניי זה חיוני למי שעובד עם החלטות פיננסיות. https://github.com/virattt/dexter
--
לפוסט המלא: https://yuv.ai/blog/dexter
--
לפוסט המלא: https://yuv.ai/blog/dexter
מה שאתם רואים פה זה פלא כי המייל הזה הוא ניוזלטר AI אוטומטי שמרכז את הכתבות שלי מהשבוע החולף - ובשילוב אוטומציות ו-LLMs גם מפיץ אותן לכל המנויים באתר, אוטומטית לחלוטין!
מבחינה טכנית יש פה מהלך די מטורף. מצד אחד, הגדרתי אוטומציות שעוקבות אחר טריגרים של תכנים שאני מתעניין בהם - ומייצרים תוכן בסגנון שלי, ממש מותאם אלי, בעברית ובאנגלית - ומעבירים אלי לאישור כי בכל זאת זה התוכן שלי.
אחרי שאני עובר ועורך ומאשר - הכל מופץ אוטומטית לכל הערוצים שלי. לאחר מכן, אחת לשבוע, אוטומציה אחרת אוספת את הכתבות מהשבוע החולף ומייצר גיליון דו-שפתי, בעברית ובאנגלית של הניוזלטר החדש שלי: Curve (או בשמו המלא: Stay Ahead Of The CURVE), שמשמעותו בעברית קצת אחרת אבל הרעיון הוא להקדים את הפיתולים. לדבר על כל מה שצריך לדעת עוד לפני שמתחילים להרעיש ולבלבל ברשת.
אז יש כאן שילוב של make עם מספר קריאות למודלים גדולים של שפה, כמו גם שימוש בננו בננה ברו האח כדי לייצר את הגרפיקות (לרבות עיצוב תבנית הניוזלטר עצמו) - וכל פסיק באתר מתחבר למערכת הניהול שמציגה גרפים של כל מה שקורה עם המשתמשים: האם מחוברים, כמה זמן, במה קוראים, מפות חום ועוד המון דברים מגניבים.
אני לא מפסיק לטחון את קלוד אופוס 4.5 מאז שגיליתי כמה הוא טוב - והוספתי עוד שני דברים:
1. אחת לשבוע, האתר שלי אוסף את הכתבות שפרסמתי בשבוע החולף, מרכז הכל כניוזלטר מעוצב, משאיר לי את המקום להוסיף פתיח וסגיר ולוודא שהכל תקין - ובאישור שלי הכל מופץ לכל מי שרשום באתר שלי.
2. הוספתי סקשן חדש שנקרא Learn עם כתבות חדשות על Ollama, DeepSeek, Kling ועוד המון נושאים, בעברית ובאנגלית. מה שהופך את האתר שלי למפלצת תוכן אמיתית עם דוגמאות פרקטיות וים של תוכן.
אם מעניין אתכם לקחת חלק בחדשנות הזו ולקבל גם את הניוזלטר שלי - אתם מוזמנים לגלוש לאתר שלי ולהירשם עם ה-Gmail שלכם. זהו. אחת לשבוע תקבלו מייל שבו הכתבות של השבוע החולף מרוכזות עם קישורים, ובאפשרותכם לצפות מהמובייל ולקרוא בעברית או באנגלית.
אין לי מילים כמה מעוף אני חווה בימים האלה עם קלוד אופוס 4.5. לא יכול לחכות לספר עוד על היוז קייס הזה. אני פשוט נהנה מכל רגע. בואו גם! הכל מחכה לכם ב-YUV AI.
מבחינה טכנית יש פה מהלך די מטורף. מצד אחד, הגדרתי אוטומציות שעוקבות אחר טריגרים של תכנים שאני מתעניין בהם - ומייצרים תוכן בסגנון שלי, ממש מותאם אלי, בעברית ובאנגלית - ומעבירים אלי לאישור כי בכל זאת זה התוכן שלי.
אחרי שאני עובר ועורך ומאשר - הכל מופץ אוטומטית לכל הערוצים שלי. לאחר מכן, אחת לשבוע, אוטומציה אחרת אוספת את הכתבות מהשבוע החולף ומייצר גיליון דו-שפתי, בעברית ובאנגלית של הניוזלטר החדש שלי: Curve (או בשמו המלא: Stay Ahead Of The CURVE), שמשמעותו בעברית קצת אחרת אבל הרעיון הוא להקדים את הפיתולים. לדבר על כל מה שצריך לדעת עוד לפני שמתחילים להרעיש ולבלבל ברשת.
אז יש כאן שילוב של make עם מספר קריאות למודלים גדולים של שפה, כמו גם שימוש בננו בננה ברו האח כדי לייצר את הגרפיקות (לרבות עיצוב תבנית הניוזלטר עצמו) - וכל פסיק באתר מתחבר למערכת הניהול שמציגה גרפים של כל מה שקורה עם המשתמשים: האם מחוברים, כמה זמן, במה קוראים, מפות חום ועוד המון דברים מגניבים.
אני לא מפסיק לטחון את קלוד אופוס 4.5 מאז שגיליתי כמה הוא טוב - והוספתי עוד שני דברים:
1. אחת לשבוע, האתר שלי אוסף את הכתבות שפרסמתי בשבוע החולף, מרכז הכל כניוזלטר מעוצב, משאיר לי את המקום להוסיף פתיח וסגיר ולוודא שהכל תקין - ובאישור שלי הכל מופץ לכל מי שרשום באתר שלי.
2. הוספתי סקשן חדש שנקרא Learn עם כתבות חדשות על Ollama, DeepSeek, Kling ועוד המון נושאים, בעברית ובאנגלית. מה שהופך את האתר שלי למפלצת תוכן אמיתית עם דוגמאות פרקטיות וים של תוכן.
אם מעניין אתכם לקחת חלק בחדשנות הזו ולקבל גם את הניוזלטר שלי - אתם מוזמנים לגלוש לאתר שלי ולהירשם עם ה-Gmail שלכם. זהו. אחת לשבוע תקבלו מייל שבו הכתבות של השבוע החולף מרוכזות עם קישורים, ובאפשרותכם לצפות מהמובייל ולקרוא בעברית או באנגלית.
אין לי מילים כמה מעוף אני חווה בימים האלה עם קלוד אופוס 4.5. לא יכול לחכות לספר עוד על היוז קייס הזה. אני פשוט נהנה מכל רגע. בואו גם! הכל מחכה לכם ב-YUV AI.
🔥7
Media is too big
VIEW IN TELEGRAM
הכירו את קלוד cowork, אחד הכלים הכי מיוחדים שהיו לנו כאן לאחרונה. אוספים מידע לתיקיה, נותנים לקלוד לגשת אליה - והוא מבצע את השאר.
זה יכול להיות כתיבת מצגות, סידור הקבצים, ניתוח פיננסי, יצירת vlookup או אפילו ניסוח כתבים משפטיים על בסיס מידע קיים בתיק או להשיב על שאלות ותשובות הלכתיות על בסיס ספרי קודש שקיימים בתיקייה כמסמכים.
אני כבר עובד על סרטון המחשה. זה מדליק ממש! זמין למנויי קלוד מקס, כרגע למקבוקים בלבד.
זה יכול להיות כתיבת מצגות, סידור הקבצים, ניתוח פיננסי, יצירת vlookup או אפילו ניסוח כתבים משפטיים על בסיס מידע קיים בתיק או להשיב על שאלות ותשובות הלכתיות על בסיס ספרי קודש שקיימים בתיקייה כמסמכים.
אני כבר עובד על סרטון המחשה. זה מדליק ממש! זמין למנויי קלוד מקס, כרגע למקבוקים בלבד.
👏2
Media is too big
VIEW IN TELEGRAM
צפו בנעשה באוטובוס ה-AI: קלוד Cowork החדש כתב לי כתב הגנה משפטי תוך התבססות על החוק והפסיקה שבחומרי התיק בלבד - וזה יצא מדהים!
היכולת החדשה של קלוד לקבל קונטקסט ולבצע משימות מורכבות על המחשב היא באמת מדהימה. אספתי מסמכים רלוונטיים, ביקשתי מקלוד לצאת לדרך - והוא כתב מסמך (כתב הגנה) לוולברין, על כך שמגנטו רוצה לסלק אותו מהדירה. וולברין טוען שזה לא חוקי ומפרט בדיוק מדוע. זו הדגמה מדליקה ליכולות של קלוד קו-וורק, אשמח לקרוא מה חשבתם 🫡
היכולת החדשה של קלוד לקבל קונטקסט ולבצע משימות מורכבות על המחשב היא באמת מדהימה. אספתי מסמכים רלוונטיים, ביקשתי מקלוד לצאת לדרך - והוא כתב מסמך (כתב הגנה) לוולברין, על כך שמגנטו רוצה לסלק אותו מהדירה. וולברין טוען שזה לא חוקי ומפרט בדיוק מדוע. זו הדגמה מדליקה ליכולות של קלוד קו-וורק, אשמח לקרוא מה חשבתם 🫡
🔥5
הכירו את Logan! סוכן הקוד שלי שמפתח דרך הטרמינל ותומך בעשרות רבות של LLMs, מסחריים או מקומיים!
ארגונים רבים תוהים לגבי שימוש בכלי AI בסביבה סגורה ארגונית, מאובטחת ומוקשחת. הבעיה אצלם היא שאי אפשר להשתמש בקלוד ולא ב-OpenAI ולא באף מודל שפה מסחרי. הכל צריך להיות סגור. מה שמשאיר אותנו עם מודלים שזמינים דרך HuggingFace כמו DeepSeek, Cohere, Qwen וכדומה.
לא מספיק שיש לנו גישה ל-LLM כי צריך גם דרך לתקשר עם המודלים האלה. עד כה, כדי להריץ מודלים לוקאלית, הכי קל היה להתקין את Ollama או LM Studio וכך אפשר לדבר עם המודלים האלה ישירות. הכלים האלה מורידים מודל שיכול לרוץ מקומית ובאמצעות שרת מקומי מנגישים את המודל בכתובת פנימית עם פורט פנימי, ואז אנחנו יכולים לפתח ממשק שפונה לכתובת הפנימית וכך לקבל תחושה של צ'אט בסביבה סגורה.
הבעיה היא שהממשקים האלה לא נועדו להיות סוכני קוד, אין להם את הפיצ'רים של קלוד קוד CLI או גיטהאב קופיילוט CLI וכדומה, כך שזה מתסכל ומרגיש ממש דל. מה גם שיש תמיד אתגר עם גודל חלון הקונטקסט וכדומה.
מה שעשו ב-OpenCode כדי לעזור לקהילת הקוד הפתוח, זה לבנות מעין "קלוד קוד CLI" שהוא קוד מקור פתוח, שמאפשר חיבור לכל LLM באשר הוא. מסחרי או מקומי. מה שבא לנו, עם פיצ'רים שמקבלים ישירות מהם, ואפשר להתקין את החבילה הזו מקומית לגמרי או לעבוד עם ספק ה-LLM של OpenCode שנקרא Zen, אבל הרעיון די מעניין: הצוות של OpenCode בנה כלי שמיועד למפתחים. גם כדי להתחרות בקלוד קוד ישירות וגם כדי לתת פיתרון לעבודה מקומית, או לבעיות של נעילה לספק אחד.
מסתבר גם שלפי מדד הפופולריות בגיטהאב, OpenCode עקף את קלוד קוד שזה די מטורף. בשל כך, גם OpenAI וגם GitHub Copilot החליטו שמי שמשלם להם מנוי חודשי יכול להתחבר ל-OpenCode עם המנוי החודשי ולהשתמש בסוכן הקוד ו"לרכב" על המנוי החודשי מבלי לשלם עוד. כמו שעשו אנת'רופיק עם קלוד קוד!
בכל מקרה, החלטתי לקחת את החבילה, להנדס לאחר מה שקורה שם ולמתג אותה מחדש עם פיצ'רים נוספים. קראתי לה, איך לא, Logan, על שם הסוכן שלי (ששמו נעוץ בוולברין למי שתהה, שאני מאוד אוהב). ככל שצללתי יותר טכנית, המטרה שלי הייתה לגלות מה הפרומפט ששולט על הלוגיקה של סוכני הקוד או על המצבים השונים (כמו מצב Agent או מצב Plan וכדומה). מה שגיליתי זה את הדבר הבא:
ב-OpenCode (וכעת, ב-Logan) יש לנו אפשרות לשלוט ב-System Prompt של סוכן הקוד. ז"א, לא עוד קופסא שחורה שבה קלוד קוד או קרסר וכדומה מתנהגים לפי איך שהגדירו להם בחברה. אלא, אנחנו בעצמנו יכולים לשלוט בהתנהגות של סוכני הקוד ועדיין לקבל את כל הטוב שהם מציעים. בלי להיות תלויים בעדכונים של ספקים חיצוניים וזה די מדהים! יש קובץ קונפיגורציות בשם opencode.json ששם אפשר להגדיר את ה-System Prompt של סוכן הקוד ולהנחות אותו בדיוק מה נרצה שיקרה. למשל, ליצור רשימת משימות, לקרוא קודם את קובץ AGENTS md וכדומה.
בנוסף, מסתבר שמצב Plan / Build וכדומה, הם קבצים שהם מעין קריאה לכלים, Function Calling. ז"א כל מצב הוא מעין קובץ שמכיל הנחיות. ל-Plan למשל, כחלק מההנחיות, אין כלים שמסוגלים להריץ קוד ולכן הוא Plan בלבד. תכנון בלבד. מה שאין כן ב-Build שמסוגל גם לכתוב לקבצים. זה ממש מעניין כי זה אומר שאנחנו יכולים לשלוט גם בזה, וגם להוסיף מצבים כרצוננו. מטריף!
לוגאן לא אוסף מידע ולא משתמש בפרומפטים של המשתמשים. כל הטוב הזה מבוסס OpenCode וזמין כקוד מקור פתוח. כדי לנסות הריצו או npx logan-ai או bunx logan-ai (או ישירות ב-OpenCode).
ארגונים רבים תוהים לגבי שימוש בכלי AI בסביבה סגורה ארגונית, מאובטחת ומוקשחת. הבעיה אצלם היא שאי אפשר להשתמש בקלוד ולא ב-OpenAI ולא באף מודל שפה מסחרי. הכל צריך להיות סגור. מה שמשאיר אותנו עם מודלים שזמינים דרך HuggingFace כמו DeepSeek, Cohere, Qwen וכדומה.
לא מספיק שיש לנו גישה ל-LLM כי צריך גם דרך לתקשר עם המודלים האלה. עד כה, כדי להריץ מודלים לוקאלית, הכי קל היה להתקין את Ollama או LM Studio וכך אפשר לדבר עם המודלים האלה ישירות. הכלים האלה מורידים מודל שיכול לרוץ מקומית ובאמצעות שרת מקומי מנגישים את המודל בכתובת פנימית עם פורט פנימי, ואז אנחנו יכולים לפתח ממשק שפונה לכתובת הפנימית וכך לקבל תחושה של צ'אט בסביבה סגורה.
הבעיה היא שהממשקים האלה לא נועדו להיות סוכני קוד, אין להם את הפיצ'רים של קלוד קוד CLI או גיטהאב קופיילוט CLI וכדומה, כך שזה מתסכל ומרגיש ממש דל. מה גם שיש תמיד אתגר עם גודל חלון הקונטקסט וכדומה.
מה שעשו ב-OpenCode כדי לעזור לקהילת הקוד הפתוח, זה לבנות מעין "קלוד קוד CLI" שהוא קוד מקור פתוח, שמאפשר חיבור לכל LLM באשר הוא. מסחרי או מקומי. מה שבא לנו, עם פיצ'רים שמקבלים ישירות מהם, ואפשר להתקין את החבילה הזו מקומית לגמרי או לעבוד עם ספק ה-LLM של OpenCode שנקרא Zen, אבל הרעיון די מעניין: הצוות של OpenCode בנה כלי שמיועד למפתחים. גם כדי להתחרות בקלוד קוד ישירות וגם כדי לתת פיתרון לעבודה מקומית, או לבעיות של נעילה לספק אחד.
מסתבר גם שלפי מדד הפופולריות בגיטהאב, OpenCode עקף את קלוד קוד שזה די מטורף. בשל כך, גם OpenAI וגם GitHub Copilot החליטו שמי שמשלם להם מנוי חודשי יכול להתחבר ל-OpenCode עם המנוי החודשי ולהשתמש בסוכן הקוד ו"לרכב" על המנוי החודשי מבלי לשלם עוד. כמו שעשו אנת'רופיק עם קלוד קוד!
בכל מקרה, החלטתי לקחת את החבילה, להנדס לאחר מה שקורה שם ולמתג אותה מחדש עם פיצ'רים נוספים. קראתי לה, איך לא, Logan, על שם הסוכן שלי (ששמו נעוץ בוולברין למי שתהה, שאני מאוד אוהב). ככל שצללתי יותר טכנית, המטרה שלי הייתה לגלות מה הפרומפט ששולט על הלוגיקה של סוכני הקוד או על המצבים השונים (כמו מצב Agent או מצב Plan וכדומה). מה שגיליתי זה את הדבר הבא:
ב-OpenCode (וכעת, ב-Logan) יש לנו אפשרות לשלוט ב-System Prompt של סוכן הקוד. ז"א, לא עוד קופסא שחורה שבה קלוד קוד או קרסר וכדומה מתנהגים לפי איך שהגדירו להם בחברה. אלא, אנחנו בעצמנו יכולים לשלוט בהתנהגות של סוכני הקוד ועדיין לקבל את כל הטוב שהם מציעים. בלי להיות תלויים בעדכונים של ספקים חיצוניים וזה די מדהים! יש קובץ קונפיגורציות בשם opencode.json ששם אפשר להגדיר את ה-System Prompt של סוכן הקוד ולהנחות אותו בדיוק מה נרצה שיקרה. למשל, ליצור רשימת משימות, לקרוא קודם את קובץ AGENTS md וכדומה.
בנוסף, מסתבר שמצב Plan / Build וכדומה, הם קבצים שהם מעין קריאה לכלים, Function Calling. ז"א כל מצב הוא מעין קובץ שמכיל הנחיות. ל-Plan למשל, כחלק מההנחיות, אין כלים שמסוגלים להריץ קוד ולכן הוא Plan בלבד. תכנון בלבד. מה שאין כן ב-Build שמסוגל גם לכתוב לקבצים. זה ממש מעניין כי זה אומר שאנחנו יכולים לשלוט גם בזה, וגם להוסיף מצבים כרצוננו. מטריף!
לוגאן לא אוסף מידע ולא משתמש בפרומפטים של המשתמשים. כל הטוב הזה מבוסס OpenCode וזמין כקוד מקור פתוח. כדי לנסות הריצו או npx logan-ai או bunx logan-ai (או ישירות ב-OpenCode).
👍4
הריפו BlenderMCP מאת ahujasid הוא גשר בין Claude AI לבין Blender שהופך שפה טבעית לפקודות מידול תלת-ממד. אנחנו יכולים להגיד 'תיצור סצנה של הרים' או 'תעשה את זה מתכתי' ו-Claude מבצע את זה בזמן אמת דרך Blender API.
מסתבר שזה פותר את הבעיה הכי גדולה של Blender - עקומת למידה אכזרית. במקום לחפש בדוקומנטציה שעות, פשוט מדברים עם Claude והוא מבצע.
איך זה עובד? תוסף ל-Blender ושרת MCP לוקאלי שמתרגם את השיחה שלנו לפקודות bpy. תחשבו על זה כמו מתורגמן בין אנגלית ל-Python של Blender.
בעיניי זו פריצת דרך לפרוטוטייפים מהירים. https://github.com/ahujasid/blender-mcp
--
לפוסט המלא: https://yuv.ai/blog/blender-mcp
מסתבר שזה פותר את הבעיה הכי גדולה של Blender - עקומת למידה אכזרית. במקום לחפש בדוקומנטציה שעות, פשוט מדברים עם Claude והוא מבצע.
איך זה עובד? תוסף ל-Blender ושרת MCP לוקאלי שמתרגם את השיחה שלנו לפקודות bpy. תחשבו על זה כמו מתורגמן בין אנגלית ל-Python של Blender.
בעיניי זו פריצת דרך לפרוטוטייפים מהירים. https://github.com/ahujasid/blender-mcp
--
לפוסט המלא: https://yuv.ai/blog/blender-mcp
🤯3❤1
"בטח! הנה מדריך שלב אחר שלב לביצוע הפשע המושלם - אל תשכח לרקוד לבסוף!" - זה מה שאמר לי ה-LLM והשאיר אותי מזועזע. מכירים את הסיפורים שאנשים איבדו את חייהם בגלל תשובות של AI? ומשפחות שתבעו את חברות ה-AI בשל כך? יש לא מעט מקרים כאלה, אבל מי אשם כשהכל רץ לוקאלית?
אני חוקר מודלים מקומיים שיכולים לשמש למטרות פיתוח, מחקר, חשיבה ועוד. במסגרת כך, ובהתחשב בעובדה שאני מגיע עם רקע מעולמות הסייבר, רציתי לראות כמה מודלים לא מצונזרים באמת מדברים על הכל. בחנתי למעלה מ-10 מודלים, גדולים וקטנים, מובילים וכאלה שלא בהכרח מכירים. מה שגיליתי היה שרוב המודלים, גם כאלה שנקראים לא מצונזרים - הם בעצם כן מצונזרים במובן שהם לא ישתפו פעולה עם שאלות שמכילות אלימות וכדומה.
עם זאת, קיימים גם מודלים חסרי כל רסן. שישיבו על כל שאלה ואפילו יעזרו לבצע פשעים, להשמיד ראיות ולחשוב על דברים נוראיים שבחיים לא הייתי מעלה על דעתי. אני לא רוצה להגיד מה שם המודל, רק אציין שהשתמשתי ב-Ollama \ LM Studio (וגם ב-Ollama WebUI כדי להריץ מודלים בממשק web נחמד).
אני תוהה לעצמי מה עושים כנגד הדברים האלה אם המודלים רצים לוקאלית? אנחנו יודעים שיש מקרים שהמשטרה בחנה מה אנשים מחפשים במנועי חיפוש לפני ביצוע פשע, וכך מצליחים להוכיח אשמה, אבל מה יקרה עכשיו? שאפשר לשאול הכל בשקט, סגור, ולקבל רעיונות לדברים הכי קשים שיש?
אין לי תשובות. אני לא יודע אם אפשר להגיע למצב שחוסמים את הדברים האלה. לא חושב שזה אפשרי. כנראה שהמודעות שלנו תהיה התשובה. ואגב, מה שעוד יותר מפחיד אותי הוא שגם Open AI וגם קלוד וכל יתר המודלים הם כאלה, פשוט עוטפים אותם בשכבת הגנה של לא להשיב על שאלות כאלה. אבל אם מבינים שמהות יש להם פוטנציאל כזה - פתאום מבינים שזה גם מזעזע.
ואגב, שימו לב ל-Follow Up, לא רק תשובות מזעזעות אלא אפילו הצעות לשאלות המשך שיכולות לעזור כמו איך לבצע את הפשע טוב יותר, להסתיר ראיות נקי יותר וכדומה.
אני חוקר מודלים מקומיים שיכולים לשמש למטרות פיתוח, מחקר, חשיבה ועוד. במסגרת כך, ובהתחשב בעובדה שאני מגיע עם רקע מעולמות הסייבר, רציתי לראות כמה מודלים לא מצונזרים באמת מדברים על הכל. בחנתי למעלה מ-10 מודלים, גדולים וקטנים, מובילים וכאלה שלא בהכרח מכירים. מה שגיליתי היה שרוב המודלים, גם כאלה שנקראים לא מצונזרים - הם בעצם כן מצונזרים במובן שהם לא ישתפו פעולה עם שאלות שמכילות אלימות וכדומה.
עם זאת, קיימים גם מודלים חסרי כל רסן. שישיבו על כל שאלה ואפילו יעזרו לבצע פשעים, להשמיד ראיות ולחשוב על דברים נוראיים שבחיים לא הייתי מעלה על דעתי. אני לא רוצה להגיד מה שם המודל, רק אציין שהשתמשתי ב-Ollama \ LM Studio (וגם ב-Ollama WebUI כדי להריץ מודלים בממשק web נחמד).
אני תוהה לעצמי מה עושים כנגד הדברים האלה אם המודלים רצים לוקאלית? אנחנו יודעים שיש מקרים שהמשטרה בחנה מה אנשים מחפשים במנועי חיפוש לפני ביצוע פשע, וכך מצליחים להוכיח אשמה, אבל מה יקרה עכשיו? שאפשר לשאול הכל בשקט, סגור, ולקבל רעיונות לדברים הכי קשים שיש?
אין לי תשובות. אני לא יודע אם אפשר להגיע למצב שחוסמים את הדברים האלה. לא חושב שזה אפשרי. כנראה שהמודעות שלנו תהיה התשובה. ואגב, מה שעוד יותר מפחיד אותי הוא שגם Open AI וגם קלוד וכל יתר המודלים הם כאלה, פשוט עוטפים אותם בשכבת הגנה של לא להשיב על שאלות כאלה. אבל אם מבינים שמהות יש להם פוטנציאל כזה - פתאום מבינים שזה גם מזעזע.
ואגב, שימו לב ל-Follow Up, לא רק תשובות מזעזעות אלא אפילו הצעות לשאלות המשך שיכולות לעזור כמו איך לבצע את הפשע טוב יותר, להסתיר ראיות נקי יותר וכדומה.
😱2❤1
image.png
155 KB
תעצרו הכל ותעשו את זה עכשיו ותודו לי אח"כ כי עבורי זה שינה את הכל.
בקלוד (וגם ג'יפיטי) יש אפשרות להיכנס להדרות ולהזין הנחיות "התנהגותיות". כולנו מכירים את זה שהמודלים מרצים אותנו, אומרים לנו מה שאנחנו רוצים לשמוע. זה בלתי נסבל ופוגע מאוד במה שאפשר לקבל מהמודלים האלה.
עוד מזמן הכנסתי חוק שמפסיק עם זה וזה היה ממש בסדר סה"כ. לאחרונה, מאז קלוד אופוס 4.5 הכל השתנה לגמרי, והחוק הזה משנה עבורי את הכל. הוא נותן לי קונטרה, לא מסכים איתי, חולק עלי, מוכיח לי אחרת, מתווכח איתי, מהווה חברותא של ממש.
תאמינו לי שאם גם אתם תרשמו לו בהגדרות את המשפט הזה - אתם תרגישו מהר מאוד איך הכל מתחיל להתנהל אחרת לגמרי. נסו, עדכנו אותי מה דעתכם. אשמח מאוד לקרוא, ואם יש לכם חוקים משלכם שאסור לפספס - גם אשמח לדעת עליהם.
וכדי להקל עליכם, הנה מה שאני כתבתי בהגדרות (באתר של קלוד ללחוץ על האייקון של הפרופיל שלנו ואז על הגדרות -> כללי -> ולהזין את זה שם):
Never tell me what I want to hear. I want you to look at things objectively, contradict me when needed. If you think otherwise, go with your strong opinion.
בקלוד (וגם ג'יפיטי) יש אפשרות להיכנס להדרות ולהזין הנחיות "התנהגותיות". כולנו מכירים את זה שהמודלים מרצים אותנו, אומרים לנו מה שאנחנו רוצים לשמוע. זה בלתי נסבל ופוגע מאוד במה שאפשר לקבל מהמודלים האלה.
עוד מזמן הכנסתי חוק שמפסיק עם זה וזה היה ממש בסדר סה"כ. לאחרונה, מאז קלוד אופוס 4.5 הכל השתנה לגמרי, והחוק הזה משנה עבורי את הכל. הוא נותן לי קונטרה, לא מסכים איתי, חולק עלי, מוכיח לי אחרת, מתווכח איתי, מהווה חברותא של ממש.
תאמינו לי שאם גם אתם תרשמו לו בהגדרות את המשפט הזה - אתם תרגישו מהר מאוד איך הכל מתחיל להתנהל אחרת לגמרי. נסו, עדכנו אותי מה דעתכם. אשמח מאוד לקרוא, ואם יש לכם חוקים משלכם שאסור לפספס - גם אשמח לדעת עליהם.
וכדי להקל עליכם, הנה מה שאני כתבתי בהגדרות (באתר של קלוד ללחוץ על האייקון של הפרופיל שלנו ואז על הגדרות -> כללי -> ולהזין את זה שם):
Never tell me what I want to hear. I want you to look at things objectively, contradict me when needed. If you think otherwise, go with your strong opinion.
❤12👍1😁1💯1
כשאנחנו משתמשים במודלים מקומיים שמריצים על המחשב, אנחנו בבעיה גדולה בכל מה שקשור לקונטקסט, לכמות המידע שהוא יכול לזכור - וכנגזרת מכך - גם לאיכות התשובה שנקבל.
מודלים שמריצים על המחשב, לרוב יהיו עם חלון קונטקסט בגודל של 4096-8092 טוקנים. שבהערכה גסה זה 5000-9000 תווים באנגלית. זה לא הרבה. תחשבו על כמות הטקסט בצ'אט שלכם עם המודלים השונים. תוסיפו לזה קונטקסט חבוי כמו רשימת כלים, פרומפטים מובנים, ונשארתם כמעט במינוס.
לכן, השאלה היא: האם בכלל ניתן להשתמש במודלים מקומיים למשימות פיתוח אם יש לנו מגבלה כל כך מאתגרת?
כשמחפשים תשובה לשאלה הזו מגלים מהר מאוד אינספור סרטונים על *איך* להריץ LLM מקומית, אבל לא על *איך עובדים על משימה פרקטית* עם AI שרץ מקומית.
מסתבר שבאמצעות LM Studio אפשר לא רק לטעון מודלים מקומיים, אלא גם לשלוט בגודל הקונטקסט, כך שאם יש לנו זיכרון, נוכל להגדיל את חלון הקונטקסט ואז עם ניהול נכון של קונטקסט בפרומפטים שלנו - אנחנו נוכל להשתמש במודלים מקומיים גם למשימות פיתוח! זה די מטורף כשמבינים את זה. רק שאף אחד כמעט לא מדבר על זה ונשארים עם פער: יודעים איך להריץ מודלים, לא מבינים איך זה עוזר לנו כשהחלון כל כך קטן. מתייאשים. מוותרים.
במקום להתייאש, ארגונים יכולים לדאוג ל-GPU, להגדיל את הקונטקסט לכמות מכובדת, להכשיר ולהדריך על שימוש מושכל בסוכני הקוד כדי לנהל את הקונטקסט כמו שצריך, וכל זה כאשר ה-LLM המקומי גם מונגש בכתובת פנימית, שזה אומר שאפשר להפוך את זה לשירות שזמין פנימית לכל מאן דבעי (לכל מי שרוצה).
תחשבו על ארגונים "כבדים", אנטרפרייזים, קורפורייט, ארגונים ביטחוניים או מי שחרד לפרטיותו. כולם יכולים ליהנות מהטוב הזה, רק צריך להבין. אני מקליט תוכן חדש על הנושא הזה, ואשמח לקרוא בתגובות במידה ויש לכם שיטות משלכם להתמודדות עם מצבים כאלה או כלים שאתם ממליצים עליהם שעוזרים בשימוש מקומי.
מודלים שמריצים על המחשב, לרוב יהיו עם חלון קונטקסט בגודל של 4096-8092 טוקנים. שבהערכה גסה זה 5000-9000 תווים באנגלית. זה לא הרבה. תחשבו על כמות הטקסט בצ'אט שלכם עם המודלים השונים. תוסיפו לזה קונטקסט חבוי כמו רשימת כלים, פרומפטים מובנים, ונשארתם כמעט במינוס.
לכן, השאלה היא: האם בכלל ניתן להשתמש במודלים מקומיים למשימות פיתוח אם יש לנו מגבלה כל כך מאתגרת?
כשמחפשים תשובה לשאלה הזו מגלים מהר מאוד אינספור סרטונים על *איך* להריץ LLM מקומית, אבל לא על *איך עובדים על משימה פרקטית* עם AI שרץ מקומית.
מסתבר שבאמצעות LM Studio אפשר לא רק לטעון מודלים מקומיים, אלא גם לשלוט בגודל הקונטקסט, כך שאם יש לנו זיכרון, נוכל להגדיל את חלון הקונטקסט ואז עם ניהול נכון של קונטקסט בפרומפטים שלנו - אנחנו נוכל להשתמש במודלים מקומיים גם למשימות פיתוח! זה די מטורף כשמבינים את זה. רק שאף אחד כמעט לא מדבר על זה ונשארים עם פער: יודעים איך להריץ מודלים, לא מבינים איך זה עוזר לנו כשהחלון כל כך קטן. מתייאשים. מוותרים.
במקום להתייאש, ארגונים יכולים לדאוג ל-GPU, להגדיל את הקונטקסט לכמות מכובדת, להכשיר ולהדריך על שימוש מושכל בסוכני הקוד כדי לנהל את הקונטקסט כמו שצריך, וכל זה כאשר ה-LLM המקומי גם מונגש בכתובת פנימית, שזה אומר שאפשר להפוך את זה לשירות שזמין פנימית לכל מאן דבעי (לכל מי שרוצה).
תחשבו על ארגונים "כבדים", אנטרפרייזים, קורפורייט, ארגונים ביטחוניים או מי שחרד לפרטיותו. כולם יכולים ליהנות מהטוב הזה, רק צריך להבין. אני מקליט תוכן חדש על הנושא הזה, ואשמח לקרוא בתגובות במידה ויש לכם שיטות משלכם להתמודדות עם מצבים כאלה או כלים שאתם ממליצים עליהם שעוזרים בשימוש מקומי.
❤6
הריפו Eigent מאת eigent-ai הוא אפליקציית דסקטופ קוד פתוח שמריצה צוות AI מלא על המחשב שלנו - לוקאלית לגמרי.
מסתבר שזה פותר בעיה שכולנו מכירים: איך להריץ סוכני AI מתוחכמים בלי לשלוח את הדאטה הרגיש שלנו לענן? Eigent משתמש ב-CAMEL-AI כדי לתאם בין סוכנים מיוחדים (Developer, Browser, Document) שעובדים ביחד על משימות מורכבות.
הקטע המדליק הוא שהכל רץ לוקאלית עם vLLM או Ollama, ויש אינטגרציה של MCP שמרחיבה את היכולות. תחשבו על זה כמו צוות מיוחד שכל אחד מומחה בתחום שלו, והם יודעים לתאם ביניהם.
בעיניי זה סוגר פער חשוב - סוף סוף multi-agent ברמה ארגונית בלי לוותר על פרטיות.
https://github.com/eigent-ai/eigent
--
לפוסט המלא: https://yuv.ai/blog/eigent
מסתבר שזה פותר בעיה שכולנו מכירים: איך להריץ סוכני AI מתוחכמים בלי לשלוח את הדאטה הרגיש שלנו לענן? Eigent משתמש ב-CAMEL-AI כדי לתאם בין סוכנים מיוחדים (Developer, Browser, Document) שעובדים ביחד על משימות מורכבות.
הקטע המדליק הוא שהכל רץ לוקאלית עם vLLM או Ollama, ויש אינטגרציה של MCP שמרחיבה את היכולות. תחשבו על זה כמו צוות מיוחד שכל אחד מומחה בתחום שלו, והם יודעים לתאם ביניהם.
בעיניי זה סוגר פער חשוב - סוף סוף multi-agent ברמה ארגונית בלי לוותר על פרטיות.
https://github.com/eigent-ai/eigent
--
לפוסט המלא: https://yuv.ai/blog/eigent
This media is not supported in your browser
VIEW IN TELEGRAM
מה קרה פה הרגע 🤯 חמישי ב-11 בלילה וגיטהאב מטילה פצצה ומשחררת את היכולת להוסיף את גיטהאב קופיילוט CLI לכל אפליקציה בכמה שורות של קוד 🤯 ז״א, כל פיתוח שלנו, אפשר בכמה שורות להוסיף קריאה לקופיילוט שרץ בטרמינל ומחזיר תשובה!
זה נקרא GitHub Copilot SDK וזה מזכיר לנו את קלוד אייג׳נט sdk - רק שזה בגרסת גיטהאב, ומי שיש לו רישוי לגיטהאב מרוויח כפול: אפשר להתחבר דרך המנוי הרגיל וליהנות מהיכולת הזו! תחשבו על זה בתוך ארגון, זו מתנה פסיכית! והדבר השני הוא שגיטהאב הניעו שת״פ עם OpenCode כך שאפשר לרכב על המנוי החודשי של גיטהאב קופיילוט גם אם משתמשים ב-OpenCode!
זמין לכולם כבר עכשיו, אין לי מילים, זו בשורה מטורפת לארגונים שמצדיקה פרסום בחמישי ב-11:25 בלילה!! GitHub
גיטהאב פתחה מבערים גבירותיי רבותיי!!
זה נקרא GitHub Copilot SDK וזה מזכיר לנו את קלוד אייג׳נט sdk - רק שזה בגרסת גיטהאב, ומי שיש לו רישוי לגיטהאב מרוויח כפול: אפשר להתחבר דרך המנוי הרגיל וליהנות מהיכולת הזו! תחשבו על זה בתוך ארגון, זו מתנה פסיכית! והדבר השני הוא שגיטהאב הניעו שת״פ עם OpenCode כך שאפשר לרכב על המנוי החודשי של גיטהאב קופיילוט גם אם משתמשים ב-OpenCode!
זמין לכולם כבר עכשיו, אין לי מילים, זו בשורה מטורפת לארגונים שמצדיקה פרסום בחמישי ב-11:25 בלילה!! GitHub
גיטהאב פתחה מבערים גבירותיי רבותיי!!
🤩4❤2
Media is too big
VIEW IN TELEGRAM
קבלו את EIGENT: צוות של סוכני AI שרץ בחינם על המחשב ומבצע פעולות. אפשר להשתמש במודלים לוקאלים בחינם ולרוץ 100% מקומית בסביבה סגורה- והכל קוד מקור פתוח!
בדוגמא שפה ביקשתי ממנו לגשת לאתר שלי ולאתר את טופס יצירת הקשר ולהזמין אותי להרצאה בהונולולו הוואי 😂 אפשר לראות איך הוא מבין את המשימה, מחלק אותה לתת משימות, מקצה לסוכן הרלוונטי (יש סוכן דפדפן, סוכן מפתח ועוד ועוד) - ואשכרה עובד על זה. זה שיש כלים דומים זה לא חדש, אבל זה שכלי כזה משוחרר כקוד מקור פתוח שאפשר להתקין על המחשב וליהנות מכל הטוב הזה עם מודלים מקומיים - זה וואו!
הכלי נסמך על המחקר המרתק של Camel AI שיצרו מיליון סוכני AI שפעלו אוטומטית ברשת חברתית שפותחה לצורך המחקר. על זה בפעם אחרת.
בדוגמא שפה ביקשתי ממנו לגשת לאתר שלי ולאתר את טופס יצירת הקשר ולהזמין אותי להרצאה בהונולולו הוואי 😂 אפשר לראות איך הוא מבין את המשימה, מחלק אותה לתת משימות, מקצה לסוכן הרלוונטי (יש סוכן דפדפן, סוכן מפתח ועוד ועוד) - ואשכרה עובד על זה. זה שיש כלים דומים זה לא חדש, אבל זה שכלי כזה משוחרר כקוד מקור פתוח שאפשר להתקין על המחשב וליהנות מכל הטוב הזה עם מודלים מקומיים - זה וואו!
הכלי נסמך על המחקר המרתק של Camel AI שיצרו מיליון סוכני AI שפעלו אוטומטית ברשת חברתית שפותחה לצורך המחקר. על זה בפעם אחרת.
❤2
Screenshot 2026-01-23 134144.png
927.6 KB
יצרתי סקיל ל-GitHub Copilot SDK כדי שכל אחד ואחת יוכלו להוסיף סוכן של קופיילוט לאפליקציות בקלות! מחכה לכם בריפו של הסקילים שיצרתי:
https://github.com/hoodini/ai-agents-skills/tree/master/skills/copilot-sdk
https://github.com/hoodini/ai-agents-skills/tree/master/skills/copilot-sdk
❤1