אין ספק, העתיד שייך לעצלנים, הסוכנים יעשו בשבילם הכל.
זו המסקנה אליה הגעתי אחרי שביליתי במחיצתם של הסוכנים זמן ממושך
אחרי כך הלכתי לכתוב את אחד מאחרוני המאמרים שעוד ייכתבו על ידי בן אנוש
אבל, לפני שנדבר על איך בונים סוכן ומה זה בכלל, נחזור לרגע לימי הגולם מפראג,
כרגע, הוא בתפקיד הסוכן שתפקידו לשטוף כלים.
יש 3 דברים שהוא חייב בשביל לעבוד:
1. צורת תקשורת שלנו איתו- הוא לא יכול להיות חרש או אילם
2. הגדרת תפקיד- שלא ילך לדוג בנהר במקום לשטוף כלים
3. כלים לפעולה- פיירי. ידיים וכלים מלוכלכים. אה, וגם מים.
ולמה זה חשוב עוד לפני שהתחלנו בכלל? משום שהפלטפורמות של הסוכנים שונות ומגוונות.
אבל הבסיס המשולש הזה חייב להמצא בכל סוכן שאנחנו בונים:
1. ROLE- נגדיר לו לשם מה ירדה נשמתו לעולם
2. ממשק- נחבר אותו לפלטפורמה שדרכה נוכל לשלוח לו הוראות ולקבל ממנו תשובות.
3. TOOLS- ניתן לו כלים לפעולה.
אנחנו נסקור כאן 2.5 אופציות של הענין. בתקווה שעד שהמאמר יתפרסם לא נתבשר על השתלטות עוינת של סוכנים על הגלובוס.
סוכן AI במייק
החויה שלי:
אחרי שבניתי לעצמי בוט אישי שהוא עבד נרצע. שולח אימיילים למי שארצה. (כן, אם קיבלתם ממני השבוע אימיילים ב3 לפנות בוקר זה היה "הוא", לא הצלחתי להתאפק)
מה עוד? הוא מברר לי על אירועים קרובים ובודק לי מה שארצה בגוגל. הוא גם מנפיק חשבוניות וקבלות ובאופן כללי מסתובב בעולם ועושה למעני הכל.
אני אישית מתקשרת איתו בסלאק כי זו פלטפורמה שפתוחה בכל החסימות. אבל הוא, נחמד שכמוהו, מוכן לדבר איתי דרך הוואצאפ, הטלגרם מסנג'ר.וכל פלטפורמה אחרת.
זה מרגיש כמו בימי הביניים עם האציל והצמית. "שאל את חיים לוי למה הוא לא שלח עדיין את הקבלה"
אחרי דקה- "שלחתי לחיים את המייל, שאלתי אותו מה עם הקבלה. אפשר לעזור בעוד משהו?"
הכיף שבסוכן של מייק זה נוחות השימוש והבנייה, קלות בדיקת לוגים ודיבוג.
שנתחיל?
כנסו למייק, ואם אין לכם עדיין חשבון ,זה הזמן לפתוח כאן
המבנה:
סינריו ראשי במייק שהוא הסוכן הראשי והוא מפעיל לפי רצונו כלים- כאן הכלים הם תהליכים מתאימים במייק. כלומר כל סוכן מופקד על תתי תהליכים.
למשל: סוכן שאחראי על ניהול מלאי יקבל כלים כאילו: תהליך של בדיקת מלאי בדאטה בייס. תהליך של שליחת אימיילים. תהליך של הזמנות. וכל מה שצריך, בשביל שתוכל לזרוק לו פקודה כזו; "תבדוק מה המצב על המעילים הירוקים מידה 9. ואם המלאי נמוך הזמן עוד 50 מעילים"
אחרי שתי שניות- זה קרה.
ההגדרות:
סינריו ראשי-
יורכב מ:
טריגר- ההודעה שהסוכן קיבל דרך הפלטפורמה שאנחנו מתקשרים איתו: וואצאפ. טלגרם. פייסבוק או בוט באתר
סוכן- MAKE AI AGENT . אפשר לחבר אותו לכל מודול של LLM שתבחרו- ג'מיני, קלוד, גרוק וכמובן OPEN AI.
נגדיר לו תפקיד. וכלים שאיתם הוא ישתמש (להלן: TOOLS)
מודול פלט- דרכו הסוכן ישלח לכם הודעה שהענין סודר
TOOLS: תת סינריו
אילו הכלים שאיתם הסוכן פועל. הידיים של הסוכן שלנו הם הזרועות שהוא שולח לתהליכים שבנינו וקישרנו אליו
הסינריו'ס הללו יהיו קצרים וברורים וימלאו תפקיד אחד בלבד.
יורכב מ:
- טריגר שהוא הכלי הפועל- למשל: מודול SEARCH EVENTS- שתפקידו הוא חיפוש אירועים ביומן גוגל.
- ולאחר מכן מודול של RETURN OUTPUT שתפקידו להחזיר את התוצאה לסוכן הראשי. במקרה זה: האירועים שהוא מצא
- בנוסף נגדיר לכל תת סינריו אינפוט ואאוטפוט. אילו פיצ'רים חדשים שנוצרו בשביל הסוכנים ונמצאים בסרגל הכלים למטה,
התפקיד שלהם סופר קריטי- - לתת סוכן את המידע שהוא צריך בשביל לפעול. ולהוציא ממנו מידע הלאה
בלי הגדרה מדויקת של אינפוט ואאוטפוט התת סוכן ייתקע עם המון רצון לפעול אבל בלי יכולת לבצע זאת.
זהו. הכל מוכן. תוכלו לשלוח לנו אימייל עם הסוכן שהנס קרה (רק בבקשה, לא ב3 בלילה)
סוכן OPEN AI:
החויה שלי:
מפגש עם יצירת אסיסטנט בפלטפורמת OPEN AI הוא חויה משגעת .המשחק עם כל האפשרויות הוא אינסופי.
הוא יוכל לדבר עם הלקוח, לברר בשבילו דברים ולבצע בשבילו כל פעולה. כן, כל פעולה.
המבנה:
פלטפורת OPENAI ליצירת סוכנים תציג לנו באפשרות יצירת הסוכן את כל הטוב הזה:
1. נתינת שם לסוכן, והגדרת תפקידו.
כלומר- מה אנחנו רוצים שהוא יעשה (לצד זה , נגדיר לו מה לא לעשות אחרת יווצרו מצבים פחות נעימים)
כאן:
2. בחירת המודל הרצוי לנו. לפי הייעוד שאנו מקדישים לבוט.
מומלץ לבחור ב־GPT-4.1 – הדגם החדש ביותר של OpenAI, עם הבנה משופרת של הקשר ויכולות מעקב אחר הוראות מדויקות יותר
3. TOOLS
זו המנה העיקרית של הסוכן. כלומר זכותנו להתעלם מהטולס, לסגור את הסוכן אחרי הגדרתו ולשלח אותו לייבש בשבילנו את האוקיינוס.
מה שנעשה במקרה כזה- זה לחבר אותו במייק למודול של Message an assistant - וברגע שנבחר את האסיסטנט שיצרנו הוא יפעל בדיוק לפי ההנחיות שקיבל.
אבל- הכלים נותנים לנו שדרוג ענק. שדרכם הסוכן שלנו יהפוך להיות סופרמן.
למה לא לתת לסוכן עוד דרכים להפעיל כלים בעבורינו (הוא כ"כ רוצה, לא תתנו לו?)
1. FILE SEARCH
כאן נעלה לו קבצים שבהם יוכל לחטט ולחפור כדי להתייעל. מה למשל? כל מסמכי תפעול החברה שהבוט הולך לעבוד בה.
מה עוד? דוחות, מאמרים חוזים וטבלאות. נכון לעכשיו תומך בקבצים בסיומת: txt.pdf. csv. docx. md.
החיפוש במסמכים יחסוך לנו טוקנים. משום שהסוכן ייגש למקום הספציפי וישלוף משם את המידע במקום שנצטרך לדחוס את ים המידע הזה בסיסטם פרומפט
מגבלות ידועות זמניות: אין תמיכה בOCR של תמונות. כרגע תומך באופן חלקי במסמכים עם מבנה טבלאי כמו csv. או ג'ייסון. וחובה לאמר שיכולת הסיכום שלו פחותה מזו של המידע שמופיע בסיסטם פרומפט אבל עדיין טובה מספיק.
2. CODE INTERPRETER
מאפשר לו להריץ קוד כדי לנתח נתונים וליצור חישובים מתקדמים . יוצר מיני מחשב בתוך הסוכן.
דגש קטן: לאלרגיים לקוד . אין צורך להבין את הקוד שהוא מריץ. הוא פראייר שיעשה את זה לבד וישלח לכם את התוצאה.
FUNCTIONS
מה שנקרא, יציאה לפעולה (Function calling) הסוכן יוכל לאסוף נתונים כדי לנקוט בפעולה מעשית. כמו שליחת קריאת API, . עדכון רשומת CRM, או הפעלת תהליך במייק
ברגע האמת הסוכן שלנו יבין שהוא צריך לבדוק מלאי. ויפעיל את הפונקציה שמפעילה קריאת HTTP לבדיקת מלאי.
הכיף הגדול הוא שאפשר לג'נרט את הפונקציה בכפתור ג'נרייט למעלה (עצלנים? לכאן. בבקשה)
4. עוד כמה הגדרות:
רמת היצירתיות בתשובות. וצורת הפלט שלו
5. פלייגראונד-
מי ששרד עד כאן יכול ללכת לשחק עם הסוכן. לבחון עד כמה הוא טוב ולשפר את ההגדרות אחרי שתשגעו אותו בפלייגראונד.
כלי AI במייק:
החויה שלי:
לא נסגור את המאמר בלי התייחסות לכלי AI שפועלים במייק בלי סוכן. אלא כמודולים שבאים לשרת ולהוסיף לתהליך.
להחליף את הפילטרים, ההתניות והראוטרים.
למרות שזה נשמע פחות אופנתי. לפעמים נכון להסתפק בכלי AI שישולבו במהלך התהליך וייעלו אותו בלי לערב סוכן.
אז הנה-
סקירה על כמה כלי AI בולטים:
OpenAI (ChatGPT, DALL·E, Whisper)
האח הגדול של הבינה המלאכותית – יודע לדבר, להבין, לצייר, לסכם ולעשות הכל. (תאמינו לי שלא הגזמתי...)יש לו אפשרות של חיבור לסוכנים שלך בOPEN AI. כדי לבצע מטלות באופן הכי ממוקד וספציפי
למשל: אמרנו הכל או לא אמרנו?
AI by Make
המנוע הביתי של מייק – לא רע, רק נטול דרמה. יודע לעשות תיקון שגיאות, תרגום, סיווג, סיכום וניתוח טקסט.למשל: זיהוי של פידבק לקוחות נכנס מכמה ערוצים
המערכת מזהה ומסווגת לפי כוונה ("תלונה", "הצעה", "שבח"), ולפי זה עובר אוטומטית לצוות הרלוונטי. דמיינו כמה לקוחות מתוסכלים זה יחסוך
Google Cloud Vision AI /OPEN AI Analyze
OCR לתמונות. מזהה כל פריט בתמונה לפי הנחיה.
למשל: פענוח חשבוניות שנשלחו בוואצאפ וחילוץ הפרטים מתוכה . שליחת קבלה ללקוח אוטומטית
יש כמובן גם כלי OCR לחילוץ מPDF.
DALL·E / GAMINI / קנבה / לאונרדו
גרפיקה בשירות האוטומציה. נסו אותם קודם כדי לבחור את האפליקציה המועדפת לחלום שלכם.ספוילר: ככל שיעבור הזמן. יש סיכוי שלדמויות שלכם יהיו 5 אצבעות בכל יד.
אבל בשביל זה כדאי פשוט לבדוק ולוודא שאתם מרוצים מהקו הכללי
Whisper (דרך OpenAI)
המתמלל האולטימטיבי. מבין אודיו בכל שפה ומבטא, הופך אותו לטקסט. מדויק, מהיר, וחסר סבלנות לשגיאות דקדוק.למשל: תארו לעצמכם שמנהל הצוות שולח לכם הקלטה קולית
Whisper מתמלל . מסכם את העיקר ושולח דוח יומי למנהל.
פשוט בלי לגעת במקלדת.
TextCortex
כל מה שקשור לטקסט: תרגום. סיכום וניסוח מחדש. אני ניסיתי אותו כקופי לכתיבה שיווקית. ניסוח מיילים, חידוד פוסטים. היה מעולה!למשל: גמרנו עם הניסוחים המשעבדים (כך כותבים את זה? אולי משאבדים, אהממ...)
פשוט מחברים ל-TextCortex
מקבלים תוכן שנשמע כאילו כתבתם אותו אחרי 3 קפה חזק ושיחת מוטיבציה.
אי אפשר בלי מילה על עדן AI. האפליקציה האינסופית:
הצצה קצרה לEDEN AI תגלה אינספור אופציות כל מה שיש לכל כלי הAI להציע תחת קורת גג אחת
בפעם האחרונה שספרתי היו בו 70! כלים.
הקבלה של EDEN AI למתווך דירות תהיה נכונה:
עדן מתווך לנו את כל הדירות בעיר; עם או בלי מרפסת וכל אופציות החדרים, אפילו וילות.
אבל- חשוב לזכור שהדירות לא שלו;
הוא סה"כ מאגד לנו כלים מפלטפורמות אחרות.
זהו, הכלים שטופים. אפשר ללכת להכין קפה
הנושאים החמים