נראה לי שהגיע הזמן לעשות קצת סדר במהומה שנוצרה פה עם ההשקות הנרגשות של Open-AI עבור כל מודול חדש שיוצא.
האמת? באיזשהו שלב, כבר הפסקנו לאחוז ראש בנסיון להבין מה קדם למה;
נראה שמשהו בלוגיקה של כינויי המודלים - השתבש, או שיש כאן כרוניקה מובנת והמודל O3 אכן ישן יותר מGPT4.0 המתקדם כך שאנו הסניליים פה, שלא זוכרים שהמודול האהוב משכבר הימים הוא השלישי - O3 ולא הרביעי במספר -GPT4.0.
אז לפני שנרוץ לספור את השערות הלבנות המצויות בראשנו, וכדי שלא נחפוז להסיק מסקנות מסוימות מאד -
יצאנו לבדוק את כל הדבר הזה, שנקרא ChatGPT. סדר כרונולוגי עובדתי שיפתור לנו ספיקות לגבי המצב המנטלי שלנו, מילון מונחים קצר,
שו"ת נחוץ וכמובן - פירוט החוזקות והשימושים של כל אחד מהמודלים.
מתחילים!
*************
מבוא: (ובו ידובר על ציר זמן, ומילון מונחים)האמת? באיזשהו שלב, כבר הפסקנו לאחוז ראש בנסיון להבין מה קדם למה;
נראה שמשהו בלוגיקה של כינויי המודלים - השתבש, או שיש כאן כרוניקה מובנת והמודל O3 אכן ישן יותר מGPT4.0 המתקדם כך שאנו הסניליים פה, שלא זוכרים שהמודול האהוב משכבר הימים הוא השלישי - O3 ולא הרביעי במספר -GPT4.0.
אז לפני שנרוץ לספור את השערות הלבנות המצויות בראשנו, וכדי שלא נחפוז להסיק מסקנות מסוימות מאד -
יצאנו לבדוק את כל הדבר הזה, שנקרא ChatGPT. סדר כרונולוגי עובדתי שיפתור לנו ספיקות לגבי המצב המנטלי שלנו, מילון מונחים קצר,
שו"ת נחוץ וכמובן - פירוט החוזקות והשימושים של כל אחד מהמודלים.
מתחילים!
*************
- ציר זמן של כל מודלי OpenAI שפורסמו עד היום (כולל ChatGPT לסוגיו, מודלים ג'נרטיביים ואחרים)
(הדגמים מסודרים כרונולוגית, עם תאריכי הכרזה ומקור רשמי של OpenAI או דיווח עיתונאי מרכזי)
בשביל לא לייגע את האצבעות בגלילה ארוכה מדי, הכנסתי לספוילר:
- 2018 - GPT-1
המודל הלשוני הראשון של OpenAI, הוצג במאמר “Improving Language Understanding by Generative Pre-Training” ביוני 2018.
- פברואר 2019 - GPT-2 (שחרור חלקי)
גרסת 117 מיליון פרמטרים פורסמה כאזהרת בטיחות. השחרור המלא של 1.5 מיליארד פרמטרים הגיע בנובמבר 2019.
- יוני 2020 - GPT-3 וה-API הפרטי
175 מיליארד פרמטרים, נפתח לבטא מפתחים בקיץ 2020.
- 30 אפריל 2020 - Jukebox
מודל גנראטיבי ליצירת מוזיקה ושירה גולמית.
- 5 ינואר 2021 - CLIP + DALL·E 1
CLIP הציג התאמה בין תמונה לטקסט; דאלי 1 הדגים יצירת תמונות מטקסט.
- 10 אוגוסט 2021 - Codex (תצוגה מקדימה)
מודל קוד המתרגם הנחיות טבעיות לפונקציות תכנותיות.
- ינואר 2022 - InstructGPT
גרסת GPT-3 מכוילת לעקוב אחרי הוראות אנושיות.
- 6 אפריל 2022 - DALL·E 2
שיפור דרמטי ברזולוציה ובדיוק לעומת דאלי 1.
- 21 ספטמבר 2022 - Whisper
מודל קוד פתוח ל-ASR שמתקרב לדיוק אנושי.
- 30 נובמבר 2022 - ChatGPT (GPT-3.5)
השקה רשמית של הצ’אטבוט המבוסס על GPT-3.5.
- 1 מרץ 2023 - GPT-3.5-Turbo
גרסת Turbo זריזה וחסכונית ל-API ולצ’אט.
- 14 מרץ 2023 - GPT-4
מודל מולטימודלי עם חלונות הקשר גדולים ומעלית ביצועים בבחינות.
- 6 אפריל 2023 - GPT-4-32K (הרחבת הקשר)
הרחבת חלון ההקשר ל-32 אלף טוקן ב-API (עדכון תיעוד ולא הכרזה נפרדת).
- 13 מאי 2024 - GPT-4o (Omni)
מודל זמן-אמת לטקסט, קול, תמונה ווידאו, הוכרז ב-Spring Update.
- 18 יולי 2024 - GPT-4o mini
גרסה קטנה וחסכונית של GPT-4o, עם חלון 128 אלף טוקן.
- 12 ספטמבר 2024 - o1-preview ו-o1-mini
סדרת Reasoning חדשה שחושבת “קצת יותר זמן” לפני תשובה.
- 5 דצמבר 2024 - o1 pro mode (חבילת ChatGPT Pro)
גרסת o1 עתירת חישוב למנויי Pro.
- 20 דצמבר 2024 - הכרזה ראשונה על o3-mini (יצא בפועל 31 ינואר 2025)
מודל חסכוני ל-STEM עם שיפור משמעותי לעומת o1.
- 27 פברואר 2025 - GPT-4.5 (תצוגה מוקדמת לחוקרים)
ממוקד בתוכן יצירתי ואינטואיטיבי.
- 14 אפריל 2025 - GPT-4.1, GPT-4.1 mini ו-nano (API בלבד)
שיפורים נרחבים בקוד, הוראות וחלון של מיליון טוקן.
- 16 אפריל 2025 - o3 ו-o4-mini
שחרור רשמי של o3 (הדגם הרב-שלבי החזק ביותר) יחד עם o4-mini המהיר והחסכוני.
- 29 אפריל 2025 - o4-mini-high
גרסת דיוק גבוהה יותר של o4-mini ליוזרים בתשלום.
- 14 מאי 2025 - GPT-4.1 ו-GPT-4.1 mini נכנסים ל-ChatGPT
4.1 זמין למנויי Plus/Pro/Team, 4.1 mini הופך לברירת-מחדל לכלל המשתמשים.
- מונחים נפוצים בעולם מודלי השפה הגדולים (LLM):
בסוף יצא לי ארוך ממש, אבל לא יכולתי לוותר על אף מונח חשוב, לכן הכנסתי שוב לספוילר- כנסו, זה מרתק.
חלק מהם שייכים לעולם הAPI של פיתוח האייג'נטים, אז אם רציתם כבר מזמן לבנות אייג'נט אישי אבל לא הבנתם מונחים והוראות - הנה זה:
- Tokens (טוקנים) - יחידות הטקסט שהמודל קורא וכותב. מילה ארוכה או מספר יכולים להתפצל לכמה טוקנים, בעוד מילים קצרות לעתים הן טוקן בודד.
לדוגמה: "ChatGPT" מתפצל לשני טוקנים.
- Reasoning - היכולת של המודל "לחשוב" בכמה שלבים, להסיק מסקנות ולפתור בעיה מורכבת במקום רק להשלים טקסט באופן שטחי.
לדוגמה: "כתוב תוכנית שמחשבת מספר ראשוני הבא אחרי 97".
- Preview - גרסה מוקדמת לניסיון ציבורי או לחוקרים. מאפשרת ל-OpenAI לאסוף משוב לפני השקה מלאה ולכן זמינה לזמן מוגבל או במכסה קטנה.
לדוגמה: GPT-4.5 Research Preview זמין רק למשתמשי Pro (התכנית היקרה ביותר כרגע של OPEN AI), וביולי 2025 צפוי להיות מוסר מהמדף, כדי לפנות מקום ל-GPT-4.1.
- Mini / Nano / Small - גרסאות קלות וחסכוניות יותר, שנועדו לתת תשובות טובות יחסית אבל בעלות חישוב נמוכה ומהירות תגובה גבוהה.
לדוגמה: GPT-4.1 mini מגיב מהר יותר אבל צורך פחות GPU.
- Omni (למשל GPT-4o) - דגם מולטימודלי "כולבו" שמבין ומייצר טקסט, תמונה וקול גם יחד.
לדוגמה: GPT-4o Omni מבין תיאור מילולי ותמונה במקביל.
- Context Window (חלון הקשר) - מספר הטוקנים שהמודל יכול לקחת בחשבון בבת אחת. חלון גדול מאפשר לטפל במסמכים ארוכים יותר או בשיחה ארוכה בלי לאבד מידע.
לדוגמה: GPT-4-32K מחזיק עד 32,000 טוקנים בשיחה.
- Fine-Tuning - "כיוונון עדין" של מודל קיים על סט נתונים ייעודי כדי שיתאים לתחום מסוים כמו שפה מקצועית, סגנון חברה או משימת שירות לקוחות.
לדוגמה: כוונון מודל לשפה משפטית של משרד עורכי דין.
- RLHF (Reinforcement Learning from Human Feedback) - שיפור המודל בעזרת דירוג תשובות אנושי.
לדוגמה: בודקים שונים מדרגים אם תשובה בטוחה ומועילה, והמודל לומד לשפר את עצמו כדי להתיישר עם ציפיות המשתמשים.
- Hallucination - מצב שבו המודל ממציא מידע שאינו נכון או לא קיים. ובעגה העדכנית - "הזיות". נפוץ כשאין לו מספיק נתונים אמינים בקשר לשאלה שנשאלה.
לדוגמה: המצאה של ציטוט שלא קיים בספר ידוע.
- Temperature - פרמטר השולט ברמת היצירתיות. ערך גבוה יוצר תשובות מגוונות וחדשניות, ערך נמוך מחזיר תשובות צפויות ומדויקות יותר.
לדוגמה: ערך 0.9 יציע כותרות מאמר נועזות יותר.
- Top-p (או nucleus sampling) - שיטה לבחירת המילה הבאה מתוך טווח הסתברויות מצטבר. מאפשר שליטה דקה יותר ביצירתיות מאשר Temperature לבדו.
לדוגמה: top-p 0.8 מגביל את הבחירה לאופציות הסבירות ביותר שמכסות 80% מההסתברות.
- Zero-Shot / Few-Shot - עבודה עם המודל ללא דוגמאות כלל (Zero) או עם מספר קטן של דוגמאות (Few) כדי שיבין את המשימה לפני שמבקשים ממנו לענות.
לדוגמה: "תרגם לעברית" ללא דוגמה קודמת נקרא Zero-Shot.
- Prompt Engineering - אמנות ניסוח ההוראה (Prompt) כך שה-LLM יחזיר את התוצאה הרצויה. כולל פקודות מפורשות, דוגמאות, הגבלות פורמט ועוד.
לדוגמה: הוספת "ענה בקצרה בשלוש נקודות" בסוף השאלה.
- Multimodal - מודל שמסוגל לקבל או ליצור יותר מסוג תוכן אחד, למשל טקסט ותמונה יחד, במקום להיות מוגבל לטקסט בלבד.
לדוגמה: דגם שמקבל תמונה ומפיק כיתוב טקסטואלי.
- Inference - שלב "הרצת המודל" בזמן אמת, שבו המחשב משתמש בפרמטרים שכבר אומנו כדי לייצר תשובה לשאילתת המשתמש.
לדוגמה: שליחת שאילתה וקבלת תשובה מידית מה-API.
- Embedding - המרה של מילה, משפט או מסמך לווקטור (רשימה מסודרת של מספרים המהווה נקודה במרחב מתמטי), כך שהמרחקים בין הווקטורים משקפים את הדמיון הסמנטי בין הטקסטים. כלומר, כתובת מספרית לאובייקט טקסטואלי.
לדוגמה: שני משפטים על "גמרא" יקבלו וקטורים קרובים.
- Alignment - התאמת המודל לערכים וכללים אנושיים.
לדוגמה: סינון קללות או הנחיות מזיקות לפני שהמודל עונה.
**************
משליטים סדר: (ובו יפורטו המודלים השונים של ChatGPT)
- קבלו את האמת עליהם:
- GPT-3.5
הדור הראשון של ChatGPT. מהיר, חסכוני ובשל-לשיחה טבעית. מעולה לענות על שאלות כלליות, ניסוח הודעות בסיסיות וליצירת סיכומים קצרים כשלא נדרש עומק נרחב או קלט מולטימודלי. - GPT-4o
דגם הדגל. המהיר ביותר ומולטימודלי לחלוטין: תומך כמעט בכל היכולות (GPTs, ניתוח נתונים, חיפוש, יצירת תמונות, Canvas, קול מתקדם) ובסוגי קלט רבים (מסמכים, תמונות, קבצי CSV, אודיו ווידאו). מושלם למיילים, סיכומי פגישות, רעיונות יצירתיים ושיחות מולטימודליות. - GPT-4.5
מתאים למשימות יצירתיות: אינטליגנציה רגשית, תקשורת ברורה, יצירתיות וגישה שיתופית ואינטואיטיבית לסיעור מוחות. מדגיש שליטה מדויקת בטון הכתיבה - אידיאלי לפוסטים שיווקיים, מכתבי התנצלות ותוכן פרסומי יצירתי. - GPT-4.1
מותאם במיוחד למשימות קוד ופיתוח Web. מדויק במילוי הוראות ובפתרון באגים, ומהווה חלופה קלה וזריזה ל-o3 או o4-mini במשימות תכנות יומיומיות. - GPT-4.1 mini
גרסה קלה ומהירה של GPT-4.1, המחליפה את 4o mini. טובה לקריאות קוד קצרות או המרות פורמט מהירות כאשר לא נדרש עומק גדול. - Codex
מודל שפת-קוד ייעודי של OpenAI. קורא הוראות טבעיות, יוצר קוד במגוון שפות, מדבג ומשפר ביצועים. זמין כסוכן ענן בצד ה-ChatGPT (למשימות מקבילות בלי התקנה) או כ-Codex CLI שמתחבר ל-API ומשולב בעורך מקומי – אידיאלי לכתיבת טסטים, Refactor אוטומטי והאצת תהליכי CI. - OpenAI o4-mini
דגם זריז וחסכוני למשימות STEM: מתמטיקה, קוד והסקה חזותית בסיסית. נהדר לנפחים גבוהים של שאלות טכניות קלות. - o4-mini-high
אותו DNA של o4-mini, אך חושב מעט יותר לעומק ומחזיר תשובות טכניות מדויקות יותר - מתאים למי שצריך דיוק מתמטי או קוד מורכב יותר ועדיין רוצה עלות נמוכה. - OpenAI o3
המנוע העוצמתי למשימות מרובות-שלבים: אנליטיקה מתקדמת, תכנון אסטרטגי, קוד רחב-היקף ותחזיות נתונים. מתאים כשנדרש עומק מחשבתי ואוטומציה חכמה. - o1-pro (Legacy)
דגם ותיק ואיטי יותר, אך יציב למשימות מחקר ארוכות, תזכירים ודו"חות נרחבים שבהם חשובה קוהרנטיות לטווח-ארוך.
- ובסיכום קצר:
- GPT-3.5 - דגם בסיסי ומהיר לשיחות כלליות, סיכומים קצרים וניסוח הודעות, ללא תמיכה במולטימדיה.
- GPT-4o דגם משולב. חשיבה בזמן אמת ומולטימודלית בזרימות עבודה יומיומיות. יכולות: GPTs, ניתוח נתונים, חיפוש, יצירת תמונות, Canvas, קול מתקדם. קלטים: מסמכים, תמונות, CSV, אודיו, וידאו.
- GPT-4.5 ידע רחב יותר ושליטה טובה יותר בטון הכתיבה. מעולה לכתיבה, קוד ופתרון בעיות מהיר. אותן יכולות וקלטים של GPT-4o, מלבד Deep Research.
- Codex – מומחה קוד ייעודי. מייצר, מדבג ומסביר קוד בשורת פקודה או כסוכן צדדי ב-ChatGPT.
- o4-mini חשיבה מהירה וחסכונית לקוד, מתמטיקה ומשימות חזותיות. יכולות: GPTs, ניתוח נתונים, חיפוש, יצירת תמונות, Canvas, Deep Research. קלטים: מסמכים, תמונות, CSV.
- o4-mini-high כמו o4-mini אך עם עומק נוסף לתשובות טכניות יסודיות יותר. אותן יכולות וקלטים של o4-mini, ללא Deep Research.
- o3 המנוע החזק ביותר לניתוח מורכב רב-שלבי. יכולות: GPTs, ניתוח נתונים, חיפוש, יצירת תמונות, Canvas, Deep Research. קלטים: מסמכים, תמונות, CSV.
- o1-pro דגם ותיק המכוונן לעבודה אנליטית ארוכת-טווח ועתירת סיכון. יכולות: חיפוש ותמונות.
- והנה טבלת סיכום מסודרת
(כולל פירוט מגבלות השימוש בתכניות המנוי השונות: Free, Plus, Team, Pro, Enterprise)
| מודל | לשימוש ב... | במה הוא מצטיין | מגבלות שימוש* |
| GPT-4o | משימות יומיומיות, סיכומים, מיילים, רעיונות בזמן-אמת | מולטימודלי מלא (טקסט, תמונה, קול, וידאו) | חינמי: מספר מצומצם של הודעות בחלון 5 שעות (לא מפורסם, בפועל 5-10 הודעות) Plus: יש 80 הודעות כל 3 שעות Team: עד 160 הודעות (או בקשות) לכל היותר בכל חלון של שלוש שעות; בערך פי שניים ממגבלת מנוי Plus. Pro: כמעט ללא מגבלה (“near-unlimited”) Enterprise: ללא הגבלה |
| GPT-4.5 | תוכן יצירתי, כתיבה אמפתית, פוסטים שיווקיים | שליטה עדינה בטון, אינטואיציה וזרימת שיחה | חינמי: לא זמין Plus / Team: כ-50 הודעות בשבוע (מספר בלתי רשמי, משתנה לפי עומס) Pro: קרוב ל-Unlimited (OpenAI לא פרסמה תקרה) Enterprise: יש 20 בקשות בשבוע |
| GPT-4.1 | קוד, באגים, פיתוח Web | ציות מדויק להוראות, חלון הקשר גדול | חינמי: לא זמין (מופיע רק כ-fallback mini) Plus: אותן תקרות כמו GPT-4o (80\3h) Team: עד 160 הודעות (או בקשות) לכל היותר בכל פרק זמן של שלוש שעות. Pro: כמעט ללא מגבלה Enterprise: ייפתח בקרוב - צפוי ללא מגבלה (טרם פורסם רשמית) |
| GPT-4.1 mini | קריאות קוד קצרות, המרות פורמט | מהיר וחסכוני | חינמי: מופעל אוטומטית אחרי שממצים GPT-4o (אין נתון רשמי) Plus / Team: תקרות זהות ל-4.1 (80\3h; Team כפול) Pro: כמעט ללא מגבלה Enterprise: ללא מגבלה (בהשקה) |
| o4-mini | שאלות STEM מהירות, קוד בסיסי, מתמטיקה | מהיר וזול | חינמי: לא זמין Plus: עד 80 הודעות לכל היותר בכל חלון של 3 שעות Team: עד 160 הודעות לכל היותר בכל חלון של 3 שעות (כלומר, כפול מהמכסה של Plus) 300 :Enterprise ביום |
| o4-mini-high | קוד או מתמטיקה מעמיקים | דיוק גבוה יותר במחיר זמן עיבוד ארוך מעט | חינמי: לא זמין Plus / Team: יש 100 הודעות ביום Pro: ללא מגבלה Enterprise: יש 100 ביום |
| o3 | ניתוח רב-שלבי, אסטרטגיה, תחזיות נתונים | “סוס עבודה” לחשיבה עמוקה וכלי ChatGPT | חינמי: לא זמין Plus / Team: יש 100 הודעות בשבוע Pro: ללא מגבלה Enterprise: יש 100 בשבוע |
| o1-pro (Legacy) | דוחות ארוכים, מחקר רציף | עקביות ארוכת-טווח | חינמי: לא זמין Enterprise: יש 5 בחודשPlus / Team: אינו כלול Pro: יש 5 הודעות בחודש (נשמר לצורכי התאמה לאחור) |
לכן כדאי למדוד ביצועים על סט משימות אמיתי לפני החלטה סופית - לעיתים מודל זריז וחסכוני (o4-mini) מספק תוצאה מספקת בלי להמתין ל-o3.
בחירה נכונה של מודל חוסכת זמן וכסף ומשפרת את איכות הפלט. אם תעדכנו את נהלי העבודה כך שכל משימה תנותב אוטומטית למודל המתאים - תרוויחו את המקסימום מהמנוי שלכם בopen AI.
(טוב, לא באמת. נראה לכם שאני מתזזת בין המודלים כל הזמן? רק אם מדובר במשהו מאד ספציפי ושונה).
******************
סיום: (ובו יתנהל שו"ת על שאלות שתמיד גרדו לנו)
שאלה:
מהי הגרסה החדשה והמתקדמת ביותר? 4.5 או 4.1
GPT-4.5 נחשב לדגם החזק והרחב ביותר, בעוד GPT-4.1 הוא גרסה מאוחרת יותר אך ממוקדת בעיקר בקוד ובהוראות.
למה GPT-4.5 מתקדם יותר ברוב התחומים:
למה GPT-4.5 מתקדם יותר ברוב התחומים:
- גודל ויכולת כללית - ב-OpenAI מתארים את 4.5 כ"המודל הגדול והטוב ביותר לצ'אט עד כה"
- שיפור ביצירתיות ואינטואיציה - הוא תוכנן להגיב באופן טבעי יותר, להבין רמזים רגשיים ולייצר תוכן מגוון.
- כיסוי משימות רחב - מתאים גם לכתיבה, גם לתכנות וגם לפתרון בעיות כלליות, ולכן מוגדר כ-"all-purpose" של 2025.
- התמחות בקוד - הגרסה הוצגה כסדרה "מדויקת במיוחד בפיתוח ווב, במעקב אחרי הוראות ובדיבאג"
- שיפורים בהקשר ארוך - חלון טקסט גדול וחבילות mini ו-nano לצריכת משאבים גמישה.
- הכרזה מאוחרת יותר - הושקה ב-14 באפריל 2025, חודש וחצי אחרי 4.5, אך לא באה להחליף אותו אלא להוסיף כלי ייעודי למפתחים.
- צריכים מודל כל-יכול לכתיבה, דיבור ויצירתיות - לכו על GPT-4.5.
- מתמקדים בפיתוח תוכנה ושגיאות קוד - GPT-4.1 ייתן מענה חד ומדויק יותר.
האם GPT-4.5 נגיש לכולם?
לא. GPT-4.5 זמין כיום במעמד Research Preview רק למנויים בתשלום (Plus, Pro, Team ו-Enterprise) ולמפתחים דרך ה-API. גם בקרב מנויי Enterprise הוא מוגבל ל-20 בקשות בשבוע, בגלל צריכת משאבים גבוהה. משתמשים בתכנית החינמית אינם יכולים לבחור אותו כלל, וה-API צפוי להסיר את הדגם ביולי 2025 כדי לפנות מקום ל-GPT-4.1.
במה GPT-4.5 עדיף על o3?
היתרונות של GPT-4.5 על פני O3:
בשורה התחתונה, GPT-4.5 מציע חוויית שיחה טבעית ועשירה יותר, אבל זמינותו מוגבלת ויתרונו העיקרי הוא ביצירת תוכן ורושם רגשי. o3 נשאר "סוס העבודה" למשימות אנליטיות וטכניות כבדות.
- כתיבה יצירתית וטון רגשי: GPT-4.5 הותאם במיוחד ל"דיבור טבעי" ולשליטה עדינה בסגנון ובקול, ולכן הוא מפיק פוסטים שיווקיים, מכתבי התנצלות או סיכומים בגוון אנושי משכנע יותר.
- אינטואיציה וזרימת שיחה: הדגם מתמקד בהבנת רמזים עקיפים, שאלות פתוחות ושיח דיאלוגי מתמשך, מה שהופך אותו לשותף נוח בסיעורי מוחות ובהנחיה שוטפת של תוכן.
- חוויית משתמש "קלה": התשובות קצרות וזורמות יותר, עם פחות צורך להבהיר הנחיות. לפי OpenAI, 4.5 "מרגיש" ידידותי ומהיר יותר בתגובות כתובות.
- חשיבה מרובת שלבים - o3 חזק במיוחד בניתוחים עמוקים, שרשראות חשיבה מסובכות ופתרון בעיות מתמטיות או קוד מורכב.
- שימוש בכלי ChatGPT - o3 מסוגל להפעיל חיפוש, קוד, ניתוח קבצים, יצירת תמונות ועוד, כחלק מתשובה אחת, ומחזיק ב-100 בקשות שבועיות במנוי Enterprise.
- דיוק במטלות STEM - בבנצ'מרקים כמו Codeforces ו-MMMU הוא עוקף את 4.5 בדיוק ויציבות בעת שימוש בכלים (למשל הרצת פייתון).
- תוכן שיווקי, אימיילים עם נימה אישית, פוסטים ברשתות חברתיות - העדיפו GPT-4.5 כל עוד יש לכם מכסה זמינה.
- דוחות נתונים, אלגוריתמים, תחזיות, קוד מורכב או ניתוח תמונות - o3 יספק תוצאות עמוקות יותר ובמכסה נדיבה יותר.
בשורה התחתונה, GPT-4.5 מציע חוויית שיחה טבעית ועשירה יותר, אבל זמינותו מוגבלת ויתרונו העיקרי הוא ביצירת תוכן ורושם רגשי. o3 נשאר "סוס העבודה" למשימות אנליטיות וטכניות כבדות.
open AI צפויה להסיר את הדגם GPT-4.5 ביולי 2025 כדי לפנות מקום ל-GPT-4.1.
מדוע צריך להסירו, האם זה אומר משהו על רמת היעילות שלו?
לא. הסרת GPT-4.5 מה-API אינה מרמזת שהמודל "לא טוב". זו החלטה תפעולית וכלכלית של OpenAI, שמבכרת את GPT-4.1 מסיבות ברורות:
- יעילות עלות ומהירות: לפי הודעת OpenAI, GPT-4.1 מספק ביצועים שווים או טובים יותר במטלות מפתח - במיוחד קוד והקשר ארוך - במחיר ובזמן חישוב נמוכים משמעותית. לכן החברה מעדיפה לתעל את משאבי השרתים אל מודל חסכוני יותר.
- חפיפה פונקציונלית: GPT-4.5 היה "תצוגת מחקר" שנועדה לבדוק מודל ענק ויקר. מהרגע ש-4.1 השיג תוצאות דומות, OpenAI ראתה בו תחליף טבעי והכריזה כי תפסיק את 4.5 ב-14 ביולי 2025 כדי לפנות מקום.
- ניהול תשתית: מודל כבד כמו 4.5 צורך הרבה יותר GPU ולכן מגביל זמינות לשאר השירותים. סילוקו חוסך תורים ומשך המתנה למפתחים ומאפשר להוריד מחירים. כתבות טכנולוגיה ציינו במפורש שהשיקול המרכזי הוא יחס עלות-תועלת, לא איכות התשובות.
- מחזור חיים רגיל של דגמי Preview: OpenAI נוהגת "לכבות" מודלים ניסיוניים אחרי כמה חודשים - כך קרה לטקסט-דאוינצ׳י-002 ול-GPT-3.5-Turbo-16K. ההכרזה על סיום 4.5 ממשיכה את אותה מדיניות ומתבצעת עם חלון מעבר של שלושה חודשים כדי לאפשר הסתגלות.
ברשותכם, ויתרתי על הסיכום.
מקורות:
Introducing Codex – OpenAI (10.8.2021) OpenAI
Hello GPT-4o – OpenAI (13.5.2024) OpenAI
GPT-4o mini: Advancing Cost-Efficient Intelligence – OpenAI (18.7.2024) OpenAI
Introducing ChatGPT Pro – OpenAI (5.12.2024) OpenAI
Introducing GPT-4.5 (Research Preview) – OpenAI (27.2.2025) OpenAI
OpenAI plans to wind down GPT-4.5 in its API – TechCrunch (14.4.2025) TechCrunch
GPT-4.1 models in the API – OpenAI (14.4.2025) OpenAI
OpenAI's new GPT-4.1 models focus on coding – TechCrunch (14.4.2025) TechCrunch
Introducing OpenAI o3 and o4-mini – OpenAI (16.4.2025) OpenAI
OpenAI brings GPT-4.1 to ChatGPT – TechCrunch (14.5.2025) TechCrunch
Which ChatGPT model is best? – Business Insider (16.5.2025) Business Insider
Inside the wild, chaotic year that turned OpenAI into a corporate juggernaut – Business Insider (מאי 2025) Business Insider
ChatGPT – Wikipedia Wikipedia
Improving Language Understanding by Generative Pre-Training – Radford et al., arXiv (2018) arXiv
GPT-2 – Wikipedia
הנושאים החמים