תיקון קוראים
משתמש פעיל
- הוסף לסימניות
- #1
קשה להאמין, אבל רק לפני 3 חודשים, פרסמתי כאן את הפוסט הזה על שחרור מודל o1
וכבר מודל o3 הוצג! (על o2 OpenAI פשוט דילגה)
וכבר מודל o3 הוצג! (על o2 OpenAI פשוט דילגה)
קצת רקע:
מודל o1 הוא מודל שהציגה Openai לפני מספר חודשים, המודל עובד בשיטה חדשה המכונה COT = שרשרת חשיבה. השיטה עובדת כך שהמודל חושב זמן מסויים (בין מספר שניות למספר דקות) עד שהוא עונה תשובה, מה שמקפיץ את ביצועי המודל בתחומים כמו מתמטיקה ותכנות.
בשלב הראשון הציגה החברה את מודל o1, אבל שחררה לציבור (למנויים בלבד) מודל חכם פחות, בשם o1 preview, אם כי גם הוא הציג ביצועים מדהימים כשלעצמו, כתבתי עליהם כאן.
ההתפתחויות האחרונות:
לפני שבועיים בלבד, שחררה OpenAI את מודל o1 המלא ואת מודל o1 pro (בעלות של 200$ לחודש, אבל זה כבר נושא אחר) - שהציגו ביצועים אפילו טובים יותר!
ממש בסוף השבוע האחרון, גוגל שחררה גם היא מודל חשיבה כזה בגרסת בטא. הוא נקרא בשם gemini-2.0-flash-thinking, וניתן לנסות אותו בחינם ב-AI STUDIO.
וכעת לתכלס':
אתמול, הציגה החברה את מודל o3 שמציג קפיצת מדרגה מדהימה במבחנים הקשים ביותר
המודל עוד לא שוחרר לציבור, וכפי הנראה גם כשזה יקרה, הוא יעלה כסף. הרבה כסף. מכיוון שהמודל דורש כח עיבוד מטורף עבור כל שאלה.
לא כל הנתונים פורסמו, וגם אני עצמי לא הספקתי לעבור על כולם. אבל הגרף הבא די מספק. מדובר על אחד המדדים הקשים ביותר בתחום, וכדי לסבר את האוזן שימו לב לעובדה הבאה: ל-ARC-AGI-1 לקח 4 שנים לעבור מ-0% עם GPT-3 ב-2020 ל-5% ב-2024 עם GPT-4o.
במילים אחרות - אנחנו נמצאים בתוך עלייה אקספוננציאלית, בקו כמעט ישר כלפי מעלה! במילים אחרות - מהירות ההכפלה של אינטליגנציה מלאכותית היא ההתפתחות הטכנולוגית המהירה ביותר אי פעם משחר ההיסטוריה!
לטעמי, הגרף הזה אמנם לא נותן את התמונה המלאה על התחום, אבל מראה מצויין לאן פנינו מועדות!
פרטים נוספים בפוסט הרשמי של מדד ARC:
https://arcprize.org/blog/oai-o3-pub-breakthrough
להתראות מתכנתים!
הכי חשוב: תזכרו מי הראשון שזיהה! 
הנושאים החמים