- הוסף לסימניות
- #1
האם לאור חדשות היום, תהיה לדעתכם תנודתיות יתר במניות שקשורות לAI?
רקע איומי הגבלת הייצוא של שבבים חזקים מארה"ב לסין: סטארט-אפ סיני הצליח לפתח מודל בינה מלאכותית שמתחרה טוב מאוד במודלים האמריקאים הגדולים ● עם שינוי משמעותי, בזול יותר וללא צורך בשבבים חזקים ● מנכ"ל מיקרוסופט סאטיה נאדאלה: "אנחנו צריכים לקחת את ההתפתחויות מסין מאוד מאוד ברצינות"
נבו טרבלסי/גלובס
כשברקע מאיימים המגבלות של ארצות הברית על סין: סטארט-אפ סיני בשם DeepSeek הצליח לפתח מודלי בינה מלאכותית שמתחרים במודלים האמריקאים הגדולים - עם שינוי משמעותי, בזול יותר ועם פחות שבבים חזקים. המודלים הללו מסעירים את הסיליקון וואלי ואת הרשת כולה.
DeepSeek הסינית יש מודלים בקוד פתוח שמתחרים במודלים הגדולים ביותר של OpenAI, למרות שפותחו בתקציב זעום
תכירו את DeepSeek, סטארטאפ AI סיני שמשחרר מודלים בקצב מהיר – ובקוד פתוח – ומתכנן להתחרות בשחקניות האמריקאיות הגדולות ביותר גם בביצועים וגם בעלויות של השימוש במודלים שלו. הסטארטאפ התפרסם בחודש שעבר אחרי ששחרר את DeepSeek-V3, המודל החדש שלו בקוד פתוח שמגיע גם בתצורת צ'אטבוט כדי להתחרות ראש בראש עם ChatGPT, קלוד, ג'מיני ואחרים.
המודל פותח בארכיטקטורת Mixture-of-Experts, הכוללת מספר רשתות המתמחות בפתרון בעיות מסוימות שכל אחת מהן מופעלת בהתאם לפרומפט שמקבל המודל. המודל כולל 671 מיליארד פרמטרים, 37 מיליארד מתוכם מופעלים פר טוקן שתשלחו בפרומפט שלכם. המודל אומן על כ-15 טריליון טוקנים של טקסט והוא מתמחה במטלות מתמטיות וכתיבת קוד. לראייה, אחוז ההצלחה שלו בבנצ'מרק כתיבת ופתרון בעיות קוד (Codeforces) יותר מכפול מזה של GPT-4o של OpenAI. במאמר שפרסמה החברה היא מציינת כי אימנה את המודל הענק על כ-2,000 GPUs בלבד לאורך חודשיים.
נבו טרבלסי/גלובס
כשברקע מאיימים המגבלות של ארצות הברית על סין: סטארט-אפ סיני בשם DeepSeek הצליח לפתח מודלי בינה מלאכותית שמתחרים במודלים האמריקאים הגדולים - עם שינוי משמעותי, בזול יותר ועם פחות שבבים חזקים. המודלים הללו מסעירים את הסיליקון וואלי ואת הרשת כולה.
DeepSeek הסינית יש מודלים בקוד פתוח שמתחרים במודלים הגדולים ביותר של OpenAI, למרות שפותחו בתקציב זעום
תכירו את DeepSeek, סטארטאפ AI סיני שמשחרר מודלים בקצב מהיר – ובקוד פתוח – ומתכנן להתחרות בשחקניות האמריקאיות הגדולות ביותר גם בביצועים וגם בעלויות של השימוש במודלים שלו. הסטארטאפ התפרסם בחודש שעבר אחרי ששחרר את DeepSeek-V3, המודל החדש שלו בקוד פתוח שמגיע גם בתצורת צ'אטבוט כדי להתחרות ראש בראש עם ChatGPT, קלוד, ג'מיני ואחרים.
המודל פותח בארכיטקטורת Mixture-of-Experts, הכוללת מספר רשתות המתמחות בפתרון בעיות מסוימות שכל אחת מהן מופעלת בהתאם לפרומפט שמקבל המודל. המודל כולל 671 מיליארד פרמטרים, 37 מיליארד מתוכם מופעלים פר טוקן שתשלחו בפרומפט שלכם. המודל אומן על כ-15 טריליון טוקנים של טקסט והוא מתמחה במטלות מתמטיות וכתיבת קוד. לראייה, אחוז ההצלחה שלו בבנצ'מרק כתיבת ופתרון בעיות קוד (Codeforces) יותר מכפול מזה של GPT-4o של OpenAI. במאמר שפרסמה החברה היא מציינת כי אימנה את המודל הענק על כ-2,000 GPUs בלבד לאורך חודשיים.
הנושאים החמים