אנבידיה הכריזה היום (שני) על Nemotron 3 – משפחה חדשה של מודלי בינה מלאכותית (AI), נתונים לאימון (Data Sets) וספריות בקוד פתוח שיאפשרו למפתחים ליצור סוכני AI מומחים, יעילים ושקופים עבור מגוון תעשיות, ולהאיץ את החדשנות משלב יצירת אבות הטיפוס ועד לפריסת הסוכנים בארגון.
סדרת Nemotron 3 היא הראשונה להציג ארכיטקטורת Mixture-of-Experts MoE היברידית, כוללת שלושה מודלים בגדלים שונים: Nano, Super ו-Ultra – המתאימים למשימות ועומסי עבודה שונים.
הצורך במודלים אלה נולד על רקע המגמה בה ארגונים, שעד היום נשענו על צ'אטבוטים המבוססים על מודל יחיד, עוברים לשימוש במערכות AI שיתופיות ומרובות סוכנים (Multi-agent AI Systems), שם נתקלים המפתחים באתגרים כמו מגבלות תקשורת, יציאה מהקשר ועלויות הסקה (Inference) גבוהות. בנוסף, מפתחים זקוקים כיום לשקיפות כדי לבטוח במודלים המבצעים אוטומציה לתהליכי עבודה מורכבים. סדרת Nemotron 3 מציעה פתרון לאתגרים הללו ומספקת את הביצועים והפתיחות שהלקוחות זקוקים להם כדי לבנות סוכני בינה מלאכותית עם מומחיות בתחומים שונים.
משפחת Nemotron 3 כוללת שלושה מודלי Mixture-of-experts בגדלים שונים:
●Nemotron 3 Nano – מודל קטן בהיקף של כ־30 מיליארד פרמטרים, המפעיל עד 3 מיליארד פרמטרים בכל רגע נתון, ומיועד למשימות ממוקדות ויעילות במיוחד.
●Nemotron 3 Super- מודל חשיבה (Reasoning) ברמת דיוק גבוהה, הכולל כ־100 מיליארד פרמטרים ומפעיל עד 10 מיליארד פרמטרים עבור כל טוקן, המיועד ליישומים מרובי סוכנים (Multi-Agent).
●Nemotron 3 Ultra – מנוע חשיבה גדול עם כ־500 מיליארד פרמטרים ועד 50 מיליארד פרמטרים פעילים עבור כל טוקן, המיועד ליישומי AI מורכבים.
מודל Nemotron 3 Nano, הוא מודל יעיל מבחינת עלות חישוב (compute), ומותאם למשימות כמו תיקון שגיאות תוכנה, סיכום תכנים, תמיכה בתהליכי עבודה של עוזרי AI, ואחזור מידע בעלויות נמוכות. המודל מבוסס על ארכיטקטורת Hybrid mixture-of-experts ייחודית, המציעה שיפור ביעילות וביכולת ההתרחבות. ארכיטקטורה זאת מספקת קצב עיבוד טוקנים גבוה עד פי 4 לעומת Nemotron 2 Nano, ומפחיתה את יצירת טוקני החשיבה בעד 60%, על מנת לצמצם באופן משמעותי את העלויות בשלב ההסקה.
להצטרפות לערוץ הטלגרם של The Gadget Reviews

