בעידן שבו הבינה המלאכותית ממשיכה להפוך את פני התעשייה, חברות רבות מחפשות תשתיות עלות-יעילות שיהיו זמינות לפיתוח והפצה מהירים. כדי לענות על הביקוש הזה, אינטל השיקה היום (ג') את Xeon 6 עם ליבות ביצועים (P-cores) ומאיצי AI Gaudi 3, מחזקת את מחויבותה לספק מערכות AI חזקות עם ביצועים מיטביים לכל ואט ועלות בעלות כוללת נמוכה (TCO).
גם את המעבד Xeon 6 וגם את מאיץ הבינה המלאכותית Gaudi 3 פיתחו בישראל. המאיץ פותח על ידי הבאנה לאבס (Habana Labs) חברת בת של אינטל. כאשר המאיץ החדש של החברה מציע יחס ביצעועים-מחיר מנצח אל מול המתחרה הגדולה של אינטל אנבידיה.
"הביקוש לבינה מלאכותית גורם לשינוי מהפכני במרכזי הנתונים, והתעשייה דורשת אופציות בחומרה, תוכנה וכלים למפתחים," אמר ג'סטין הוטארד, סגן נשיא בכיר ומנהל כללי של קבוצת מרכזי הנתונים והבינה המלאכותית באינטל. "עם השקת Xeon 6 עם P-cores ומאיצי AI Gaudi 3, אינטל מאפשרת אקוסיסטם פתוח שמאפשר ללקוחותינו ליישם את כל עומסי העבודה שלהם עם ביצועים, יעילות ובטיחות גבוהים יותר."
אינטל מציגה את הדור השישי של מעבדי Xeon עם ליבות P ומאיצי ה- AI Gaudi 3, שני חידושים מרכזיים בתשתית ה- AI שלה. מעבד ה- Xeon 6 עם ליבות P מיועד לטפל בעומסי עבודה מחשוביים ביעילות יוצאת דופן, ומספק ביצועים כפולים מאלו של קודמו. הוא כולל מספר ליבות גבוה יותר, רוחב פס זיכרון כפול ויכולות האצת AI מוטמעות בכל ליבה. מאיץ ה- AI Gaudi 3, שמותאם במיוחד ל- AI גנרטיבי בקנה מידה גדול, מתהדר ב- 64 ליבות מעבד טנסור (TPCs) ושמונה מנועי כפל מטריצות (MMEs) להאצת חישובי רשתות עצביות עמוקות. הוא כולל 128 ג'יגה-בייט של זיכרון HBM2e לאימון והיסק, ו- 24 יציאות Ethernet במהירות 200 ג'יגה-ביט לרשתות ניתנות לקנה מידה. אינטל הודיעה לאחרונה על שיתוף פעולה עם IBM להפצת מאיצי ה- AI Gaudi 3 כשירות בענן של IBM. באמצעות שיתוף הפעולה הזה, אינטל ו- IBM שואפות להוריד את עלות הבעלות הכוללת כדי לנצל ולהרחיב את ה- AI, תוך שיפור הביצועים.
הטמעת מערכות AI בקנה מידה גדול כרוכה בשיקולים כגון אפשרויות הטמעה גמישות, יחסי ביצוע-מחיר תחרותיים וטכנולוגיות AI נגישות. תשתית x86 האמינה של אינטל והאקוסיסטם הפתוח הרחב שלה ממקמים אותה לתמוך בארגונים בבניית מערכות AI בעלות ערך גבוה עם TCO אופטימלי וביצוע לכל ואט. באופן משמעותי, 73% מהשרתים המואצים ב-GPU משתמשים ב-CPU של אינטל Xeon כמארח.
אינטל שותפה עם OEMs מובילים כולל Dell Technologies ו-Supermicro לפיתוח מערכות משותפות המותאמות לצרכים ספציפיים של לקוחות להטמעות AI יעילות. Dell Technologies כעת משתפת פעולה בפיתוח פתרונות מבוססי RAG המנצלים את Gaudi 3 ו-Xeon 6.
גישור הפער מאבות טיפוס (Prototypes) , למערכות מוכנות לייצור עם מאמצי שיתוף פעולה
מעבר של פתרונות AI גנרטיביים (Gen AI) מאבות טיפוס למערכות מוכנות לייצור מציג אתגרים בניטור בזמן אמת, טיפול בשגיאות, רישום, אבטחה וקנה מידה. אינטל מתמודדת עם אתגרים אלו דרך מאמצי שיתוף פעולה עם OEMs ושותפים לספק פתרונות RAG מוכנים לייצור.
פתרונות אלו, הבנויים על פלטפורמת Open Platform Enterprise AI (OPEA), משלבים מיקרו שירות מבוססות OPEA לתוך מערכת RAG ניתנת לקנה מידה, מותאמת למערכות AI של Xeon ו-Gaudi, מעוצבת לאפשר ללקוחות לשלב בקלות יישומים מ-Kubernetes, Red Hat OpenShift AI ו-Red Hat Enterprise Linux AI.
הרחבת הגישה ליישומי AI לארגונים
תיק ה-Tiber של אינטל מציע פתרונות עסקיים לטיפול באתגרים כמו גישה, עלות, מורכבות, אבטחה, יעילות וקנה מידה בסביבות AI, ענן וקצה. ענן המפתחים של Intel Tiber כעת מספק מערכות תצוגה של Intel Xeon 6 להערכה טכנולוגית ובדיקות. בנוסף, לקוחות נבחרים יזכו לגישה מוקדמת ל-Intel Gaudi 3 לאימות הפצות מודלי AI, עם אשכולות Gaudi 3 שיתחילו להתגלגל ברבעון הבא להפצות ייצור בקנה מידה גדול.
השירותים החדשים כוללים את SeekrFlow, פלטפורמת AI מקצה לקצה מבית Seekr לפיתוח יישומי AI מהימנים. העדכונים האחרונים כוללים את השחרור החדש ביותר של תוכנת Intel Gaudi ומחברות Jupyter עם PyTorch 2.4 וכלי Intel oneAPI ו-AI 2024.2, הכוללים יכולות תאוצה חדשות ל-AI ותמיכה במעבדי Xeon 6.
מעבדי Xeon 6 זמינים כעת ללקוחות נבחרים, וזמינות רחבה יותר צפויה ברבעונים הקרובים. מאיצי Gaudi 3 יהיו זמינים לקהל הרחב בין הרבעון השלישי של 2024 לרבעון הראשון של 2025.