שירותי ענן מאפשרים לקדם מחקר פורץ דרך.
במאמר זה נציג סיפור לקוח של קבוצת מחקר מאוניברסיטת בן-גוריון אשר השתמשה בשירותי ענן לטובת קידום מחקר וכיצד השימוש בענן אפשר ביצועים ועלויות אשר לא היו אפשריים בסביבת המחשוב המקומי.
חוקרים בקבוצת פיזיקת החומרים, חלק מהמחלקה להנדסת חומרים באוניברסיטת בן-גוריון, לומדים ומפתחים מודלים של תכונות פיזיקליות ומכניות של חומרים בתנאים קיצוניים. תחום המחקר הזה מיושם בלימודי מדע חומרים בסיסיים ועיצוב חומרים חדשניים. אחד המחקרים בקבוצה מתמקד ב-dislocations ("נקעים") במתכות באמצעות סימולציות נומריות. dislocations מהווים גורם קריטי עבור התכונות המכניות של חומרים גבישיים, ביניהם מתכות. לימוד והבנת תופעה זו הם מכריעים בכל יישום, תהליך ייצור או מוצר בו ישנה חשיבות עליונה לתכונות המכניות של החומר. החל ממברגים וציוד גולף וכלה במכשירים רפואיים, כלי רכב ורקטות, הבנת dislocations היא הבסיס לייצור מוצרי מתכת בטוחים, חזקים ואמינים יותר.
אף על פי שחוקרים נקעים כבר למעלה ממאה שנה, הבעיה הייתה תמיד הקושי להשיג גישה לטווחי הזמן והאורך הרלוונטיים של התהליכים. בעוד שחלק מהתהליכים הללו כוללים קבוצות של dislocations אינדיבידואליים רבים המשתלבים באינטראקציה כקולקטיב לאורך זמן של שניות ושעות, תהליכים בסיסיים שכוללים dislocations אינדיבידואליים מתרחשים תוך כמה מיליוניות בודדות של מיליארדרית שנייה ולאורכם של כמה אטומים בלבד.
"הפער העצום הזה בהיקפי זמן ואורך הוא בלתי ניתן למחקר, מבחינה ניסויית וחישובית, בשיטה אחת", אומר אייל אורן, סטודנט לתואר שלישי וחוקר בקבוצה. "חלקים מצירי הזמן והאורך נגישים לניסוי. למשל, נוכל ללמוד את ההתנהגות הקולקטיבית של נקעים לאורך שניות וימים. אבל הקצוות הקטנים לא היו בהישג יד עד תחילת שנות התשעים, אז הופיעו חומרה ותוכנה שסיפקו כוח חישוב מספק."
מדידה מעבר לאטומים
לאורך שנים תהליכים רבים הקשורים ל-dislocations שוחזרו בהצלחה בסימולציות אטומיסטיות, ובכך אומתו מחקרים תיאורטיים וניסיוניים קודמים. אך תהליכים אלה היו רלוונטיים רק להיקפי אורך וזמן קצרים במיוחד – מכיוון שהסימולציות היו ברמת האטום. לכן המחקר מתמקד בדרכים להסיק מסקנות המתאימות לאורכים ולזמנים גדולים וארוכים יותר ממה שמאפשרים מודלים אטומיסטיים. מכיוון ש-dislocations הם, למעשה, פגמים קוויים בסריג המושלם של האטומים המרכיבים את הגביש, ניתן היה להעביר את המאפיינים התיאורטיים והמאומתים של ה-dislocations לקוד של סימולציות אחרות כדי לתאר נפחי חומר גדולים יותר לאורך טווחי זמן ארוכים יותר, מכיוון שהאובייקטים אשר עברו סימולציה כבר לא היו אטומים.
תופעה חשובה בתנועת dislocations מכונה "cross slip". קודים קיימים המדמים dislocations באופן ישיר, חסרי יכולת לכלול את התופעה, בדיוק בגלל היעדר ידע מפורט על התהליך. כדי להבין את תופעת cross slip, תדמיינו כי dislocations עוברים ממישור הגביש, בו הם "גולשים", למישור גביש אחר. זה מאפשר להם לעקוף מכשולים המעכבים תנועה בזמן שמתרחש עיוות פלסטי (בלתי הפיך) של החומר. במתכות רבות, כגון אלומיניום או נחושת, ה-dislocations אינם חופשיים לעבור למישור אחר. על מנת לעשות זאת, עליהם להתגבר על מחסום אנרגיה. מחסום זה הוא פונקציה של החומר, כמו גם תנאי המאמץ והטמפרטורה המופעלים. לכן, cross slip הוא למעשה זהה מתמטית לכל תהליך קינטי אחר, אותו ניתן לדמות במעבדה. "על ידי סימולציה של מקרים רבים באותם התנאים בחומר מסוים, אנו יכולים לצבור נתונים סטטיסטיים של 'מגיבים' ו-'תוצרים'," מסביר אורן. נתונים סטטיסטיים אלה מאפשרים לנו לחשב את המאפיינים הקינטיים של תופעת ה-cross slip של החומר. בעזרת הידע שנוצר, התקווה היא שיהיה ניתן למקד מחקר עתידי בעזרת תוכנות סימולציה של קני מידה גדולים יותר.
יותר סימולציות
סימולציות נוספות מספקות סטטיסטיקות טובות יותר ומורידות אי וודאות. האתגר הוא כיצד להשיג זאת בצורה המהירה והמשתלמת ביותר. הצוות בדק אפשרויות on premise, אך היה ברור שלמחקר זה, הצעה מבוזרת וגמישה יותר של ספק ענן ציבורי הייתה הפתרון האופטימלי.
בתמיכת מרכז החישובים הבין-אוניברסיטאי (מחב"א), המציע מגוון שירותי ענן ציבורי לחוקרים אקדמיים באוניברסיטת בן-גוריון ולכל אוניברסיטאות המחקר בישראל, שורטט מפרט ותוכנית לשירותים שלAmazon Web Services (AWS) וניכנס להרצה.
שרתים וירטואליים במודל Amazon Spot אפשרו לצוות המחקר להכפיל את מספר הסימולציות הפועלות לכל מצב תרמו-דינמי, במקביל לסימולציות שפועלות במכונות בסביבת ה-Data Center המקומי. עבור חישובים אלה המשאב החשוב ביותר היה כמות מעבדים ולכן סוגי שרתים מ"משפחת c" היו הבחירה הטבעית, עם שרתים של עד 96 מעבדים. התוצאה הייתה הקטנת אי הוודאות – והכל בו זמנית. יתר על כן, העובדה שבשלב זה החישובים היו ב"Production mode" פירושה שלא היה צורך לבדוק את הסימולציות מקרוב. לפיכך, הפרעות לריצות של סימולציות ארוכות כבר לא היוו בעיה מאחר שכל סימולציה נשמרה במרווחי זמן קבועים, ובמקביל התנהגות הפרעה לשרת הוגדרה כ"stop" במקום ברירת המחדל "terminate".
במקביל, הקבוצה הצליחה לחסוך הרבה מאוד כסף ביחס ל-demand instances – עד כ 75% הנחה ממחיר המחירון הרשמי של AWS באותו אזור גיאוגרפי. "בדרך זו," אמר אורן, 'שריפת הכסף' באמצעות מודל של שכירת שרתים בענן לא הייתה משמעותית. כעת, כאשר אנו נמצאים בשלב ה-Production, הקמת שרתים וירטואליים במודל Amazon Spot הפכה למודל הרכישה המועדף לעומת רכישת שרתים במודל On demand. למעשה, השימוש בפתרון ענן ציבורי הועיל גם בשלב הפיתוח, כאשר בוצעו הדמיות גדולות שלא ניתן היה לעשות בסביבת ה-Data Center המקומי. AWS עזרו לנו להתגבר על מחסור זמני במשאבים."
אייל אסטרין, ארכיטקט הענן במחב"א מציין כי השילוב של תשתית ענן, מודל תשלום מבוסס שימוש בפועל והיכולת לבצע שינויי משאבים בהתאם לצורכי מחקר משתנים ובצורה פשוטה, מקטין את התלות בחומרה פיזית ומסייע לקידום מחקר פורץ דרך.
למידע נוסף על המחקר:
https://doi.org/10.1016/j.commatsci.2017.06.039