ייעול השימוש במשאבי הענן

לפני אירוע שיא, כדאי לנהל ולבצע אופטימיזציה של המשאבים שעומסי העבודה שלכם ב- Google Cloud משתמשים בהם. כדי לעשות את זה צריך לבחור את הגודל המתאים לפי השימוש והביקוש בפועל, להשתמש בהתאמה אוטומטית לעומס בשביל להקצות משאבים בצורה דינמית ולבדוק את ההמלצות בקשר לאבטחה ולארכיטקטורה. גם Cloud Monitoring וגם שירות ההמלצות (Active Assist) יכולים לעזור לכם לזהות הזדמנויות לאופטימיזציה של משאבי הענן. בעזרת הכלים האלה אתם יכולים לקבל תובנות לגבי השימוש במשאבים ולקבל החלטות מושכלות לפני האירוע.

בדיקת השיטות המומלצות ל- Google Cloud

אפשר להימנע מהרבה בעיות קיבולת באירועי שיא אם פועלים לפי השיטות המומלצות למוצר שאתם משתמשים בו ב- Google Cloud . ריכזנו כאן דוגמאות למדריכי שיטות מומלצות:

כללי
BigQuery
Cloud Storage
Compute Engine
Dataflow
Dataproc
Google Kubernetes Engine

בדיקת המדרגיות

באמצעות התאמה אוטומטית לעומס (automatic scaling) אפשר לוודא שלאפליקציות מבוססות-הענן יש את המשאבים הנדרשים בשביל לטפל בעומסי עבודה משתנים, בלי הקצאת יתר ועלויות מיותרות. ב- Google Cloud יש כמה אפשרויות לשימוש בהתאמה אוטומטית לעומס (automatic scaling) בהתאם למוצר. למשל:

  • קבוצות של מופעי מכונה מנוהלים (MIG) ב-Compute Engine הן קבוצות של מכונות וירטואליות שמנוהלות ומותאמות לעומס בתור ישות אחת. באמצעות קבוצות MIG אפשר להגדיר מדיניות להתאמה אוטומטית לעומס (automatic scaling), שמצוין בה המספר המינימלי והמקסימלי של מכונות וירטואליות שצריך לשמר בקבוצה, ואת התנאים שמפעילים את ההתאמה האוטומטית לעומס.
  • התאמה אוטומטית לעומס ב-Google Kubernetes Engine‏ (GKE) מאפשרת להתאים את משאבי האשכול לצרכים של האפליקציה באופן דינמי. יש בה כלים לייעול של ניצול המשאבים, להשפעה על ביצועי האפליקציות ולפישוט ניהול האשכולות.
  • ב-Cloud Run מובנית התאמה אוטומטית לעומס (automatic scaling) שמשנה באופן אוטומטי את מספר המכונות בהתאם לתעבורת הנתונים הנכנסת.

לפני האירוע, מומלץ להרחיב אנכית בהתאם לעומס (scale up) באופן ידני. יכול להיות שכבר הגדרתם התאמה אוטומטית לעומס, אבל בגלל קצב ההתקדמות של תעבורת הנתונים באירוע יש אפשרות שההתאמה האוטומטית לעומס לא תעמוד בביקוש. לכן כדאי להכין מראש משאבים כמו:

  • מכונות וירטואליות
  • מטמונים, אם רוצים טעינה מקדימה
  • רכיבים בלי שרת (serverless), כדי למנוע הפעלות במצב התחלתי (cold start)

בדיקת ההמלצות של Active Assist

‫Active Assist יוצר המלצות ומסקנות שיעזרו לכם לייעל את הפרויקטים ב-Google Cloud בהתאם למגוון הכלים השונים של Google Cloud . מהו Active Assist?

בדיקת גרסאות המוצרים

חשוב לוודא שכל המוצרים והשירותים שלכם בענן מעודכנים לגרסה היציבה האחרונה.

בדיקת ההתראות ומרכזי הבקרה

כדי לזהות ולטפל בבעיות באופן יזום, אפשר לבצע הערכה של ההתראות ולוחות הבקרה שמקבלים באמצעות כלים של Google Cloud Observability ופתרונות של צד שלישי.

כדאי לבדוק את המדדים, היומנים ויומני המעקב ב-Google Cloud Observability כדי לקבל תובנות לגבי ניצול המשאבים, מאפייני הביצועים והמצב הכללי של המשאבים. אתם יכולים לעקוב אחרי מדדים חשובים שתואמים לאינדיקטורים של בריאות המערכת, כמו ניצול המעבד (CPU), שימוש בזיכרון, תנועה ברשת, קלט/פלט (I/O) בדיסק וזמני תגובה של אפליקציות. כדאי גם להתייחס למדדים ספציפיים לעסק. מעקב אחרי המדדים האלה מאפשר לזהות צווארי בקבוק פוטנציאליים, בעיות בביצועים ומגבלות של משאבים. אפשר גם להגדיר התראות כדי להודיע לצוותים הרלוונטיים באופן יזום על בעיות או אנומליות פוטנציאליות.

כדאי שההתראות יהיו ממוקדות למדדים קריטיים, מוגדרות לפי ערכי סף מתאימים כדי למזער את התשישות מהתראות ולוודא שבעיות משמעותיות יקבלו מענה בזמן מתאים. הגישה הממוקדת מאפשרת לשמור על האמינות של עומסי העבודה באופן יזום. מידע נוסף מופיע בסקירה הכללית על התראות.

המאמרים הבאים