הכנה לאירוע בקיבולת שיא


במדריך הזה מוסבר איך מתכוננים לאירועים עם קיבולת שיא ונפח גבוה של תעבורת נתונים, כדי לספק את השירותים עם כמה שפחות זמן השבתה (או לא בכלל) ובלי לפגוע באיכות השירות או בחוויית המשתמש.

בניהול אירועים בענן יש שלושה שלבים:

  1. הכנה: בשלב הזה מתכוננים לאירוע, עם משימות כמו בדיקת הארכיטקטורה, תכנון הקיבולת ויצירת מקומות שמורים.
  2. הרצה: כשהאירוע מתחיל, עוקבים אחריו מקרוב ופותרים בעיות כשצריך.
  3. ניתוח: אחרי שהאירוע מסתיים, מנתחים אותו כדי לראות מה היה טוב, מה לא היה טוב ואיך אפשר להשתפר לקראת האירועים הבאים.

במדריך הזה אנחנו מתמקדים בשלב ההכנה.

רשימת המשימות

ההכנה לאירוע עם קיבולת שיא כוללת את המשימות הבאות:


לחצו על תראו לי איך כדי לקרוא הסבר מפורט על המשימה ישירות במסוף Google Cloud :

תראו לי איך


לפני שמתחילים

חשוב שתבינו אילו שירותי הכנה לאירועים אתם יכולים לקבל במסגרת חבילת התמיכה שלכם ב-Customer Care:

  • Enhanced Support: יש לכם גישה לתמיכה באירועים מתוכננים – שירות מסוג Value-Add Service שמיועד לשלבים הקריטיים של אירועים דיגיטליים קצרי-טווח. בעזרת השירות הזה, אתם יכולים להתכונן טוב יותר לאירועים עם הרבה תעבורת נתונים, כמו פתיחות חגיגיות, השקות של מוצרים חדשים או העברת נתונים.

  • Premium Support: יש לכם גישה לשירות ניהול שמיועד לאירועי שיא מתוכננים, כמו השקות של מוצרים או ימי מכירות גדולים. נציגי שירות הלקוחות יעבדו מולכם כדי להכין תוכנית ויעזרו לכם בדרכים שונות לפני ובמהלך כל האירוע:

    • הכנת המערכות לרגעים משמעותיים ועומסי עבודה גדולים
    • הרצת בדיקות לאסונות כדי לפתור בצורה יזומה בעיות פוטנציאליות
    • פיתוח והטמעה של פתרונות מהירים, כדי למזער את ההשפעה של כל בעיה שעלולה לצוץ

    אחרי האירוע, מנהל החשבונות הטכני (TAM) יעבור יחד איתכם על המסקנות וייתן לכם המלצות לאירועים הבאים. אתם יכולים לפנות אליו כדי להתחיל להיעזר בו.

להבין איך מומלץ לנהל את האירוע

הכנו לכם כמה המלצות שכדאי להכיר לפני שאתם מנהלים אירועים:

  1. תכנון האירוע לפרטי פרטים: כשאתם מתכוננים לקראת אירוע עם קיבולת שיא, כדאי שתיעזרו בצוות ניהול החשבון או במנהל החשבונות הטכני. יחד תוכלו לבדוק את הארכיטקטורה, ליצור דיאגרמות, ציר זמן ורשימות משימות להשקה, לבדוק אם המכסות בשירות מתאימות לפרופיל תעבורת הנתונים החזויה ולהסיק מה תהיה ההשפעה הכוללת על הפרויקטים שלכם.

  2. מעקב אחרי התפקוד ומענה בהתאם: כשתקופת השיא או אירוע ההשקה מתחילים, אתם צריכים להיות עם יד על הדופק כדי שתוכלו להגיב לפי הצורך. אם יהיה לכם נוהל מפורט לניהול אירועי אבטחה והעברה לטיפול ברמה גבוהה יותר, ייקח לכם פחות זמן ופחות מאמץ כדי לטפל בכל בעיה שתצוץ.

  3. ניתוח האירוע והסקת מסקנות: בסיום תקופת השיא או אירוע ההשקה, נתחו את מה שהיה והכינו מסמך עם מסקנות, כדי שתוכלו ליישם אותן באירוע הגדול הבא.

כדאי לקרוא בהרחבה את ההמלצות לניהול אירועים.

לבקש ולשריין קיבולת מתאימה לאירוע

תכנון הקיבולת הוא חלק קריטי בשלב ההכנה לקראת אירועים עם קיבולת שיא, נפח גבוה של תעבורת נתונים או אירועי השקה: אתם צריכים לוודא שכמות משאבי הענן והמכסות הקיימות מתאימות לצרכים שלכם, כדי שעומסי העבודה יפעלו בלי תקלות בלתי צפויות. איך משריינים קיבולת לאירוע?

שימוש ב-Capacity Planner

בעזרת Capacity Planner אתם יכולים לראות מה היו נתוני השימוש ומה התחזיות של המכונות הווירטואליות, הדיסקים לאחסון מתמיד ויחידות ה-GPU. אתם גם יכולים לראות את הבקשות לשמירת מקום, לשריין מקום מראש למשאבים, לנהל את מכסות הפרויקט ולהגדיר בקשות אוטומטיות להגדלת המכסות. איך רואים את נתוני השימוש והתחזיות ב-Capacity Planner?

  1. פותחים את הדף Capacity Planner במסוף Google Cloud .

    כניסה לדף Capacity Planner

  2. בכלי לבחירת משאבים בסרגל הכלים של המסוף, בוחרים פרויקט, תיקייה או ארגון.

  3. בוחרים את סוג המשאב של Compute Engine שרוצים לראות את נתוני השימוש שלו:

    • כדי לראות את נתוני השימוש של המכונות הווירטואליות, לוחצים על הכרטיסייה Virtual machine, אם היא לא מסומנת.

    • כדי לראות את נתוני השימוש של דיסקים לאחסון מתמיד, לוחצים על הכרטיסייה Disk.

    • כדי לראות את נתוני השימוש של יחידות ה-GPU, לוחצים על הכרטיסייה GPU.

  4. אתם יכולים לסנן אלמנטים כדי לראות תרשימים שונים לנתוני השימוש ולתחזיות של אותו משאב.

הפעלת הכלי לשינוי המכסות

הכלי לשינוי המכסות עוקב אחרי השימוש שלכם במשאבים ויוזם בשמכם בקשות לשינוי המכסות, כדי שלא תצטרכו לשלוח אותן בעצמכם. איך פועל הכלי לשינוי המכסות?

  1. במסוף Google Cloud , פותחים את הדף IAM & Admin > הדף Quotas and system limits.

    כניסה לדף Quotas and system limits

  2. לוחצים על הכרטיסייה Configurations.

  3. כדי להפעיל את הכלי לשינוי המכסות, מפעילים את המתג שליד Enable.

אם בעמודה Status כתוב Enabled, סימן שהכלי לשינוי המכסות פועל. הוא עוקב אחרי השימוש שלכם ושולח בשמכם בקשות לשינוי המכסות כשאתם מתקרבים אליהן.

שליחת בקשה לשינוי המכסות

אם המכסות לא מספיקות לצרכים שלכם, אתם יכולים לבקש לשנות אותן. איך רואים ומנהלים את המכסות?

  1. במסוף Google Cloud , פותחים את הדף IAM & Admin > הדף Quotas and system limits.

    כניסה לדף Quotas and system limits

  2. מסמנים את התיבה ליד המכסה שרוצים לשנות.

    אפשר גם לחפש מכסה באמצעות השדה ‎ Filter‎.

  3. לוחצים על ‎ Edit‎. החלונית Quota changes תיפתח.

  4. מקלידים את המכסה החדשה הרצויה בשדה New value. חלק מהמכסות מבוססות על יחידת מידה. במקרה כזה, בוחרים את היחידה מהרשימה שליד.

  5. אם מופיעה הודעה על כך שהמכסה החדשה תהיה גבוהה מערך ברירת המחדל, כדי לשלוח את הבקשה מסמנים את התיבה ולוחצים על Apply for higher quota.

  6. מתארים את הבקשה בשדה Request description ולוחצים על Done.

  7. לוחצים על Next ומזינים פרטים ליצירת קשר.

  8. לוחצים על Submit request.

אם הבקשה להגדלת המכסה תידחה, תוכלו לנסות שוב באחת משתי דרכים: יצירת בקשת תמיכה או פנייה ישירות לצוות ניהול החשבון או למנהל החשבון הטכני.

יצירת בקשה לשמירת מקום

אתם יכולים לשמור מקום כדי לוודא שמתי שתצטרכו, יהיו לכם משאבים ב-Compute Engine בשביל ליצור מכונות וירטואליות עם אותה חומרה (זיכרון ו-vCPU) ומשאבים אופציונליים (יחידות GPU ודיסקים מקומיים של SSD מקומיים).

אם הקיבולת שביקשתם פנויה, יוקצה לכם מקום שמור על פי דרישה. אתם יכולים גם לשריין מראש מקום שמור לעתיד. מומלץ לשלוח את הבקשה לשמירת מקום לעתיד מספיק זמן לפני האירוע. איך מבקשים לשמור מקום למשאבים של תחום מוגדר ב-Compute Engine?

שליחת בקשה לשמור מקום על פי דרישה לפרויקט מסוים

  1. פותחים את הדף Reservations במסוף Google Cloud .

    כניסה לדף Reservations

  2. בכרטיסייה On-demand reservations (ברירת המחדל), לוחצים על ‎ Create reservation‎.

    ייפתח הדף Create a reservation.

  3. נותנים לבקשה שם בשדה Name.

  4. בשדות Region ו-Zone, בוחרים את האזור והתחום שבהם רוצים לשמור מקום למשאבים.

  5. בשדה Share type בוחרים באפשרות Local (אם היא עדיין לא מסומנת).

  6. כדי לשמור מקום למכונות וירטואליות של GPU שמיועדות למשימות אימון בהתאמה אישית או למשימות חיזוי של Vertex AI, בקטע Google Cloud services בוחרים באפשרות Share reservation.

  7. בוחרים אפשרות בשדה Use with VM instance:

    • כדי להשתמש אוטומטית במכונות וירטואליות שמתאימות לפרטי הבקשה, מסמנים את האפשרות Use reservation automatically (אם היא עדיין לא מסומנת).

    • כדי להשתמש במשאבים שמתאימים לפרטי הבקשה רק כשיוצרים מכונות וירטואליות שמיועדות ספציפית אליה (לפי שם), בוחרים באפשרות Select specific reservation.

  8. בשדה Number of VM instances מקלידים את מספר המכונות שרוצים לשריין.

  9. בקטע Machine configuration מבצעים את הפעולות הבאות:

    1. כדי להשתמש במאפיינים מתבנית מכונה קיימת, בוחרים באפשרות Use instance template.

    2. בוחרים תבנית מכונה. אם בוחרים תבנית של מכונה אזורית, אפשר לשריין משאבים רק באזור הזה.

  10. כדי שהבקשה לשמירת מקום תימחק אוטומטית בשעה מסוימת, מסמנים את התיבה Enable auto-delete. מתי זה שימושי? למשל כשמתכננים להפסיק את השימוש במשאבים ששוריינו ורוצים למנוע חיובים לא נחוצים.

  11. לוחצים על Create כדי ליצור את הבקשה לשמירת מקום.

    ייפתח הדף Reservations והבקשה תיווצר תוך כדקה.

שליחת בקשה לשריון מקום שמור לעתיד לפרויקט מסוים

  1. פותחים את הדף Reservations במסוף Google Cloud .

    כניסה לדף Reservations

  2. לוחצים על הכרטיסייה Future reservations.

  3. לוחצים על ‎ Create future reservation‎.

    ייפתח הדף Create a future reservation.

  4. נותנים לבקשה שם בשדה Name.

  5. מזינים קידומת לשם בשדה Prefix. כל שם של בקשה שנוצרה אוטומטית מאותה בקשה למקום שמור לעתיד יתחיל בקידומת הזו.

  6. בשדות Region ו-Zone, בוחרים את האזור והתחום שבהם רוצים לשמור משאבים.

  7. בשדה Start time, כותבים את שעת ההתחלה של שמירת המקום. שעת ההתחלה של בקשת מקום שמור לעתיד יכולה להיות עד שנה קדימה. כדי שיהיה לכם מספיק זמן לשנות, לבטל או למחוק את הבקשה למקום שמור לעתיד לפני שהיא ננעלת, כדאי לציין שעת התחלה מומלצת.

  8. בשדה End time כותבים את שעת הסיום של שמירת המקום. בקטע Duration summary אתם יכולים לראות את משך שמירת המקום. כדי להגדיל את הסיכוי שהבקשה למקום שמור לעתיד תאושר ב- Google Cloud , כדאי להשתמש בתקופה המומלצת לשמירת מקום.

  9. בקטע Share type, מסמנים את האפשרות Local (אם היא עדיין לא מסומנת).

  10. בשדה Total capacity needed, מציינים את המספר הכולל של המכונות הווירטואליות שרוצים לשריין לאותה תקופה, לפי ההגדרות והפרויקטים שצוינו בבקשה למקום שמור לעתיד.

  11. בקטע Machine configuration מבצעים את הפעולות הבאות:

    1. בוחרים באפשרות Use instance template.

    2. בוחרים תבנית מכונה בשדה Instance template. אם בוחרים תבנית של מכונה אזורית, אפשר לשריין משאבים רק באזור הזה.

  12. בקטע Auto-generated reservations auto-delete, מבצעים אחת מהפעולות הבאות:

    • כדי לאפשר ל-Compute Engine למחוק את שאר הבקשות שנוצרו אוטומטית מבקשה למקום שמור לעתיד:

      1. לוחצים על המתג Enable auto-delete כדי להפעיל אותו (אם הוא עדיין לא פועל).

      2. אם רוצים, מזינים בשדה Auto-delete time את התאריך והשעה למחיקת הבקשות שנוצרו אוטומטית. התאריך והשעה צריכים להיות אחרי מועד הסיום של שמירת המקום. אם תשאירו את השדה ריק, הבקשות שנוצרו אוטומטית יימחקו תוך שעתיים מסיום שמירת המקום.

    • אם לא רוצים שהבקשות יימחקו אוטומטית, לוחצים על המתג Enable auto-delete כדי להשבית אותו.

  13. כדי לשמור טיוטה של הבקשה, לוחצים על Save a draft.

ייפתח הדף Reservations והבקשה תיווצר תוך כדקה.

להתכונן לפתרון מהיר של בעיות במהלך האירוע

הדרך שבה אתם מסווגים אירועים, מגיבים להם ופותרים אותם בהתאם לרמת החומרה יכולה להשפיע משמעותית על היכולת לעבוד במהלך אירוע. לכן חשוב להשתמש במערכת מרכזית לניהול אירועי אבטחה כדי לעקוב כמו שצריך אחרי כל שלבי האירוע.

בנוסף לבדיקת אנשי הקשר הרלוונטיים ולהפעלת המרכז האישי ב-Service Health, כדאי:

  • לקרוא מה השיטות המומלצות לעבודה עם Customer Care
  • ליצור תוכנית תקשורת
  • לוודא שיש גישה

איך מתכוננים לפתרון בעיות במהלך האירוע?

בדיקת אנשי הקשר

מהרבה מהשירותים של Google Cloud נשלחות התראות כדי לשתף מידע חשוב עם משתמשי Google Cloud . כברירת מחדל, ההתראות האלה נשלחות למשתמשים עם תפקידים מסוימים בממשק לניהול זהויות והרשאות גישה (IAM). אתם יכולים להשתמש ב-Essential Contacts כדי לספק רשימה של אנשי קשר שיקבלו התראות. איך בוחרים מי יקבל התראות?

  1. במסוף Google Cloud , פותחים את הדף IAM & Admin >Essential Contacts.

    כניסה לדף Essential Contacts

  2. מוודאים ששם הפרויקט, התיקייה או הארגון מופיע בכלי לבחירת משאבים בסרגל הכלים של המסוף. בכלי לבחירת משאבים אפשר לראות באיזה פרויקט, תיקייה או ארגון מנוהלים כרגע אנשי הקשר.

  3. כדי לראות את רשימת אנשי הקשר בחלוקה לקטגוריות, לוחצים על Category. כדי לראות את רשימת אנשי הקשר לפי סדר האלף-בית, לוחצים על Contacts.

הפעלת המרכז האישי ב-Service Health

המרכז האישי שלכם ב-Service Health הוא המקום שבו אתם יכולים לזהות בעיות שרלוונטיות לפרויקטים שלכם ב- Google Cloud , כדי להיות בעניינים ולטפל בהן ביעילות. כדי לקבל מידע נוסף, קראו את הסקירה הכללית על המרכז האישי ב-Service Health.

חשוב לוודא לפני האירוע שה-Service Health API פועל ושלארגון יש גישה למרכז הבקרה ויכולת להגדיר התראות. כדי לקבל מידע נוסף, קראו את המאמר ניהול הגישה למרכז האישי ב-Service Health.

  1. במסוף Google Cloud , בוחרים או יוצרים פרויקט ב- Google Cloud .

    כניסה לדף לבחירת הפרויקט

  2. Enable the Service Health API.

    Enable the API

לנהל ולייעל את השימוש במשאבי הענן

חשוב לנהל את המשאבים שבהם משתמשים עומסי העבודה ב- Google Cloudכדי להתייעל. כדי לעשות את זה, צריך לבחור את הגודל המתאים לפי השימוש והביקוש בפועל, להשתמש בהתאמה אוטומטית לעומס בשביל להקצות משאבים בצורה דינמית ולבדוק את ההמלצות בקשר לאבטחה ולארכיטקטורה.

חוץ מבדיקת ההמלצות של Active Assist, כדאי גם:

  • לקרוא את השיטות המומלצות ל- Google Cloud
  • לבדוק את המדרגיות
  • לבדוק את גרסאות המוצרים
  • לבדוק את ההתראות ואת מרכזי הבקרה

למידע נוסף, קראו את המאמר ייעול השימוש במשאבי הענן.

בדיקת ההמלצות של Active Assist

‫Active Assist יוצר המלצות ומסקנות שיעזרו לכם לייעל את הפרויקטים ב-Google Cloud בהתאם למגוון הכלים השונים של Google Cloud . מהו Active Assist?

  1. פותחים את הדף Recommendation Hub במסוף Google Cloud .

    כניסה ל-Recommendation Hub

  2. בכלי לבחירת משאבים בסרגל הכלים של המסוף, בוחרים פרויקט, תיקייה או ארגון ב-Google Cloud .

    אם יש לכם את ההרשאות המתאימות ברמת הארגון או התיקייה, אתם יכולים לראות המלצות באותם ארגון או תיקייה, גם אם אין לכם הרשאות ספציפיות לתיקיות ולפרויקטים שהם מכילים.

  3. בחלונית הניווט, לוחצים על All recommendations.

    תראו רשימה של המלצות. אתם יכולים לסנן, למיין ולשתף אותן, לבדוק כל אחת בפירוט, לראות לאילו משאבים היא מתייחסת ולהבין מה תהיה ההשפעה של יישום ההמלצה.

  4. כדי לראות את פרטי ההמלצה, לוחצים עליה בעמודה Recommendation.

    תראו נתונים רלוונטיים שיעזרו לכם להחליט אם ליישם אותה או לא.

  5. אם יש לכם את ההרשאות המתאימות, אתם יכולים ללחוץ על ההמלצה כדי ליישם אותה או ללחוץ על הכפתור השני כדי לסגור אותה.

    חשוב לזכור שאת חלק מההמלצות לא מיישמים ישירות, אלא צריך לפעול לפי ההוראות שמופיעות במסוף.

לקבוע ולערוך בדיקות עומס

בדיקות עומס יכולות לעזור לכם להחליט אם, כשהעומס על המערכת יגדל, היא תעמוד בזה ולמצוא צווארי בקבוק שעלולים ליצור בעיות.

  1. כשלושה עד חמישה חודשים לפני האירוע, כדאי לבצע בדיקות עומס על פרויקטים ועומסי עבודה קריטיים כדי לדמות את תעבורת הנתונים החזויה בשיא.

  2. בדקו את המכסות וההשלכות על העלויות של בדיקות העומס, והחליטו אם כדאי ליצור התראות לגבי התקציב בחשבון לחיוב ב-Cloud כדי להיות עם יד על הדופק בקשר להוצאות על השירותים שתשתמשו בהם הכי הרבה.

  3. אחרי כל בדיקה, עברו על התוצאות. אתם יכולים להיעזר ב-Capacity Planner כדי להמחיש את נתוני השימוש והתחזיות, ואם צריך – לבקש להגדיל את המכסות. כדי לקבל מידע נוסף, קראו במסמך הזה את החלקים שימוש ב-Capacity Planner ואיך שולחים בקשה לשינוי המכסות.

צריכים עזרה? אתם תמיד יכולים לפנות לצוות ניהול החשבון או למנהל החשבון הטכני. הם יוכלו לעזור לכם לתכנן את השינויים בארכיטקטורה ולהכין את המסמכים הדרושים כדי לשפר את האמינות והזמינות של השירותים.

לקבוע ולערוך בדיקה של תוכנית התאוששות מאסון (DR)

אסטרטגיה טובה לתוכנית התאוששות מאסון, כזו שבדקתם היטב, יכולה לעזור לכם למזער את ההשפעה של שיבושים בשירות, לקצר את זמני ההתאוששות ולחזור מהר יותר לפעילות כשמשהו משתבש.

האסטרטגיה צריכה לכלול תיאור מפורט של מה שצריך לעשות במקרי חירום, פעולות הגיבוי ונוהלי ההתאוששות.

  1. כחודש עד שלושה חודשים לפני האירוע, חשוב לבצע סימולציות של תרחישי אסונות כדי לזהות פערים בין תוכניות ההתאוששות מאסון לרמת המוּכנוּת (readiness) בפועל.

  2. אחרי כל בדיקה, עברו על התוצאות כדי לקבוע אם צריך לשנות את הארכיטקטורה ולייעל את השימוש במשאבים. כדי לקבל מידע נוסף, קראו במסמך הזה איך מנהלים ומייעלים את השימוש במשאבי הענן.

צוות ניהול החשבון ומנהל החשבון הטכני יכולים לעזור לכם לבדוק את התוכנית, ולהבין איך אפשר לשפר את תהליך התגובה לאירועים. כדי לקבל מידע נוסף, קראו את המדריך לתכנון התאוששות מאסון.

סיכום מקורות המידע

בטבלה הבאה מפורטים המדריכים שאנחנו מפנים אליהם במסמך הזה, לפי החלקים השונים.

להבין איך מומלץ לנהל את האירוע
לבקש ולשריין קיבולת מתאימה לאירוע
להתכונן לפתרון מהיר של בעיות במהלך האירוע
לנהל ולייעל את השימוש במשאבי הענן
לקבוע ולערוך בדיקות עומס
לקבוע ולערוך בדיקה של תוכנית התאוששות מאסון (DR)

המאמרים הבאים