טעות קטנה בדטה סנטר..

נובמבר 6, 2013 at 1:23 pm כתיבת תגובה

ידיעה קטנה בעיתונות תפסה את עיני:  במשך כשעה פחות או יותר, משתמשים ברחבי העולם לא הצליחו להעלות פוסטים ולסמן לייקים בפייסבוק בשל בעיה בדטה סנטר של פייסבוק.  מפייסבוק נמסר ש"מוקדם יותר היום הבוקר (שעון ארה"ב), בזמן ביצוע עבודות תחזוקה, חווינו אירוע אשר מנע מחלק מהמשתמשים להעלות פוסטים לפייסבוק לפרק זמן קצר. פתרנו את הבעיה במהירות והמערכת שבה לפעול בתפקוד מלא. אנו מתנצלים על אי הנוחות אשר נגרמה".

למרות היותי חובב גאדג'טים וטכנולוגיה אינני מנוי בפייסבוק, כנראה בשל הפרעת אישיות כלשהי.  נפילת פייסבוק אם כך לא הפריעה לי מאוד במישור האישי, שגרת יומי לא הופרעה ומצב רוחי לא נפגע. אך דבר מה קטן נוסף לכד את עיני:  מניית פייסבוק נפלה עקב האירוע ב- 0.6%.  לא נורא, נכון?  ובכן, בשווי שוק של  כ-100 מיליארד דולר, 0.6% זה 600 מיליון דולר.  קצת הרבה בשביל טעות טכנאי בזמן תחזוקה.

ידוע ש 60% מהאירועים המביאים לנפילה של חוות שרתים הם תוצאה של בעיות בתכנון ותפעול של התשתית הפיזית, כלומר, מיזוג אוויר , חשמל ותשתית תקשורת. לא סוד הוא שבישראל מרבית חוות השרתים מיושנות ברמת התשתית וסובלות מרעב תקציבי מתמשך. זה מתבטא במיזוג אוויר לא יעיל, בניהול כבילה בעייתי, בחוסר מוכנות לרעידות אדמה, ובמערכות חשמל מאולתרות. התוצאה הישירה היא סיכון לרציפות העסקית.  נשאלת השאלה אם כך, האם ניתן לכמת את הסיכון?

רבות נכתב על הערכת העלות של זמן דמימה ( downtime ) של חוות שרתים.  הערכת העלות לשעה של זמן דמימה נעה בין אלפי דולרים לארגונים קטנים ועד לעשרות מיליונים לשעה עבור ארגונים פיננסיים גדולים. הערכת הנזק מחושבת בדרך כלל על בסיס ערך העסקאות שעורך הארגון בתקופת זמן יחד עם הערכה גסה של עלות אובדן מוניטין ואיבוד לקוחות. המקרה של פייסבוק מאיר צד נוסף של הבעיה. הנזק לבעלי המניות עקב הפגיעה במחיר המניה. לא אתפלא אם העלות של מניעה אפקטיבית של הבעיה שהתעוררה בפייסבוק היא אלפית מהנזק שספגו בעלי המניות. 600 מיליון דולר כבר אמרנו?

לא אחת אני שותף לתסכולו של סמנכ"ל הטכנולוגיות בארגון, אשר מזהה את הסיכון אך לא מצליח להשיג תקציב למזעור הסיכונים. מקרה פייסבוק מאפשר למנמ"ר לפנות למנכ"ל ולחברי הדירקטוריון ולשאול אותם: " מה יקרה למחיר המניה, אם חוות השרתים, חוט השדרה של העסק שלנו, תידום לשעה? יום? שלושה ימים?"

סקר ביצועים וסיכונים בחוות שרתים הכרחי כדי לחשוף בעיות שיכולות לסכן את הרציפות העסקית. בחברת אלכסנדר שניידר אנו מבצעים סקר של חדרי שרתים ומזהים

1. סיכונים לרציפות העסקית
2. פוטנציאל לשיפור ביעילות האנרגטית ובהוצאות התפעול
3. דרכים למקסם את התשתית הקיימת כדי לתמוך בעוד מערכות ( Hidden Capacity )

Entry filed under: Best Practices, Data center, Tier 1, Tier 3, tier 4, Uncategorized, אולמות מחשב, חוות שרתים, מרכזי נתונים, ניהול חדרי מחשב, רציפות עסקית חוות שרתים, שרידות. Tags: , , , , .

קורס של ג'ון ברייס בנושא ניהול חוות שרתים חוות שרתים בבניה מודולארית

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת /  לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת /  לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת /  לשנות )

מתחבר ל-%s

Trackback this post  |  Subscribe to the comments via RSS Feed


פידים

הבלוג הוקם ומנוהל בסיוע:


%d בלוגרים אהבו את זה: