Posts tagged ‘tier 4’
שדה הקרב של הדברים – The Battlefield of Things
מאפייני שדה הקרב משתנים לנגד עינינו. ל IT יש תפקיד מכריע בשדה הקרב המודרני וכמובן, התשתית הקריטית היא בחוות השרתים. בעוד העולם האזרחי מדבר על האינטרנט של הדברים, צבאות העולם מיישמים כבר את שדה הקרב של הדברים – The Battlefield of Things.
האינטרנט של הדברים ( IoT- The Internet of Things ) או כפי שנהוג לומר היום ( IoE – The Internet of Everything ) מעצב כל פרט בחיינו. כולנו הפכנו לנשאים של מיקרומעבדים, מצלמות וחיישנים באמצעות מכשירי ה Mobile והאפליקציות שלהם. עמודי תאורה נהפכים לתחנות WIFI ונושאים מצלמות מקוונות כחלק מ Safe City, רכבים נהיים מקוונים, אוטומציה מפעלית עוברת מהפיכה, בקרה אל-חוטית על מוצרים דוממים, שליטה מרחוק על מכשור ביתי ועוד.
אין בכוונתי ללעוס מחדש מה שמדובר עליו בכל כך הרבה מאמרים אלא להצביע על המקביל הצבאי של ה IoT והוא BoT – שדה הקרב של הדברים: BattleField of Things . שדה הקרב של הדברים מורכב ממערכות ניידות -מקוונות הכוללות כלי טיס בלתי מאוישים, ספינות בלתי מאוישות, רכבי סיור בלתי מאוישים, מצלמות גבול, גלאי מנהרות , מכשור ונשק של חייל החי"ר, ועוד.
כלי רכב בלתי מאויש תוצרת אלביט
האתגרים דומים: אבטחת מידע, ביג-דאטה, מחשוב ענן, קצבי תקשורת גדלים במהירות….
אני מניח שידעתם שאגיע לנושא חוות השרתים. ובכן, "חדרי המנועים" של האינטרנט של הדברים ושדה הקרב של הדברים הם חוות שרתים. ה"עננים" הערטילאיים הם דווקא מאוד מוחשים ויושבים בחוות שרתים מאובטחות וממגונות, כך לפחות אנו רוצים לקוות.
כדי לתמוך בקליטת הטכנולוגיות החדשות, חוות השרתים משנה את פניה. חוקי התכנון משתנים. בכדי לחלוק את הידע, פיתחנו באלכסנדר שניידר קורס לתכנון והקמה של חוות שרתים. אתם מוזמנים.
מה הקשר בין Tier3 או Tier 4 למיגון חוות שרתים מפני הדף?
אין קשר.
נשאלתי לא פעם על דרישות "תקן" של חוות שרתים למיגון מפני נפילות טילים, גדלי מטען שונים ועוצמות הדף. בדרך כלל השאלה היא ספציפית לגבי tier 3.
ובכן, ה Tier System אינו מתייחס לאיומי מלחמה ולמיגון חוות השרתים מפני איומי מלחמה. ולכן אין זכר במסמכי ה Uptime Institute לעובי בטון, עומק המתקן, ולגודל המטען. ועל כן, ידידי היקרים אין מנוס מן המסקנה שנשארנו לבד. אין תקן נפוץ בתעשיה שרלבנטי לחוות שרתים ולמיגונם בעת מלחמה.
ניתן לאמץ כללי חשיבה של tier 4 לאיומי מלחמה. לדוגמא, N לאחר כל כשל. מידור המערכות הוא עיקרון נוסף שכדאי לאמץ. דוגמא נוספת, קירור רציף. אני סבור שרמה 3 (תחזוקה ללא השבתה) אינה רלבנטית לאיום זה.
קיימת אי הבנה כלשהי בישראל לגבי כללי הסיווג לפי רמות של הuptime. ניתן להתעדכן בנושא בימי עיון ללקוחות שאנו עושים במרכז ההדרכה שלנו באלכסנדר שניידר או בקורס מנהל דטה סנטר בג'ון ברייס.
PDU לארונות שרתים: מבוקר או מנוהל?
האם יש עדיין טעם להצטייד בפסי שקעים "בסיסיים" לארונות שרתים?
פס השקעים הידוע בכינוי RPDU, הפך לחלק משמעותי ומעניין בחוות השרתים. כיום נהוגים מס' סוגים של פסי שקעים:
1. פסי שקעים מנוטרים – כאלו שמודדים ומציגים באמצעות צג מקומי את צריכת החשמל
2. פסי שקעים חכמים – מודדים ומציגים את צריכת החשמל ושולחים התראות דרך הרשת
3. פסי שקעים מנוהלים- יש בהם את יכולות הפסים החכמים + מאפשרים כיבוי והדלקה מרחוק
במה לבחור אם כך?
אני מאמין שהתשתית הפיזית של חוות השרתים חייבת לתמוך בשלושת יעדי העל:
1. רציפות עסקית
2. זמינות ( קיבולת בכל זמן)
3. עלות כוללת
לטעמי, פסי שקעים חכמים הם המינימום ההכרחי:
1. רציפות עסקית – כמעט כל חוות שרתים רצינית משקיעה ביתירות כלשהי. עם פס שקעים בסיסי, אין ערובה לשום יתירות. וזאת משום שללא בקרה, קל מאוד להעמיס את פסי השקעים בעומס העובר את ה 50%. במקרה של קריסת אחת ה"רגליים" יועמס פס השקעים הנותר ביותר מ 100% ויקרוס. עמו יקרוס גם ארון השרתים (במקרה הטוב). כלומר ההשקעה העצומה ביתירות (שרתים בעלי שתי הזנות המובילות לשני פסי שקעים ומשם לשני לוחות חשמל, לשתי מערכות אל פסק וכו) מתבזבזת בשל חיסכון תמוה על פס השקעים.
לאנגלים יש ביטוי טוב לתאר זאת:
"penny wise and pound foolish"
פס שקעים חכם יתן לנו התראה כאשר נעבור רמת סף של עומס אותה נגדיר אנחנו. לדוגמא 45%. לדיון מעמיק ראו פוסט קודם.
2. זמינות: השקענו בחוות שרתים ואנו רוצים לנצל את ההשקעה במלואה. איך זה שמרבית הארונות ריקים למחצה ומנהל החווה מתלונן שאין לו יכולת לקלוט ציוד חדש? ובכן, בכדי לדעת אם ארון השרתים מולנו יכול לקלוט ציוד נוסף הצורך, נניח, עוד 2 קילו-וואט, עלינו לדעת כמה צורך הארון שלפנינו. פס שקעים חכם המחובר לתוכנת שליטה כגון Power IQ , יציג את צריכת הארון שלפנינו לאורך זמן. כך נדע ברמת ביטחון גבוהה אם נוכל להוסיף ציוד לארון וכמה.
3. עלות כוללת: ניטור צריכת החשמל ברמת הארון נותן לנו את האפשרות ליזום שיפורים בתחום היעילות האנרגטית ולחסוך כסף רב לארגון אותו ניתן לנצל להתעצמות. בנוסף, ניטור מאפשר ניתוח עלות-תועלת של רכישת שרתים חדשים.
טיפים נוספים לבחירה נבונה:
– הטמפרטורה בחלקו האחורי של הארון יכולה היום להגיע ל 50 מעלות. ולכן, חשוב לבחור פסי שקעים חכמים העומדים בטמפרטורות של 60 מעלות.
-תכנון המאפשר מינימום טעויות אנוש:
כיסוי למפסקים, קליפים למניעה של ניתוק לא מכוון של כבלים , לדים וסימון צבעים לפאזות השונות.
חוות שרתים בבניה מודולארית
הקונגרס בארה"ב חוקק חוק הקובע שכל חוות השרתים החדשות של הממשלה הפדרלית ייבנו בטכנולוגיה מודולארית. במה מדובר?
בניה של חוות שרתים מצריכה השקעה ראשונית משמעותית. השקעה זו גדלה עם דרישות היתירות והמיגון. עם זאת, לא רבים יודעים שהוצאות התפעול, בעיקר חשבון החשמל, מגמדות את ההשקעה הראשונית. לתופעה זו ייחדתי לא מעט פוסטים ולא נדון בכך עכשיו.
היתרונות של הדטה סנטר המודולארי הם משמעותיים ביותר:
1. זמן תכנון הנמדד בשבועות לעומת חודשים בגישה המסורתית
2. זמן הקמה קצר: 5-6 חודשים לעומת 24-36 חודשים של חוות שרתים מסורתית זאת בניגוד לחוות שרתים מדור 1.0 שהיא תמיד יחידה ומיוחדת ואין כמוה בעולם ועל כן הסיכון הוא תמיד גדול יותר.
3. תכנון מוכח ומנוסה ואף הוסמך ל טיר 3
4. עלות ההקמה נמוכה יותר בגישה המודולארית משום שיש יתרון כלכלי בייצור על פס ייצור לעומת בניה יחידנית.
5. כל מי שניהל פרויקט בינוי מורכב יודע שחלק גדול מהעלות והסיבה לחריגות בתקציב הוא התארכות הפרויקט מעבר ללו"ז המקורי. פרויקטים ממשלתיים אורכים שנים רבות. במגזר הפרטי, שנתיים. בבנקאות שלוש שנים. בשיטה המודולארית, זמן ההקמה הוא 5-6 חודשים מההזמנה ולכן הסיכון להתארכות הפרויקט קטן מאוד.
6. חוות שרתים מודולארית יכולה להיבנות בשלבים. ועל כן ניתן להתחיל בהשקעה קטנה יותר ובתקציב נוח יותר לארגון.
7. עלות המימון קטנה בהרבה כאשר בונים מודולארית
8. עלות התפעול זולה יותר. זאת משום שחוות שרתים מודולארית יכולה להיות מאוד יעילה מבחינה אנרגטית
9. עדכנות טכנולוגית: מערכות המחשוב/תקשורת/אחסון מתפתחות בקצב מואץ של דור אחד לכל שנתיים-שלוש. מערכות התשתית של הדטה סנטר מתפתחות בקצב איטי יותר של כל 5-6 שנים בערך. בשיטה המודולארית, ניתן להתקדם עם הטכנולוגיה ולהגיב לצרכים משתנים באופן ממוקד ללא השפעה על כלל המתקן.
10. עמידות במפגעים פיזיים טובה יותר בשיטה המודולארית. לדוגמא, דליקה בחוות שרתים מסורתית תשבית את כל המתקן. בחווה מודולרית, יושבת רק המודול היחידי בו אירע האירוע.
11. מערכת שו"ב מובנית בכל מודול חוסכת עלות משמעותית של פרויקט שו"ב
אם נחזור לשאלה המקורית בתחילת הפוסט, הממשל הפדרלי החליט לחסוך כסף. רעיון לא רע, גם אם מדובר בכספי ציבור.
בתמונה אתר של חוות שרתים מודולארית בניו-ג'רזי. האתר מתוכנן ל 100 מגה וואט מתוכו כ 50% בערך כבר מאוכלס. התמונה מראה את החלק הראשון של המתקן בגודל של 3 מגה-וואט שהיה מוכן לפעולה 95 יום אחרי החוזה
החסרונות: זה לא למתקנים קטנים. לטעמי, גודל מינימאלי הוא 800 קילו-וואט. עוד חיסרון: נדרש גובה של כ 6 מטר בערך בין רצפת הבטון לתקרה.
טעות קטנה בדטה סנטר..
ידיעה קטנה בעיתונות תפסה את עיני: במשך כשעה פחות או יותר, משתמשים ברחבי העולם לא הצליחו להעלות פוסטים ולסמן לייקים בפייסבוק בשל בעיה בדטה סנטר של פייסבוק. מפייסבוק נמסר ש"מוקדם יותר היום הבוקר (שעון ארה"ב), בזמן ביצוע עבודות תחזוקה, חווינו אירוע אשר מנע מחלק מהמשתמשים להעלות פוסטים לפייסבוק לפרק זמן קצר. פתרנו את הבעיה במהירות והמערכת שבה לפעול בתפקוד מלא. אנו מתנצלים על אי הנוחות אשר נגרמה".
למרות היותי חובב גאדג'טים וטכנולוגיה אינני מנוי בפייסבוק, כנראה בשל הפרעת אישיות כלשהי. נפילת פייסבוק אם כך לא הפריעה לי מאוד במישור האישי, שגרת יומי לא הופרעה ומצב רוחי לא נפגע. אך דבר מה קטן נוסף לכד את עיני: מניית פייסבוק נפלה עקב האירוע ב- 0.6%. לא נורא, נכון? ובכן, בשווי שוק של כ-100 מיליארד דולר, 0.6% זה 600 מיליון דולר. קצת הרבה בשביל טעות טכנאי בזמן תחזוקה.
ידוע ש 60% מהאירועים המביאים לנפילה של חוות שרתים הם תוצאה של בעיות בתכנון ותפעול של התשתית הפיזית, כלומר, מיזוג אוויר , חשמל ותשתית תקשורת. לא סוד הוא שבישראל מרבית חוות השרתים מיושנות ברמת התשתית וסובלות מרעב תקציבי מתמשך. זה מתבטא במיזוג אוויר לא יעיל, בניהול כבילה בעייתי, בחוסר מוכנות לרעידות אדמה, ובמערכות חשמל מאולתרות. התוצאה הישירה היא סיכון לרציפות העסקית. נשאלת השאלה אם כך, האם ניתן לכמת את הסיכון?
רבות נכתב על הערכת העלות של זמן דמימה ( downtime ) של חוות שרתים. הערכת העלות לשעה של זמן דמימה נעה בין אלפי דולרים לארגונים קטנים ועד לעשרות מיליונים לשעה עבור ארגונים פיננסיים גדולים. הערכת הנזק מחושבת בדרך כלל על בסיס ערך העסקאות שעורך הארגון בתקופת זמן יחד עם הערכה גסה של עלות אובדן מוניטין ואיבוד לקוחות. המקרה של פייסבוק מאיר צד נוסף של הבעיה. הנזק לבעלי המניות עקב הפגיעה במחיר המניה. לא אתפלא אם העלות של מניעה אפקטיבית של הבעיה שהתעוררה בפייסבוק היא אלפית מהנזק שספגו בעלי המניות. 600 מיליון דולר כבר אמרנו?
לא אחת אני שותף לתסכולו של סמנכ"ל הטכנולוגיות בארגון, אשר מזהה את הסיכון אך לא מצליח להשיג תקציב למזעור הסיכונים. מקרה פייסבוק מאפשר למנמ"ר לפנות למנכ"ל ולחברי הדירקטוריון ולשאול אותם: " מה יקרה למחיר המניה, אם חוות השרתים, חוט השדרה של העסק שלנו, תידום לשעה? יום? שלושה ימים?"
סקר ביצועים וסיכונים בחוות שרתים הכרחי כדי לחשוף בעיות שיכולות לסכן את הרציפות העסקית. בחברת אלכסנדר שניידר אנו מבצעים סקר של חדרי שרתים ומזהים
1. סיכונים לרציפות העסקית
2. פוטנציאל לשיפור ביעילות האנרגטית ובהוצאות התפעול
3. דרכים למקסם את התשתית הקיימת כדי לתמוך בעוד מערכות ( Hidden Capacity )
מחשבות על תרגיל פיקוד העורף לבדיקת מוכנות לרעידת אדמה
תרגיל המוכנות לרעידת אדמה – האם מובנות ההשלכות של הסיכון על המשק? לא בטוח
המשרד להגנת העורף מקיים השבוע תרגיל לבדיקת מוכנות העורף לרעידת אדמה ואפילו לצונאמי. התרחיש עפ"י מקורות רשמיים הוא " רעידת אדמה חזקה פוקדת את ישראל בערבה ובגליל העליון וזורעת הרס גם בגוש דן. כפועל יוצא פוגעים גם גלי צונאמי בחופי תל אביב. כוחות פיקוד העורף יידרשו להתמודד במהלך התרגיל עם כ-7,000 "הרוגים" בתרחיש, 70 אלף נפגעים ו-170 אלף איש אשר ייאלצו להתפנות מבתיהם" .
אין ספק שזהו תרחיש מדאיג וטוב עושים השר דיכטר ואלוף פיקוד העורף ביוזמת התרגיל. עם זאת, אני רוצה להוסיף כמה מילים לתרחיש הנ"ל שהם פועל יוצא הכרחי של רעידת אדמה בעוצמה זו: " בשל עוצמת הרעש קרסו תשתיות המחשוב של הבנקים הגדולים, של חברות התקשורת הקוית והסלולרית, של ספקי האינטרנט , של בתי החולים, של עיריות תל אביב וחיפה, של המשטרה ושל צה"ל. בחלק מן המקרים יידרשו שלושה עד שישה חודשים לשוב ליכולת מליאה" .
במה מדובר? ישאל הקורא בתמיהה. אנסה לענות כמיטב יכולתי.
המשק של כלכלה מודרנית מבוסס על תשתיות מחשוב. חלקים קריטיים של תשתיות המחשוב הללו מרוכזים באולמות הקרויים מרכזי מחשוב או חדרי מחשב. כל החברות הגדולות במשק, פרטיות וציבוריות כמו גם הצבא ומשרדי הממשלה תלויים בחדרי מחשב אלו. בלעדיהם, החברות הללו משותקות. חדרי המחשב בישראל, רובם ככולם, לא תוכננו לעמוד ברעידת אדמה של 7 בסולם ריכטר וגם לא של 6.
המסקנה המיידית היא שאם יתממש תרחיש של רעידת האדמה בעצמה של 7.1, לא תהיה תקשורת טלפונית וגם לא אינטרנט. הרמזורים לא יעבדו, הכספומטים לא יאפשרו משיכת כספים, בתי החולים יהיו בתוהו ובוהו, חברות היי טק ומפעלים ישותקו, שרותים ממשלתיים לא יהיו זמינים, ותפקוד שרותי ההצלה והביטחון ייפגע קשות. לא לשעות אלא לשבועות ואף לחודשים.
אתעלם לפי שעה מההשלכות על פינוי וטיפול בנפגעים ואתרכז בהשלכות על המשק . באין בנקים, באין תקשורת ובאין פעילות תעשייתית, המשק ישותק, ההתאששות תארך חודשים והנזק הכלכלי יהיה עצום.
המסקנה היא שעל המשק להיערך לא רק לפינוי וטיפול בנפגעים ובחסרי קורת גג אלא גם להבטיח שההתאוששות של המשק מהאסון תהיה מהירה. לשם כך, יש לטפל בעקב אכילס של החברה המודרנית – הפגיעות הגדולה של האמצעים הטכנולוגיים שאנו תלויים בהם.
החדשות הטובות, אם ניתן לקרוא להן כך, הן שבניגוד לעלות העצומה של חיזוק מבנים, חיסון חדרי המחשב (שיכוך) הוא בר ביצוע בזמן קצר יחסית ובעלות נמוכה. החדשות הרעות הן שקברניטי המשק, בסקטור הפרטי והציבורי, כולל אלו המופקדים על מל"ח (משק לשעת חירום) מתעלמים מסיכון זה ואינם נוקטים בפעולות ממשיות להקטנת הסיכון ולהיערכות.
ביפן ובארה"ב נפוץ שימוש בבסיס סייסמי המוצב מתחת לארונות ה IT. שיטה זו אפשרה למרכזי המחשוב של יפן לעמוד גם ברעידת האדמה של 2011 – 9.1 בסולם ריכטר. בסיס סייסמי זה הקרוי ISOBASE אושר גם על ידי ממשלת ארה"ב ועומד בתקינת NEBS. ראו פוסט קודם
תכנון חדרי מחשב וחוות שרתים

זה הסטנדרט המומלץ של אלכסנדר שניידר
למנמ"ר המתכנן את מרכז המחשוב ( datacenter ) החדש של הארגון, יש הזדמנות לנצל נוהגים מתקדמים ( Best Practices ) בתכנון חדרי שרתים, ולשפר את התשתית עליה נשען מערך ה IT תוך חיסכון בעלות כוללת. להלן "עשר הדיברות"
1.TCO – הגדירו את רמת היתירות הנדרשת וחשבו את העלות כוללת ל 10 עד 15 שנים. השקעה ראשונית גדולה במס' אחוזים יכולה לחסוך עשרות אחוזים ב TCO.
2.בחירת השרתים גם על פי צריכת האנרגיה – עלות התפעול (בעיקר אנרגיה חשמלית) של שרת לאורך שלוש שנים גבוהה יותר מעלות השרת עצמו. בחרו בחוכמה שכן השוני בין השרתים הוא משמעותי.
3.וירטואליזציה – שימוש בוירטואליזציה מאפשר חיסכון משמעותי ברכש חומרה ובעלות התפעול של חוות השרתים. עם זאת, צריכת האנרגיה של שרת פיזי שעליו 5-20 שרתים וירטואליים גבוהה משמעותית מבעבר ויש צורך בחשיבה עדכנית בתשתית החשמל ומיזוג האוויר.
4.צפיפות מחשוב גבוהה – העלות הכוללת של חדר שרתים עם צפיפות מחשוב גבוהה ( high density ) נמוכה משמעותית ממרכזי מחשוב המפזרים את המחשוב על שטח רצפה נרחב. עם זאת, נדרשת חשיבה מקצועית וחדשנית להתמודדות עם כבילה צפופה, תשתית חשמל ומיזוג אוויר לצפיפות גבוהה. כדאי להתגבר על הנטייה להיצמד לשיטות עבר – החיסכון הוא משמעותי.
5.מודולאריות בתכנון – השקעה בציוד תשתית לעומס מקסימאלי כבר בתחילת חיי חדר המחשב היא מתכון לבזבוז ולשיתוק היכולת לאמץ טכנולוגיות חדשות עם הזמן. תכנון מודולארי מאפשר מדרוג ההשקעה לאורך שנים ( pay as you grow ) וחיסכון משמעותי ב TCO. מודולאריות מאפשרת גם שימוש אופטימאלי בטכנולוגיות מתקדמות ובמוצרים חדישים.
6. מיזוג אוויר חדשני וממוקד. המיזוג הממוקד מאפשר התמודדות עם כל עומס, חיסכון באנרגיה חשמלית וניצול מיטבי של ההשקעה בתשתית. עם זאת, היזהרו ממוכרנים שממוקדים רק במה שכדאי להם למכור . ישנן מגוון שיטות כגון קירור פנים-ארון, קירור חדר, קירור שורה ולכל אחת מאלו ואריציות שונות. מה נכון? כל פרויקט לגופו על פי הדרישות, הצרכים והאילוצים. טיפ חשוב: בחדרים בהם מיזוג האוויר מבוסס על צ'ילרים: דרשו ממתכנן מיזוג האוויר לתכנן לפי טמפ' מים קרים של לפחות 12 מעלות צלזיוס. רצוי אף יותר. זה יביא לחיסכון עצום בצריכת החשמל ותקבלו הרבה יותר מהמערכות שהתקנתם.
7. הפרדה מוחלטת של אוויר קר ואוויר חם – אחת הסיבות העיקריות לבזבוז העצום במיזוג אוויר ובחשמל בחוות שרתים הוא חוסר ההפרדה בין אוויר קר לחם. שימוש בפנלים עיוורים הוא חובה בסיסית עם החזר השקעה של יומיים בערך. הפרדה בין המעבר הקר למעבר החם יכולה גם היא להביא לחיסכון משמעותי. גם כאן יש כר נרחב של אפשרויות: סגירת מעבר הקר (עם או בלי מערכות קירור מים), סגירת המעבר החם ( רק בשילוב מערכות קירור מים), שיטה היברידית ועוד.
8.ניהול בזמן אמת באמצעות כלי תוכנה – קצת עצוב שהתשתיות הפיזיות של חוות השרתים בישראל מנוהלות בדרך כלל בגיליונות אקסל. קיימים כלי תוכנה ( SPM, DC Track, Power IQ ) קלים לשימוש המאפשרים ניצול מיטבי של ההשקעה בתשתית, הצגת לוח מחוונים ( Dashboard ) בזמן אמיתי והעיקר: יכולת תגובה מהירה לשינויים.
9. מדידה ובקרה – אי אפשר לנהל ולייעל את מה שאינו נמדד. חיישנים וכלי תוכנה מתקדמים מודדים את יעילות צריכת האנרגיה ( PUE ) ומידת השימוש בתשתיות ומאפשרים קבלת החלטות ניהוליות מושכלות. לדוגמא: חישוב קל של החזר השקעה של IT Refresh .
10. הסמכה מבצעית של חדרי שרתים – טבען של תקלות בתכנון וביצוע של חדרי שרתים חדשים, הוא שהן מתגלות זמן רב לאחר העלייה לאוויר עם הצמיחה הטבעית בעומס. תקלות אלו גורמות לזמן דמימה ( downtime ) של חדרי שרתים קריטיים לארגון. ההסמכה המבצעית של אלכסנדר שניידר בוחנת תחת עומס אמיתי את כל מערכות חדר השרתים: מיזוג אוויר, חשמל , יתירות ויעילות אנרגטית. הבדיקה היא באמצעות אמולטורים של חומרה , חיישנים מתקדמים ותוכנת בקרה ייעודית. ההסמכה המבצעית מורידה דרמטית את ההסתברות לתקלות תשתית ומגלה את כל הבעיות לפני הכנסת מערכות האמת של ה IT לחדר השרתים החדש כאשר כל המערכות עדיין באחריות וכל המתכננים והקבלנים עדיין זמינים.
ארגון אשר יישם את עשרת הנוהגים המתקדמים הללו ויפנים את העקרונות שעיצבו אותם, ישפר משמעותית את יכולת חוות השרתים להגיב לצרכי הארגון, ויוכל לחסוך לארגון כספים רבים שישמשו אותו להקצאת משאבים להתעצמות.
אנו מקיימים ימי עיון לעיתים קרובות בנושא תכנון וניהול חדרי שרתים. למעוניינים כתבו לטלי שרון tali@schneider.co.il
מרכז ההדרכה למנהלי חוות שרתים
באופן שגרתי, אנו עורכים ימי עיון בנושא ניהול חדרי מחשב וחוות שרתים לללקוחות אלכסנדר שניידר. זוהי הזדמנות מצוינת לצוותי IT, מיזוג אוויר וחשמל של הארגון להסב מסביב לשולחן במקום נייטראלי, לשמוע הדרכות בנושא ניהול חדרי מחשב ולדון בצרכים ובתוכניות של חוות השרתים שלהם.
בדרך כלל מדובר ביום מלא ואינטנסיבי אם כי לעיתים עורכים יום מקוצר כדי להתמקד בנושא בוער או בשניים.
מאחר ושקפים זה עניין שיכול להתיש, בנינו חדר שרתים עובד לצורך הדגמה. מדובר בחוות שרתים עובדת ופעילה שנבנתה לצרכי המחשה והדרכה כך שניתן לבקר בחדר, לגעת וללמוד באופן חופשי.
נושאי ההדרכה קשורים כולם לתשתית הפיזית של ה datacenter: ניהול, בקרה, חשמל, מיזוג אוויר, תקשורת נחושת ואופטיקה, ניהול כבילה, יעילות אנרגטית, תכנון העמדה ועוד. הדגש הוא על נוהגים מיטביים – BEST PRACTICES בניהול חוות שרתים.
בחדר השרתים להמחשה תראו הדגמות לנושאים רבים: ארונות שרתים מסוגים שונים, PDU מסוגים שונים, פסי צבירה מודולאריים, קירור שורה ( In Row ), קירור ארון (In Rack ), ארונות עם קירור מים, סגירת מעבר קר, ארונות ארובה, ארונות תקשורת ייעודיים לסיסקו, פתרונות ניהול כבילה, הארקה של חוות שרתים, נחושת ואופטיקה בצפיפות גבוהה, תיעול כבילה, תוכנות ואמצעי בקרה, תוכנות ניהול ועוד נושאים רבים אחרים.
ההדרכות מתקיימות בתיאום מראש ללקוחות מתחומי ה IT, מיזוג אוויר, חשמל ושו"ב.
לשאלות ותיאום tali@schneider.co.il . אתם מוזמנים.
גל של חדשנות שוטף את תחום חוות השרתים
גל של חדשנות שוטף את טכנולוגיות הדטה סנטר בעולם ובישראל. תחום חדרי המחשב היה תמיד פעיל ברמה המסחרית אך מנומנם ברמה הטכנולוגית. לפני שארחיב, חשוב להבהיר שטור זה מתמקד בטכנולוגיות של התשתית הפיזית של חדרי המחשב. לא הייתי מציין זאת אלמלא ידעתי שרבים מחברי בתחום ה IT מעדיפים לרכז את משאביהם וזמנם בשכבות IT אחרות, גבוהות יותר, ושנושאים כגון מערכות ניהול חוות שרתים ומיזוג אוויר ממוקד שלא לדבר על חיסכון בצריכת חשמל גורם להם לעייפות ולנמנום. מאחר ואיני רוצה להשחית את זמנו של אף אחד, ואיני שואב הנאה רבה מלהטיף לאוזניים ערלות, אני מזהיר מראש: מי שלא מעוניין להתעמק בנושא הדטה סנטר ומחשוב ירוק, זה הזמן לעבור הלאה.עתה כשנותרנו מיעוט קטן (אך איכותי!) אפשר להתעמק בדברים.
לפני מס' חודשים נועדתי עם חברה המתכננת חדר מחשב חדש שיעלה לאוויר, לפי תוכניותיהם, ב 2015. אמנם אני מצדיע לחברות ישראליות החושבות לטווח ארוך, אך הדבר גרם לי להרהר בלוחות הזמנים הנהוגים לעיתים בתעשייה שלנו. פרויקט הקמה של אולם מחשוב הוא פרויקט בפני עצמו. יצירת אומנות יחידנית אשר הכול בה מפותח מאפס ונתפר כולו לפי צרכי הלקוח. נכון? לא בהכרח.
מאחר וחברה מקימה לעצמה חדר מחשב אחת לכל 5 עד 20 שנים, הרי כשארגון מבקש להקים לעצמו חדר מחשב חדש, זו התנסות חדשה לרוב מובילי הפרויקט. אל צוות המפעל חוברים יועצים וקבלנים חיצוניים שלהם יותר ניסיון (אנו מקווים) ונוצר צוות פרויקט אשר אין לו ניסיון משותף. הצוות מתחיל את התכנון מאפס (דבר משתלם ביותר למתכננים) ונשען על ידע לא מושלם ולא עדכני. זו הסיבה העיקרית לכך ששלב התכנון אורך בדרך כלל חודשים רבים (במקרים אחדים גם מספר שנים), כמו גם שלב הבניה, ושהפרויקט ברובו מבוסס על ניסוי וטעייה ולא על נוהגים מיטביים.
גם בהתחשב בעבודה הקשה של צוות הפרויקט, עלות התמשכות הפרויקט והטעויות בהחלטות התכנוניות עולים לארגון כסף רב. התוצאה הסופית היא חדר מחשב ייחודי באמת אשר אין זהה לו והדבר נזכר כאן לא כמחמאה (אולי להיפך) אלא כציון עובדה.
התופעות הללו מתרחשות לא רק בחדרי מחשב הנבנים במבנה חדש על קרקע בתולית (Greenfield data center ) אלא גם בפרויקטים של שדרוג חדרי מחשב ( datacenter upgrade ). גם כאן מדובר בהוספת יכולות של אספקת חשמל ומיזוג אוויר וגם כאן צוותים שהוקמו אד-הוק עובדים כדי לשדרג את חדר מחשב במינימום עלויות והשבתה.
כדי לפתור בעיות מסוג אלו, אחת המגמות המתחזקות בתחום חדרי השרתים היא חדרי מחשב מודולאריים בבנייה טרומית המבוססים על מודולים בתצורות אשר נוסו ונבדקו במפעל ( pre-configured ), וקל להתקינם באתר ולדעת מראש את רמת הביצועים שנקבל ( Pre-engineered ). הרחבה והגדלה ניתנים לביצוע בקלות יחסית.
גם כאן הנוהגים המיטביים מאפשרים היום הוספת מודולים פנימיים ( Pods ) כגון ה SMART AISLE של אמרסון המכילים מס' משתנה של ארונות שרתים, מערכות מיזוג ממוקד ( כגון מערכות קירור ארון או קירור שורה) ומערכות חלוקת חשמל (כגון פסי צבירה של STARLINE ) המורידות באופן דרמטי את זמני התכנון והיישום הנדרשים כמו גם את העלויות.
דוגמא נאה לצורך המחשה היא חדר מחשב הנבנה על פי השמועה על ידי מייקרוסופט באיידהו שבארה"ב. גודל החדר כ MW 5, ענק במושגים ישראליים אך לא במושגי מייקרוסופט, והוא יושלם תוך 28 שבועות מיום חתימת החוזה. החדר בנוי ממודולים של KW 600 כ"א כל מודול בנוי ממספר מבנים טרומיים המובלים לאתר במשאית ומחוברים תוך ימים לתשתית.
הקלות הבלתי נתפסת של נפילת מרכזי מחשוב
איני בקיא בלטינית, דבר שלא הפריע לי רבות במהלך חיי, אך ביטוי אחד בלטינית חקוק בזיכרוני מאז ששמעתי את אחד ממורי הבלתי נשכחים משתמש בו: " Perpetuum Mobile "בתרגום לעברית – תנועה נצחית. מכונת תנועה נצחית היא מכונה היפותטית שמבצעת עבודה או תנועה ללא הפסק מבלי לצרוך אנרגיה חיצונית. מכונות תנועה נצחית הן בלתי אפשריות למימוש לפי ההבנה המדעית של ימינו שכן הן מנוגדות לחוקי הפיזיקה. מפאת גילי המתקדם והסתיידות העורקים הבלתי נמנעת המתלווה לכך איני זוכר בדיוק באילו חוקים מדובר ואני מקווה שהקורא לא ייטור לי על כך.
ההנהלה הבכירה של ארגונים רבים נוטה לעיתים לחשוב על הDatacenter הארגוני כחסין מנפילות. קיים תמיד ועובד תמיד. מכונה של תנועה נצחית. כל כך נצחית עד שאין להשקיע משאבים ואנרגיה מחשבתית באספקטים של המשכיות העסקית הקשורים בחדרי המחשב.
מחקר של חברת Ponemon אליו התוודעתי בכנס AFCOM האחרון הראה שנפילות של מרכזי מחשוב תכופות הרבה יותר משחשבתי. המחקר כלל שיחות עם 450 מנהלי חדרי מחשב בארה"ב והתמקד בתקופה של 24 החודשים האחרונים. 41 מתוך הנשאלים זכו לביקור ותחקיר מעמיק באתר הדטה סנטר עצמו כדי לחקור את הסיבות והנסיבות הקשורות לאובדן ההמשכיות העסקית שלו.
לא פחות מ 95% ממרכזי המחשוב שנדגמו סבלו מקריסה משמעותית ( unplanned downtime ) אחת או יותר בשנתיים האחרונות. ממוצע הקריסות בשנתיים האחרונות היה 2.4 פעמים בשנתיים לקריסה מליאה של הדטה סנטר ו 6.8 פעמים בשנתיים לקריסה חלקית. קריסה חלקית מוגדרת כנפילה של שורת ארונות אחת או יותר.
הסקטור הבנקאי וחוות האירוח ( Co-Location ) הראו ביצועים טובים יותר מהממוצע אך לא בהרבה: הם קרסו באופן מלא 1.8 ו 1.9 פעמים ( בהתאמה) בשנתיים האחרונות. הביצועים של סקטור הציבורי והרפואי היו פחות טובים מהממוצע. אישית הופתעתי מהממצאים משום שהם מראים שחוות האירוח בארה"ב אינן מספקות רציפות עסקית טובה יותר ממרכזי המחשוב הארגוניים.
זמן הדמימה ( downtime ) הממוצע לקריסה מליאה של הדטה סנטרים שקרסו היה 102 דקות . זמן הדמימה הממוצע לקריסה חלקית של הדטה סנטרים שקרסו היה 152 דקות.
החוקרים ביקרו ב 41 ממרכזי האירוח שקרסו כדי לאמוד את העלות הממוצעת של נפילת מרכזי המחשוב. עלות קריסה מליאה של חוות השרתים הייתה כ 680,000 דולר בממוצע ועלות קריסה חלקית הייתה 258,000 דולר בממוצע. השונות בנתון זה היא גבוהה מאוד בהתאם לסקטור העסקי. בענף המלונאות עלות הקריסה הממוצעת היה כ 85,000 $ בלבד לעומת M1.1 $ בסקטור התקשורת. עלות הקריסה של מרכזי המחשוב נובעת בעיקר מאובדן הכנסות, אובדן נתונים, נזק לחומרה, אובדן שעות עבודה, ואובדן לקוחות.
היריעה קצרה מכדי שנוכל להגיע לדיון מעמיק בסיבות ובנסיבות הקשורות לקריסה של חדרי שרתים וכיצד למנוע אותן. די אם נאמר שניהול מתקדם של הדטה סנטר מחייב בקרה ברמות שאינן נפוצות היום בישראל. אסתפק בדוגמה קצרה אחת מני רבות. דיון מעמיק יותר אנו מספקים בהדרכות שאנו עורכים ללקוחות בנושא נוהגים מיטביים ( Best Practices ).
98% מהפסקות החשמל בארה"ב אורכות פחות מ 10 שניות. במהלך אותו זמן קצר, עובר העומס מהחדר אל מערכות האל-פסק ( UPS ) ואלו, כמעט תמיד, תלויות במצברים לאספקת האנרגיה החשמלית. אחת הסיבות המובילות לקריסה של חוות שרתים היא לא אחרת מהמצברים. מצברי הגיבוי הם מוצרים אלקטרו-כימיים עשויים בטכנולוגיה בת 200 שנה והם מככבים ברשימת הסיבות המובילות לקריסת מרכזי מחשוב ב58% מהמקרים!
יתכבד נא המנמ"ר ויסור לחדר האנרגיה שלו. אנחש שלא ביקר שם זמן רב ואולי אף פעם לא. בכל "בנק" של מצברים, יש בדרך כלל עשרות מצברים. בכל מצבר – 6 תאים. כלומר, מאות תאים חשמליים מזינים את האל פסק שלנו. בשורה התחתונה, תא כושל אחד, יכול להפיל את מרכז המחשוב.
שלוש השיטות הנפוצות בישראל להתמודד עם סיכון זה הן
· לא לעשות דבר ולקוות לטוב (אופטימיות היא תכונה כובשת)
· או להחליף מצברים כל 3 שנים ( הוצאה עצומה ומיותרת).
· המדקדקים מזמינים ספק שיבצע בדיקה למצברים כל חצי שנה או שנה שזה טוב וראוי אך יקר ולא מקטין את הסיכון ברמה ניכרת.
הנוהגים המתקדמים של היום קובעים שיש לבקר את המצברים באופן רציף ובזמן אמיתי באמצעות מערכת חיישנים ייעודיים אשר משדרים את נתוני המצבר דרך IP לשרת ייעודי. התוכנה מאפשרת לא רק לבקר את "בריאות" המצברים אלא גם לחזות במדויק מתי יגיעו למצב של כשל וניתן להחליף אותם מבעוד מועד. שימוש מעין זה של מערכת בקרת מצברים מאפשר לא רק לצמצם סיכונים באופן משמעותי אלא גם להוריד את עלויות התפעול השוטפות.
את בקרת המצברים ניתן לבצע או על ידי רכש חומרה ייעודית או כשירות מבוסס IP שבמסגרתו אנו מתקינים את מערכת הבקרה ומבצעים את ניתוח הנתונים וניהול האתראות דרך IP. לפרטים, פנו אלי או לאבי סולומון avi@schneider.co.il