Posts filed under ‘tier 4’
כיצד מאבטחים כבלי כח ל PDU בארון השרתים?
בחוות שרתים פעילה ועתירת שינויים, ובוודאי במעבדות פיתוח, אחד הסיכונים הוא נתק בין כבל החשמל לשקע שבפס השקעים ( ה PDU ). כיצד לאבטח ולמנוע זמן דמימה מיותר?
יש שלוש דרכים ליישם Best Practices
- כפתור שחרור בשקע ה PDU
2. קליפ
3. SecureLock
כבל עם מחבר נעילה. אישית, האופציה המתקדמת והחביבה עלי.
מה ההבדל?
האופציה הראשונה: כפתור השחרור מאפשר להשתמש בכבלים שיש לכם היום גם עם פס חדש.
האופציה השניה: הקליפ מצריך התאמה של גודל הקליפ לכבל/מחבר. אתם מקבלים מאיתנו קיט חינם כדי לבחון את גדלי הקליפים הנדרשים. מנהלי חוות שרתים מנוסים יאמרו לכם שזה חשוב אבל מעצבן.
האופציה השלישית אלגנטית מאוד. הכבל מאובטח לפס השקעים אך השליפה קלה בלחיצה על שחרור הנעילה. כמובן שהכבל נדרש להיות מותאם ל PDU. ניתן ורצוי להשתמש גם בכבלי כח בצבעים שונים וגם בפסים שונים ( רגל A בשחור, רגל B באדום לדוגמא).
ללמוד מעט יותר על פסי שקעים מתקדמים לארונות שרתים
Static Transfer Switch or Automatic Transfer Switch?
לצורך יתירות בחוות שרתים, נהוג להתקין בארונות שרתים מערכת ATS או STS להתקנים שיש להם ספק כוח אחד. לשני סוגי המערכות חסרונות אשר במקרים רבים מונעים את התקנתם בחוות שרתים קריטיות. בפוסט הזה נדון בהתקן הקרוי HTS, מערכת העברה היברידית שמספקת מענה אופטימאלי.
ATS = Automatic Transfer Switch
STS = Static Transfer Switch
HTS = Hybrid Transfer Switch
ה ATS היא מערכת מבוססת על ממסרים. זמני העברה נעים בין 10 ל 16 מילי שניות והמיתוג יכול להגיע ל 5 שניות נוספות. זהו סיכון פוטנציאלי לחריגה מהתקן של ה 20 מילי שניות שנדרש כדי לעמוד ברציפות הפעולה של הציוד. המערכת מבוססת ממסרים שבהם המגעים עלולים להיות ניתכים ולהתחבר ללא התרעה. המפעילים מבינים זאת רק כשמאוחר מידי. מצד שני, זו מערכת זולה, אך, כאמור, לא אמינה.
מערכות STS מספקות זמני העברה מהירים מאוד. בד"כ 4 עד 6 מילי שניות. המחיר שמשלמים על כך הוא פי 4 עד 5 ממחיר מערכות מבוססי ממסר.
מתג העברה היברידי, HTS, מספק את הפתרון האופטימאלי. הוא משלב ממסרים עם מיישרי סיליקון מבוקרים ומספק זמן העברה זהה ל STS ואמינות זהה במחיר נמוך בהרבה.
לפרטים נוספים ראו לינק. לקבלת חומר טכני בעברית כיתבו לי.
שיקולים חשובים בבחירת PDU לארון שרתים.
בעקבות דיון עם לקוח בישראל, הנה שני שיקולים חשובים נוספים בבחירת ה PDU. זאת בהמשך לפוסט קודם.
1. ידוע שנהוג להתחיל את ההתקנה בארון השרתים מלמטה. ביחוד כאשר יש צרכנים "כבדים" כגון שרתי בלייד / להב. כך נוצר חוסר איזון בפאזות. חשוב אם כך לבחור פס שקעים שמקל מאוד על איזון הפאזות כדוגמת הסכימה הזו. יש חלוקה ברורה וקלה ל 3 פאזות בפס השקעים גם בחצי התחתון וגם בחצי העליון.
2. יש עדיין הרבה פסי שקעים שמתוכננים ל 40 או 50 מעלות צלזיוס. בחלק האחורי של ארון ה IT מגיעים לטמפרטורות גבוהות מזה. חשוב מאוד לבחור פסי שקעים שמתוכננים לעמוד בטמפרטורות של 60 מעלות.
PDU לארונות שרתים: מבוקר או מנוהל?
האם יש עדיין טעם להצטייד בפסי שקעים "בסיסיים" לארונות שרתים?
פס השקעים הידוע בכינוי RPDU, הפך לחלק משמעותי ומעניין בחוות השרתים. כיום נהוגים מס' סוגים של פסי שקעים:
1. פסי שקעים מנוטרים – כאלו שמודדים ומציגים באמצעות צג מקומי את צריכת החשמל
2. פסי שקעים חכמים – מודדים ומציגים את צריכת החשמל ושולחים התראות דרך הרשת
3. פסי שקעים מנוהלים- יש בהם את יכולות הפסים החכמים + מאפשרים כיבוי והדלקה מרחוק
במה לבחור אם כך?
אני מאמין שהתשתית הפיזית של חוות השרתים חייבת לתמוך בשלושת יעדי העל:
1. רציפות עסקית
2. זמינות ( קיבולת בכל זמן)
3. עלות כוללת
לטעמי, פסי שקעים חכמים הם המינימום ההכרחי:
1. רציפות עסקית – כמעט כל חוות שרתים רצינית משקיעה ביתירות כלשהי. עם פס שקעים בסיסי, אין ערובה לשום יתירות. וזאת משום שללא בקרה, קל מאוד להעמיס את פסי השקעים בעומס העובר את ה 50%. במקרה של קריסת אחת ה"רגליים" יועמס פס השקעים הנותר ביותר מ 100% ויקרוס. עמו יקרוס גם ארון השרתים (במקרה הטוב). כלומר ההשקעה העצומה ביתירות (שרתים בעלי שתי הזנות המובילות לשני פסי שקעים ומשם לשני לוחות חשמל, לשתי מערכות אל פסק וכו) מתבזבזת בשל חיסכון תמוה על פס השקעים.
לאנגלים יש ביטוי טוב לתאר זאת:
"penny wise and pound foolish"
פס שקעים חכם יתן לנו התראה כאשר נעבור רמת סף של עומס אותה נגדיר אנחנו. לדוגמא 45%. לדיון מעמיק ראו פוסט קודם.
2. זמינות: השקענו בחוות שרתים ואנו רוצים לנצל את ההשקעה במלואה. איך זה שמרבית הארונות ריקים למחצה ומנהל החווה מתלונן שאין לו יכולת לקלוט ציוד חדש? ובכן, בכדי לדעת אם ארון השרתים מולנו יכול לקלוט ציוד נוסף הצורך, נניח, עוד 2 קילו-וואט, עלינו לדעת כמה צורך הארון שלפנינו. פס שקעים חכם המחובר לתוכנת שליטה כגון Power IQ , יציג את צריכת הארון שלפנינו לאורך זמן. כך נדע ברמת ביטחון גבוהה אם נוכל להוסיף ציוד לארון וכמה.
3. עלות כוללת: ניטור צריכת החשמל ברמת הארון נותן לנו את האפשרות ליזום שיפורים בתחום היעילות האנרגטית ולחסוך כסף רב לארגון אותו ניתן לנצל להתעצמות. בנוסף, ניטור מאפשר ניתוח עלות-תועלת של רכישת שרתים חדשים.
טיפים נוספים לבחירה נבונה:
– הטמפרטורה בחלקו האחורי של הארון יכולה היום להגיע ל 50 מעלות. ולכן, חשוב לבחור פסי שקעים חכמים העומדים בטמפרטורות של 60 מעלות.
-תכנון המאפשר מינימום טעויות אנוש:
כיסוי למפסקים, קליפים למניעה של ניתוק לא מכוון של כבלים , לדים וסימון צבעים לפאזות השונות.
טעות קטנה בדטה סנטר..
ידיעה קטנה בעיתונות תפסה את עיני: במשך כשעה פחות או יותר, משתמשים ברחבי העולם לא הצליחו להעלות פוסטים ולסמן לייקים בפייסבוק בשל בעיה בדטה סנטר של פייסבוק. מפייסבוק נמסר ש"מוקדם יותר היום הבוקר (שעון ארה"ב), בזמן ביצוע עבודות תחזוקה, חווינו אירוע אשר מנע מחלק מהמשתמשים להעלות פוסטים לפייסבוק לפרק זמן קצר. פתרנו את הבעיה במהירות והמערכת שבה לפעול בתפקוד מלא. אנו מתנצלים על אי הנוחות אשר נגרמה".
למרות היותי חובב גאדג'טים וטכנולוגיה אינני מנוי בפייסבוק, כנראה בשל הפרעת אישיות כלשהי. נפילת פייסבוק אם כך לא הפריעה לי מאוד במישור האישי, שגרת יומי לא הופרעה ומצב רוחי לא נפגע. אך דבר מה קטן נוסף לכד את עיני: מניית פייסבוק נפלה עקב האירוע ב- 0.6%. לא נורא, נכון? ובכן, בשווי שוק של כ-100 מיליארד דולר, 0.6% זה 600 מיליון דולר. קצת הרבה בשביל טעות טכנאי בזמן תחזוקה.
ידוע ש 60% מהאירועים המביאים לנפילה של חוות שרתים הם תוצאה של בעיות בתכנון ותפעול של התשתית הפיזית, כלומר, מיזוג אוויר , חשמל ותשתית תקשורת. לא סוד הוא שבישראל מרבית חוות השרתים מיושנות ברמת התשתית וסובלות מרעב תקציבי מתמשך. זה מתבטא במיזוג אוויר לא יעיל, בניהול כבילה בעייתי, בחוסר מוכנות לרעידות אדמה, ובמערכות חשמל מאולתרות. התוצאה הישירה היא סיכון לרציפות העסקית. נשאלת השאלה אם כך, האם ניתן לכמת את הסיכון?
רבות נכתב על הערכת העלות של זמן דמימה ( downtime ) של חוות שרתים. הערכת העלות לשעה של זמן דמימה נעה בין אלפי דולרים לארגונים קטנים ועד לעשרות מיליונים לשעה עבור ארגונים פיננסיים גדולים. הערכת הנזק מחושבת בדרך כלל על בסיס ערך העסקאות שעורך הארגון בתקופת זמן יחד עם הערכה גסה של עלות אובדן מוניטין ואיבוד לקוחות. המקרה של פייסבוק מאיר צד נוסף של הבעיה. הנזק לבעלי המניות עקב הפגיעה במחיר המניה. לא אתפלא אם העלות של מניעה אפקטיבית של הבעיה שהתעוררה בפייסבוק היא אלפית מהנזק שספגו בעלי המניות. 600 מיליון דולר כבר אמרנו?
לא אחת אני שותף לתסכולו של סמנכ"ל הטכנולוגיות בארגון, אשר מזהה את הסיכון אך לא מצליח להשיג תקציב למזעור הסיכונים. מקרה פייסבוק מאפשר למנמ"ר לפנות למנכ"ל ולחברי הדירקטוריון ולשאול אותם: " מה יקרה למחיר המניה, אם חוות השרתים, חוט השדרה של העסק שלנו, תידום לשעה? יום? שלושה ימים?"
סקר ביצועים וסיכונים בחוות שרתים הכרחי כדי לחשוף בעיות שיכולות לסכן את הרציפות העסקית. בחברת אלכסנדר שניידר אנו מבצעים סקר של חדרי שרתים ומזהים
1. סיכונים לרציפות העסקית
2. פוטנציאל לשיפור ביעילות האנרגטית ובהוצאות התפעול
3. דרכים למקסם את התשתית הקיימת כדי לתמוך בעוד מערכות ( Hidden Capacity )
מיגון חדרי שרתים מרעידות אדמה
בהמשך לפוסט הקודם בנושא מגון חדרי מחשב מפני רעידות אדמה, הנה שתי תמונות מאתר ביפן בעקבות רעידת האדמה ב 2011.

חוות שרתים שלא מוגנה על ידי בסיס סייסמי. לאלכסנדר שניידר פתרונות קלים ומהירים ליישום מפני רעידות אדמה
חדר השרתים במתקן זה לא היה ערוך ונהרס לחלוטין. זמן השיקום (וההשבתה) ארך כ 3 חודשים. רבים מהשרתים, אגב, המשיכו לעבוד. שימו לב, שהבניין לא ניזוק. אך חדר השרתים נהרס.
חוות שרתים רבות ביפן ממוגנות על ידי בסיס סייסמי המונח מתחת לארון ה IT , או שורת ארונות השרתים והן עבדו ללא הפרעה במהלך רעידת האדמה ( 8.9 בסולם ריכטר) . ראו פוסט קודם.
שיטת מיגון אחרת היא עיגון הארונות לרצפת הבטון. שיטה זו טובה רק להגן על העובדים מפני נפילת הארונות אך, למרבה הצער, מעבירה את כל האנרגיה הדינמית מרעידת האדמה אל השרתים. בשיטה זו, האנשים בטוחים אך הציוד ייהרס.
השאלה האמיתי היא על מה רוצים להגן:
על העובדים – תעגנו לבטון
לרציפות עסקית ( וגם הגנה על העובדים) – בסיס סייסמי
מחשבות על תרגיל פיקוד העורף לבדיקת מוכנות לרעידת אדמה
תרגיל המוכנות לרעידת אדמה – האם מובנות ההשלכות של הסיכון על המשק? לא בטוח
המשרד להגנת העורף מקיים השבוע תרגיל לבדיקת מוכנות העורף לרעידת אדמה ואפילו לצונאמי. התרחיש עפ"י מקורות רשמיים הוא " רעידת אדמה חזקה פוקדת את ישראל בערבה ובגליל העליון וזורעת הרס גם בגוש דן. כפועל יוצא פוגעים גם גלי צונאמי בחופי תל אביב. כוחות פיקוד העורף יידרשו להתמודד במהלך התרגיל עם כ-7,000 "הרוגים" בתרחיש, 70 אלף נפגעים ו-170 אלף איש אשר ייאלצו להתפנות מבתיהם" .
אין ספק שזהו תרחיש מדאיג וטוב עושים השר דיכטר ואלוף פיקוד העורף ביוזמת התרגיל. עם זאת, אני רוצה להוסיף כמה מילים לתרחיש הנ"ל שהם פועל יוצא הכרחי של רעידת אדמה בעוצמה זו: " בשל עוצמת הרעש קרסו תשתיות המחשוב של הבנקים הגדולים, של חברות התקשורת הקוית והסלולרית, של ספקי האינטרנט , של בתי החולים, של עיריות תל אביב וחיפה, של המשטרה ושל צה"ל. בחלק מן המקרים יידרשו שלושה עד שישה חודשים לשוב ליכולת מליאה" .
במה מדובר? ישאל הקורא בתמיהה. אנסה לענות כמיטב יכולתי.
המשק של כלכלה מודרנית מבוסס על תשתיות מחשוב. חלקים קריטיים של תשתיות המחשוב הללו מרוכזים באולמות הקרויים מרכזי מחשוב או חדרי מחשב. כל החברות הגדולות במשק, פרטיות וציבוריות כמו גם הצבא ומשרדי הממשלה תלויים בחדרי מחשב אלו. בלעדיהם, החברות הללו משותקות. חדרי המחשב בישראל, רובם ככולם, לא תוכננו לעמוד ברעידת אדמה של 7 בסולם ריכטר וגם לא של 6.
המסקנה המיידית היא שאם יתממש תרחיש של רעידת האדמה בעצמה של 7.1, לא תהיה תקשורת טלפונית וגם לא אינטרנט. הרמזורים לא יעבדו, הכספומטים לא יאפשרו משיכת כספים, בתי החולים יהיו בתוהו ובוהו, חברות היי טק ומפעלים ישותקו, שרותים ממשלתיים לא יהיו זמינים, ותפקוד שרותי ההצלה והביטחון ייפגע קשות. לא לשעות אלא לשבועות ואף לחודשים.
אתעלם לפי שעה מההשלכות על פינוי וטיפול בנפגעים ואתרכז בהשלכות על המשק . באין בנקים, באין תקשורת ובאין פעילות תעשייתית, המשק ישותק, ההתאששות תארך חודשים והנזק הכלכלי יהיה עצום.
המסקנה היא שעל המשק להיערך לא רק לפינוי וטיפול בנפגעים ובחסרי קורת גג אלא גם להבטיח שההתאוששות של המשק מהאסון תהיה מהירה. לשם כך, יש לטפל בעקב אכילס של החברה המודרנית – הפגיעות הגדולה של האמצעים הטכנולוגיים שאנו תלויים בהם.
החדשות הטובות, אם ניתן לקרוא להן כך, הן שבניגוד לעלות העצומה של חיזוק מבנים, חיסון חדרי המחשב (שיכוך) הוא בר ביצוע בזמן קצר יחסית ובעלות נמוכה. החדשות הרעות הן שקברניטי המשק, בסקטור הפרטי והציבורי, כולל אלו המופקדים על מל"ח (משק לשעת חירום) מתעלמים מסיכון זה ואינם נוקטים בפעולות ממשיות להקטנת הסיכון ולהיערכות.
ביפן ובארה"ב נפוץ שימוש בבסיס סייסמי המוצב מתחת לארונות ה IT. שיטה זו אפשרה למרכזי המחשוב של יפן לעמוד גם ברעידת האדמה של 2011 – 9.1 בסולם ריכטר. בסיס סייסמי זה הקרוי ISOBASE אושר גם על ידי ממשלת ארה"ב ועומד בתקינת NEBS. ראו פוסט קודם
תכנון חדרי מחשב וחוות שרתים

זה הסטנדרט המומלץ של אלכסנדר שניידר
למנמ"ר המתכנן את מרכז המחשוב ( datacenter ) החדש של הארגון, יש הזדמנות לנצל נוהגים מתקדמים ( Best Practices ) בתכנון חדרי שרתים, ולשפר את התשתית עליה נשען מערך ה IT תוך חיסכון בעלות כוללת. להלן "עשר הדיברות"
1.TCO – הגדירו את רמת היתירות הנדרשת וחשבו את העלות כוללת ל 10 עד 15 שנים. השקעה ראשונית גדולה במס' אחוזים יכולה לחסוך עשרות אחוזים ב TCO.
2.בחירת השרתים גם על פי צריכת האנרגיה – עלות התפעול (בעיקר אנרגיה חשמלית) של שרת לאורך שלוש שנים גבוהה יותר מעלות השרת עצמו. בחרו בחוכמה שכן השוני בין השרתים הוא משמעותי.
3.וירטואליזציה – שימוש בוירטואליזציה מאפשר חיסכון משמעותי ברכש חומרה ובעלות התפעול של חוות השרתים. עם זאת, צריכת האנרגיה של שרת פיזי שעליו 5-20 שרתים וירטואליים גבוהה משמעותית מבעבר ויש צורך בחשיבה עדכנית בתשתית החשמל ומיזוג האוויר.
4.צפיפות מחשוב גבוהה – העלות הכוללת של חדר שרתים עם צפיפות מחשוב גבוהה ( high density ) נמוכה משמעותית ממרכזי מחשוב המפזרים את המחשוב על שטח רצפה נרחב. עם זאת, נדרשת חשיבה מקצועית וחדשנית להתמודדות עם כבילה צפופה, תשתית חשמל ומיזוג אוויר לצפיפות גבוהה. כדאי להתגבר על הנטייה להיצמד לשיטות עבר – החיסכון הוא משמעותי.
5.מודולאריות בתכנון – השקעה בציוד תשתית לעומס מקסימאלי כבר בתחילת חיי חדר המחשב היא מתכון לבזבוז ולשיתוק היכולת לאמץ טכנולוגיות חדשות עם הזמן. תכנון מודולארי מאפשר מדרוג ההשקעה לאורך שנים ( pay as you grow ) וחיסכון משמעותי ב TCO. מודולאריות מאפשרת גם שימוש אופטימאלי בטכנולוגיות מתקדמות ובמוצרים חדישים.
6. מיזוג אוויר חדשני וממוקד. המיזוג הממוקד מאפשר התמודדות עם כל עומס, חיסכון באנרגיה חשמלית וניצול מיטבי של ההשקעה בתשתית. עם זאת, היזהרו ממוכרנים שממוקדים רק במה שכדאי להם למכור . ישנן מגוון שיטות כגון קירור פנים-ארון, קירור חדר, קירור שורה ולכל אחת מאלו ואריציות שונות. מה נכון? כל פרויקט לגופו על פי הדרישות, הצרכים והאילוצים. טיפ חשוב: בחדרים בהם מיזוג האוויר מבוסס על צ'ילרים: דרשו ממתכנן מיזוג האוויר לתכנן לפי טמפ' מים קרים של לפחות 12 מעלות צלזיוס. רצוי אף יותר. זה יביא לחיסכון עצום בצריכת החשמל ותקבלו הרבה יותר מהמערכות שהתקנתם.
7. הפרדה מוחלטת של אוויר קר ואוויר חם – אחת הסיבות העיקריות לבזבוז העצום במיזוג אוויר ובחשמל בחוות שרתים הוא חוסר ההפרדה בין אוויר קר לחם. שימוש בפנלים עיוורים הוא חובה בסיסית עם החזר השקעה של יומיים בערך. הפרדה בין המעבר הקר למעבר החם יכולה גם היא להביא לחיסכון משמעותי. גם כאן יש כר נרחב של אפשרויות: סגירת מעבר הקר (עם או בלי מערכות קירור מים), סגירת המעבר החם ( רק בשילוב מערכות קירור מים), שיטה היברידית ועוד.
8.ניהול בזמן אמת באמצעות כלי תוכנה – קצת עצוב שהתשתיות הפיזיות של חוות השרתים בישראל מנוהלות בדרך כלל בגיליונות אקסל. קיימים כלי תוכנה ( SPM, DC Track, Power IQ ) קלים לשימוש המאפשרים ניצול מיטבי של ההשקעה בתשתית, הצגת לוח מחוונים ( Dashboard ) בזמן אמיתי והעיקר: יכולת תגובה מהירה לשינויים.
9. מדידה ובקרה – אי אפשר לנהל ולייעל את מה שאינו נמדד. חיישנים וכלי תוכנה מתקדמים מודדים את יעילות צריכת האנרגיה ( PUE ) ומידת השימוש בתשתיות ומאפשרים קבלת החלטות ניהוליות מושכלות. לדוגמא: חישוב קל של החזר השקעה של IT Refresh .
10. הסמכה מבצעית של חדרי שרתים – טבען של תקלות בתכנון וביצוע של חדרי שרתים חדשים, הוא שהן מתגלות זמן רב לאחר העלייה לאוויר עם הצמיחה הטבעית בעומס. תקלות אלו גורמות לזמן דמימה ( downtime ) של חדרי שרתים קריטיים לארגון. ההסמכה המבצעית של אלכסנדר שניידר בוחנת תחת עומס אמיתי את כל מערכות חדר השרתים: מיזוג אוויר, חשמל , יתירות ויעילות אנרגטית. הבדיקה היא באמצעות אמולטורים של חומרה , חיישנים מתקדמים ותוכנת בקרה ייעודית. ההסמכה המבצעית מורידה דרמטית את ההסתברות לתקלות תשתית ומגלה את כל הבעיות לפני הכנסת מערכות האמת של ה IT לחדר השרתים החדש כאשר כל המערכות עדיין באחריות וכל המתכננים והקבלנים עדיין זמינים.
ארגון אשר יישם את עשרת הנוהגים המתקדמים הללו ויפנים את העקרונות שעיצבו אותם, ישפר משמעותית את יכולת חוות השרתים להגיב לצרכי הארגון, ויוכל לחסוך לארגון כספים רבים שישמשו אותו להקצאת משאבים להתעצמות.
אנו מקיימים ימי עיון לעיתים קרובות בנושא תכנון וניהול חדרי שרתים. למעוניינים כתבו לטלי שרון tali@schneider.co.il
מיגון: חדרי המחשב יורדים אל מתחת לאדמה
תופעה ישראלית יחודית היא המגמה הגוברת של בניית חדרי שרתים תת קרקעיים. ארגונים מהסקטור העיסקי והציבורי בונים או מתכננים חדרי שרתים ממוגנים מתחת לפני הקרקע.הסיבה הברורה היא איום הרקטות והטילים. ישראל כולה בטווח של טילי האוייב. ברור לכל שפגיעה בחדר שרתים של ארגון חיוני למשק ,גם אם לא תגרום לאבדות בנפש, תגרום לנזק כלכלי עצום. בארגונים בסקטור העסקי, בעלי המניות עושים לעצמם חישוב פשוט: מה יקרה למחיר המניה אם יושבת חדר השרתים שלנו בגלל פגיעה קרובה או ישירה של רקטה או טיל. התוצאה: ארגונים רבים מחפשים לשכור או לרכוש נדל"ן המצוי מתחת לפני הקרקע. לי ידוע לפחות על שלושה פרויקטים גדולים שנמצאים בתהליך מתקדם בימים אלו בהיקף כולל של מעל 100 מיליון שקלים. חברת אלכסנדר שניידר מובילה שניים מהם.
לא מזמן אירחתי מלקוחות מחו"ל שהתפלאו על המגמה הייחודית הזו. ובכן, סיברתי את אוזניהם, בכל מקום ממגנים את הדטה סנטר כנגד איומי הייחוס הרלבנטים: הוריקן בחוף המזרחי של ארה"ב, טורנדו במרכז ארה"ב, רעידות אדמה במערב ארה"ב, דרום אמריקה, יפן, סין וטורקיה. שיטפונות בחלקים נרחבים של אירופה וכן הלאה. בישראל מתעלמים לפי שעה מהסיכון של רעידות אדמה אך מתייחסים ברצינות לסיכון הטילים. עניין של אופי.
מאחר וכאומה אנו לא מצטיינים בתכנון לטווח ארוך, ונדל"ן מסוג זה אינו מצוי בידי הארגונים, הרי שיש למצוא אותם בשוק החופשי. החדשות הטובות הן שיש די הרבה נדלן בדמות חניונים וקומות מרתף פנויות ומחירן יחסית זול משום שהן אינן ראויות לאכלוס משרדי. הרשויות בד"כ משתפות פעולה אם נדרש שינוי ייעוד אם כי נדרש לעניין עו"ד טוב. ועורכי דין, ברוך השם, לא חסר במדינתנו.
לפני שחותמים חוזה שכירות ארוך טווח, כדאי לבדוק כמה דברים: זמינות של תשתיות לאספקת חשמל שתידרש לאורך חיי המתקן, האפשרות להתקין תשתיות למיזוג אוויר, מיגון מפני הצפה, תשתית תקשורת , דרכי גישה ועוד גורמים רבים שיש לבדוק באמצעות סקר מקצועי.
אחד המאפיינים של קומות תת קרקעיות זמינות בדרך כלל הוא מגבלה של גובה. לאלו שלא חיים את עולם חדרי השרתים, נקצר ונאמר שהגובה נדרש לצורך מעבר של ספיקת אוויר מספקת לצרכי מיזוג אוויר. גובה של 4 עד 5 מטר נחשב מספק. במרבית החניונים והנדלן התת קרקעי הגובה המצוי הוא מתחת ל 3 מטר. אל דאגה, באמצעים הטכנולוגיים של היום ניתן לבנות חדר שרתים נפלא בגובה זה באמצעות קירור בצמידות גבוהה הקרוי בפי העם, קצת בטעות, קירור מים.
אז אם אתה הבעלים של שטח נדלני תת קרקעי שניסית להשכיר ללא הצלחה במשך שנים, דע לך שבהנחה שהתקיימו הגורמים הנ"ל מהיום אתה הבעלים של אתר תשתית לדטה סנטר.
בתמונה חדר שרתים מתקדם תת קרקעי של אחד מלקוחותינו. למרות המיקום באתר "קלאוסטרופובי" החדר הוא אחד המתקדמים בישראל. כל ארון שרתים מתוכנן לשאת עומס של עד 15 קילוואט. יחידות מיזוג האוויר תוצרת Knurr Emerson מוצבות בין הארונות לפי עיקרון קירור שורה Inrow .
והערה אישית: לאחר הפסקה ארוכה של כתיבה בבלוג, ולאחר שקיבלתי לא מעט הערות נבזיות מידידי בתעשייה על כך שהפסקתי לכתוב, אני חוזר למוטב ומחדש את הרענון השוטף של בלוג חדרי השרתים.
הקלות הבלתי נתפסת של נפילת מרכזי מחשוב
איני בקיא בלטינית, דבר שלא הפריע לי רבות במהלך חיי, אך ביטוי אחד בלטינית חקוק בזיכרוני מאז ששמעתי את אחד ממורי הבלתי נשכחים משתמש בו: " Perpetuum Mobile "בתרגום לעברית – תנועה נצחית. מכונת תנועה נצחית היא מכונה היפותטית שמבצעת עבודה או תנועה ללא הפסק מבלי לצרוך אנרגיה חיצונית. מכונות תנועה נצחית הן בלתי אפשריות למימוש לפי ההבנה המדעית של ימינו שכן הן מנוגדות לחוקי הפיזיקה. מפאת גילי המתקדם והסתיידות העורקים הבלתי נמנעת המתלווה לכך איני זוכר בדיוק באילו חוקים מדובר ואני מקווה שהקורא לא ייטור לי על כך.
ההנהלה הבכירה של ארגונים רבים נוטה לעיתים לחשוב על הDatacenter הארגוני כחסין מנפילות. קיים תמיד ועובד תמיד. מכונה של תנועה נצחית. כל כך נצחית עד שאין להשקיע משאבים ואנרגיה מחשבתית באספקטים של המשכיות העסקית הקשורים בחדרי המחשב.
מחקר של חברת Ponemon אליו התוודעתי בכנס AFCOM האחרון הראה שנפילות של מרכזי מחשוב תכופות הרבה יותר משחשבתי. המחקר כלל שיחות עם 450 מנהלי חדרי מחשב בארה"ב והתמקד בתקופה של 24 החודשים האחרונים. 41 מתוך הנשאלים זכו לביקור ותחקיר מעמיק באתר הדטה סנטר עצמו כדי לחקור את הסיבות והנסיבות הקשורות לאובדן ההמשכיות העסקית שלו.
לא פחות מ 95% ממרכזי המחשוב שנדגמו סבלו מקריסה משמעותית ( unplanned downtime ) אחת או יותר בשנתיים האחרונות. ממוצע הקריסות בשנתיים האחרונות היה 2.4 פעמים בשנתיים לקריסה מליאה של הדטה סנטר ו 6.8 פעמים בשנתיים לקריסה חלקית. קריסה חלקית מוגדרת כנפילה של שורת ארונות אחת או יותר.
הסקטור הבנקאי וחוות האירוח ( Co-Location ) הראו ביצועים טובים יותר מהממוצע אך לא בהרבה: הם קרסו באופן מלא 1.8 ו 1.9 פעמים ( בהתאמה) בשנתיים האחרונות. הביצועים של סקטור הציבורי והרפואי היו פחות טובים מהממוצע. אישית הופתעתי מהממצאים משום שהם מראים שחוות האירוח בארה"ב אינן מספקות רציפות עסקית טובה יותר ממרכזי המחשוב הארגוניים.
זמן הדמימה ( downtime ) הממוצע לקריסה מליאה של הדטה סנטרים שקרסו היה 102 דקות . זמן הדמימה הממוצע לקריסה חלקית של הדטה סנטרים שקרסו היה 152 דקות.
החוקרים ביקרו ב 41 ממרכזי האירוח שקרסו כדי לאמוד את העלות הממוצעת של נפילת מרכזי המחשוב. עלות קריסה מליאה של חוות השרתים הייתה כ 680,000 דולר בממוצע ועלות קריסה חלקית הייתה 258,000 דולר בממוצע. השונות בנתון זה היא גבוהה מאוד בהתאם לסקטור העסקי. בענף המלונאות עלות הקריסה הממוצעת היה כ 85,000 $ בלבד לעומת M1.1 $ בסקטור התקשורת. עלות הקריסה של מרכזי המחשוב נובעת בעיקר מאובדן הכנסות, אובדן נתונים, נזק לחומרה, אובדן שעות עבודה, ואובדן לקוחות.
היריעה קצרה מכדי שנוכל להגיע לדיון מעמיק בסיבות ובנסיבות הקשורות לקריסה של חדרי שרתים וכיצד למנוע אותן. די אם נאמר שניהול מתקדם של הדטה סנטר מחייב בקרה ברמות שאינן נפוצות היום בישראל. אסתפק בדוגמה קצרה אחת מני רבות. דיון מעמיק יותר אנו מספקים בהדרכות שאנו עורכים ללקוחות בנושא נוהגים מיטביים ( Best Practices ).
98% מהפסקות החשמל בארה"ב אורכות פחות מ 10 שניות. במהלך אותו זמן קצר, עובר העומס מהחדר אל מערכות האל-פסק ( UPS ) ואלו, כמעט תמיד, תלויות במצברים לאספקת האנרגיה החשמלית. אחת הסיבות המובילות לקריסה של חוות שרתים היא לא אחרת מהמצברים. מצברי הגיבוי הם מוצרים אלקטרו-כימיים עשויים בטכנולוגיה בת 200 שנה והם מככבים ברשימת הסיבות המובילות לקריסת מרכזי מחשוב ב58% מהמקרים!
יתכבד נא המנמ"ר ויסור לחדר האנרגיה שלו. אנחש שלא ביקר שם זמן רב ואולי אף פעם לא. בכל "בנק" של מצברים, יש בדרך כלל עשרות מצברים. בכל מצבר – 6 תאים. כלומר, מאות תאים חשמליים מזינים את האל פסק שלנו. בשורה התחתונה, תא כושל אחד, יכול להפיל את מרכז המחשוב.
שלוש השיטות הנפוצות בישראל להתמודד עם סיכון זה הן
· לא לעשות דבר ולקוות לטוב (אופטימיות היא תכונה כובשת)
· או להחליף מצברים כל 3 שנים ( הוצאה עצומה ומיותרת).
· המדקדקים מזמינים ספק שיבצע בדיקה למצברים כל חצי שנה או שנה שזה טוב וראוי אך יקר ולא מקטין את הסיכון ברמה ניכרת.
הנוהגים המתקדמים של היום קובעים שיש לבקר את המצברים באופן רציף ובזמן אמיתי באמצעות מערכת חיישנים ייעודיים אשר משדרים את נתוני המצבר דרך IP לשרת ייעודי. התוכנה מאפשרת לא רק לבקר את "בריאות" המצברים אלא גם לחזות במדויק מתי יגיעו למצב של כשל וניתן להחליף אותם מבעוד מועד. שימוש מעין זה של מערכת בקרת מצברים מאפשר לא רק לצמצם סיכונים באופן משמעותי אלא גם להוריד את עלויות התפעול השוטפות.
את בקרת המצברים ניתן לבצע או על ידי רכש חומרה ייעודית או כשירות מבוסס IP שבמסגרתו אנו מתקינים את מערכת הבקרה ומבצעים את ניתוח הנתונים וניהול האתראות דרך IP. לפרטים, פנו אלי או לאבי סולומון avi@schneider.co.il