Archive for פברואר, 2008
Metered PDU : יישום נכון של יתירות בחדרי המחשב
האם ספקי כוח כפולים בשרת משפרים את שרידות חדר המחשב?
אספקת חשמל היא יסוד בסיסי בתשתית חדר המחשב. הפסקת חשמל, או מערכת חשמל באיכות ירודה היא הסיבה העיקרית ל"נפילת" חדרי המחשב. לעיתים קרובות, קריסת מערכות החשמל של החדר מתקיימת לא בעת הפסקת חשמל אלא כתוצאה מטעות מקומית או תכנונית, אך בעיקר בשימוש בנוהגים (Practices) לא עדכניים.
מערכת אספקת החשמל של חדר המחשב מורכבת משש רמות:
1. הגריד – חברת החשמל וארון מרכזי
2. גנראטור גיבוי ומתג העברה אוטומטי ( ATS )
3. מערכת גיבוי אל פסק ( UPS ) ומתג BYPASS
4. ארון החשמל
5.PDU – Power Distribution Unit ברמת הארון
6. ספקי הכוח של השרתים עצמם
מנהלי אולם המחשב בדרך כלל אינם מעורבים ב 4 הרמות הראשונות, אך יש להם אחריות למדיניות ויישום של רמות 5 ו 6 . לא מעט נפילות מביכות מתרחשות כתוצאה ישירה מיישום שגוי של ה PDU.
כמעט לכל השרתים הנמכרים היום יש שני ספקי כוח. עובדה זו יכולה לשפר מאוד את זמינות המידע אם היישום הפיזי הוא נכון. במקרים רבים, בשל יישום שגוי, שני ספקי כוח אינם מוסיפים ערך כלל ויתרון זה מתבזבז או אף הופך לחיסרון.
בחדר מחשב ברמה 4 ( Tier 4 ) יש שתי מערכות של אספקת החשמל ובכל מערכת (ענף) מצויים כל 6 המרכיבים שהוזכרו מעלה. כל ענף יכול לתמוך ב 100% מצרכי החדר. זוהי יתירות של 2N וזה גם המחיר: עלות כפולה.
בשל שיקולי עלות, מעטים חדרי המחשב של Tier 4 ולכן אין לנו בד"כ יתירות של 2N. אנו מתפשרים משיקולי עלות- תועלת ואילוצים אחרים.
נתמקד אם כך בשיפור היתירות בעלות נמוכה ובדרכים שאפשריות לנו כמנהלי אולמות המחשב ליישם בקלות ובמהירות כלומר בסעיפים 5 ו 6.
במקרים בהם מותקן PDU אחד ברמת הארון, הרי שהיתירות מוגבלת רק למקרה של כשל באחד מספקי הכוח של השרת. ברור שזו לא חוכמה גדולה וזה גם לא מקרה מעניין.
ברוב המקרים מותקנים שני PDU בארון. תקוותנו השלמה היא שכל ספק כוח מחובר ל PDU אחר. במקרים כאלו כל ספק כוח עובד ב 50% מהעומס. במקרה של כשל בספק אחד, עובר כל העומס לספק השני. תצורה זו נוטעת במנהל החדר תחושה של בטחון בזכות היתירות. עם זאת, רבים אינם מודעים לנוהגים הנכונים ( best practices ) ומיישמים זאת בצורה לא נכונה.
לדוגמא, ראיתי מקרים רבים בהם ה PDU מועמס ל 60% מיכולתו. ובכן מה הבעיה?
הבעיה היא שבמקרה של כשל בענף A, כל העומס מועבר ל PDU B . במקרה כזה, PDU B סופג עומס של 120% והארון נופל.
נוהגים נכונים:
חוק מס 1: העומס על שני ה PDU ( ביחד) בארון צריך להיות לא יותר מ 80% מהעומס המקסימאלי של הארון
חוק מס' 2: העומס המקסימלי על כל PDU צריך להיות לא יותר מ 40% מהעומס המקסימאלי של הארון.
כלומר, אם הנקודה מאפשרת 20A לארון , כל PDU יכול להיות מועמס ל 8A לכל היותר , ושניהם ביחד 16A ( כלומר 80% מ 20A)
מומלץ מאוד להתקין PDU שהוא Metered , כלומר ניתן לראות מהו העומס על ה PDU באמפר. בישראל קוראים לזה בדרך כלל PDU חכם (להבדיל מ PDU מנוהל שמאפשר גם כיבוי והדלקה מרחוק)
מומלץ מאוד לבחור ב Meterd PDU (חכם) שמאפשר גישה מרחוק דרך IP ולקבל התראות ב SNMP במקרה והעומס עובר את רמת הסף המותרת. זה מוריד מאוד את עומס העבודה הכרוך בפיקוח על נושא זה ומשפר מאוד את אמינות חדר המחשב. דוגמאות לפסי שקעים חכמים ומנוהלים והנה PDU חדש וחכם במיוחד
מה יקרה לחדר המחשב שלך ברעידת אדמה?
גם בזמן רעידת אדמה מתונה יחסית, ארונות השרתים בחדר המחשב עלולים לקרוס.
התוצאה:
• Downtime
• אובדן הכנסה
• איבוד נתונים
• נזק לציוד יקר ערך
• זמן התאוששות ארוך
ראו תמונה מחדרי מחשב בקליפורניה לאחר רעידת אדמה של 6.7 בסולם ריכטר.
נהוג לחשוב, שמיגון IT מפני רעידות אדמה הוא עניין יקר ומורכב. לא כך הדבר. ניתן למגן היום בקלות רבה ארונות שרתים ואחסון קריטיים מפני רעידות אדמה.
מעט רקע: רעידות אדמה נמדדות בדרך כלל לפי סולם ריכטר. סולם זה הוא סולם לוגריתמי. כלומר, רעידת אדמה בעוצמה 6 לפי סולם ריכטר חזקה פי 10 מרעידה בעוצמה 5.
בארה"ב קיים תקן טלקורדיה המגדיר ארבע רמות סיכון לפי מיקום גיאוגרפי בארה"ב. התקן מגדיר את רמה 4 (מדינת קליפורניה) כרמת הסיכון הגבוהה ביותר. בדיקה לפי תקן זה לרמה 4 מעמידה את ציוד ה IT ברעידות המדמות רעידת אדמה בעוצה של 8.3 לפי סולם ריכטר.
קיים בסיס לבידוד סיסמי שמבודד את השפעת רעידת האדמה מן הארון. הבסיס משתמש בשיטות המשמשות מהנדסים ברחבי העולם לצורך הגנה על בניינים,גשרים ומבנים הנדסיים שונים מפני רעידות אדמה.
הבסיס המבודד עבר בהצלחה רבה מבחנים שנעשו בארה"ב וביפן לפי התקן המחמיר של ZONE 4 . מבחן לפי תקן זה מדמה רעידת אדמה של עד 8.3 לפי סולם ריכטר. ראו סרט.
ניתן אם כך היום להבטיח שרידות של שרתים ומערכות IT קריטיות גם בעת רעידות אדמה חזקות. ניתן להשיג שרידות זו בקלות ובעלות נמוכה יחסית. ראו תמונות של ארונות שרתים ואחסון בחדר מחשב רגיל. ארונות אלו מוגנים מנזקי רעידות אדמה.
בחדרי מחשב עובדים שלא ניתן להשבית בהם ציוד, ניתן לבצע התקנה חמה עם מערכות עובדות. ראה תמונה. בפרויקט זה הלקוח מחדר המחשב של בואינג בארה"ב, אנו מרימים את ארונות השרתים באמצעות מערכת הידראולית שתוכננה במיוחד ליישום זה. הבסיסים הותקנו מתחת לארונות החמים, ואח"כ הורדו הארונות בזהירות.
חברות מובילות בעולם ,משתמשות בשיטה זו בכדי להשיג את ההגנה הגבוהה ביותר למסגרות ולציוד ה-IT היקר שלהן.