Posts filed under 'שרידות'

חדרי מחשב ורעידות אדמה

רבות מדובר על הסיכון של רעידות אדמה ליציבות מבנים.  אני רוצה לדבר על מרכיב חשוב לא פחות והוא עמידות חדרי חדרי מחשב ברעידות אדמה.

חברות התקשורת, הבנקים, שרותי החירום וההצלה, משרדי ממשלה, הצבא – לכולם אולמות מחשב גדולים ובהם מחשבים הקרויים שרתים ומערכות אחסון נתונים. שרתים אלו מאוחסנים בארונות הקרויים ארונות שרתים.

שרותי התקשורת הקוית והסלולרית, שרותי  הבנקאות, הרמזורים, שרותי הבריאות , הביטחון, ההצלה והכיבוי, משרדי ממשלה, עיריות, חברות הייטק ומפעלי תעשייה,  כולם ישותקו במידה רבה אם ייפגעו חדרי המחשב של הארגונים הללו.

בתמונות הללו הלקוחות ממצגת של חברת בואינג בארה”ב, אנו רואים מה קרה בחדרי המחשב של בואינג לאחר רעידת אדמה NISQUALLY בפברואר 2001.  זו הייתה רעידת אדמה  של 6.8 בסולם ריכטר, בעומק 52 ק”מ. בתמונות רואים כיצד ארונות השרתים קרסו ונפלו.  עם זאת, הבניין נשאר עומד ואפילו התקרה האקוסטית במקומה.

image002

image004 

אנו מאמינים שבמקרה של רעידת אדמה דומה בישראל ( בין 6 ל 7 בסולם ריכטר) , מרבית חדרי המחשב באזור הרעש יקרסו, גם אם לא יגרם נזק משמעותי לבנינים בהם הם מאוחסנים. אחת הסיבות לכך היא שארונות השרתים הם כבדים וגבוהים ובדרך כלל מוצבים על רצפה צפה דרכה מועבר אוויר קר החיוני לקירור המחשבים.  הרצפה הצפה הזו תקרוס בעת רעידת אדמה משמעותית ואיתה יקרסו ארונות השרתים.  במקרים בהם מבריגים את הארונות לרצפת הבטון, אותם ארונות עוברים אירוע אלים בזמן רעידת האדמה, כך שארונות רגילים פשוט יתפרקו.

במקרה כזה, יש סיכון שהרמזורים, שרותי הבנקאות, התקשורת, משרדי ממשלה ומערכות ההצלה והביטחון ישותקו.  צפוי גם נזק משמעותי לחומרת מחשבים יקרה.  נתונים חשובים יאבדו. זמן ההתאוששות יכול להיות חודשים.  להערכתנו, הנזק לחומרה יכול להיות במאות מיליונים והנזק למשק במיליארדים.

מדוע אם כך הארגונים  אינם עושים דבר כדי למגן את חדרי המחשב?    הסיבות הן

1.    חוסר מודעות לסיכון
2.    חוסר ידע כיצד למגן את חדרי המחשב
3.    ההנחה המוטעית שהדבר דורש השקעות ענק
4.    ההנחה השגויה שיש לשתק את חדר המחשב לזמן ממושך כדי להתקין את המיגון.  מי שמכיר ארגונים שבהם המידע הוא קריטי יודע שרבים מחויבים לזמינות מידע של 99.999% מהזמן ( 5 תשיעיות) והשבתה אינו דבר שמתקבל על דעתם.

העניין הוא שניתן למגן את ארונות השרתים מפני רעידות אדמה באופן קל יחסית.

הפתרון הוא קל ליישום, אינו עולה ממון רב, וניתן להתקנה גם בזמן שהשרתים עובדים, כלומר ללא השבתה.

המתקן נקרא Isolation Base והוא מאפשר לבודד את השפעות רעידת האדמה מארון השרתים.  גם כשמדובר בארון שרתים סטנדרטי.

בסיס הבידוד נבחן לפי תקן  63-Core   Bellcore האמריקאי ( NEBS ) לפי אזור 4 ( zone 4 ) המחמיר (באיזור זה לדוגמא כלולה קליפורניה) .   הבסיס נבדק ואושר על ידי ה Department of Energy   למרכזי חירום 911.  המבחן מדמה רעידות אדמה עד לעוצמה של 8.3 בסולם ריכטר.

בעת רעידת אדמה, בעוד שהלחץ של ארון השרתים הכבד ( 500-1000 ק”ג) על כל נקודת רצפה צפה יכול לגדול פי 2.5, הרי בשל הבסיס המיוחד, הלחץ על נקודת הרצפה יורד לעשירית.

image006

הבסיס הזה בשימוש במדינות כגון ארה”ב, יפן, טורקיה וטייואן.  חדרי מחשב שבהם הוא הותקן עברו רעידות אדמה קשות ללא הפרעה לתפקודם.

למי שמעוניין ביותר מידע מוזמן לכתוב לי.


Add comment אוגוסט 10, 2008

CDU ( או PDU ): הסרת עומסים חכמה מבטיחה רציפות עסקית

רציפות עסקית (uptime) או אפס זמן השבתה (zero downtime) היא הגורם המניע החשוב ביותר בתכנון ובהפעלה של מרכזי נתונים כיום, מפני שהעלות של כל דקה שהמערכות מושבתות היא אלפי דולרים. חברות המפעילות מרכזי נתונים ברמה 3 וברמה 4 מחזיקות גם באתרים מרוחקים וגם באתרים משותפים (co-location facilities) שרתים אשר חיוניים לתפקודה השוטף לא פחות מהשרתים הממוקמים באתר הראשי. כדי להבטיח רציפות עסקית יש צורך בפתרונות חדשים וחדשניים. אחד הפתרונות הוא יחידות חכמות לחלוקת זרם בארון (CDU - Cabinet Power Distribution Units) שיכולות לספק יכולת הסרת עומסים חכמה (Smart Load Shedding).  הפתרון מבוסס על CDU של חברת    Server Technology               
הסרת עומסים חכמה מאפשרת למפעיל להסיר עומסים על סמך שלושה משתנים תפעוליים חשובים: 

1) האם האל-פסק פועל מהמצברים
2) הטמפרטורה בארון עולה מעל המותר
3) העומס הנוכחי עולה על המותר

 משתני המפתח הללו מאפשרים למשתמש לקבוע מראש אילו מכשירים אינם חיוניים לפעילות השוטפת, להסיר אותם במקרים שמתעוררת בעיה ובכך להבטיח רציפות עסקית ולהגן על המכשירים החיוניים שבתוך הארון.

מי שמעונין ב white paper המלא שכתבנו בנושא זה מוזמן לכתוב לי ל yigals@schneider.co.il ואשלח לו / לה במיידי.  כמו כן יש דיון בנושא יישום נכון של  יתירות ב PDU בפוסט קודם

חג שמח


Add comment אפריל 21, 2008

Metered PDU : יישום נכון של יתירות בחדרי המחשב

האם ספקי כוח כפולים בשרת משפרים את שרידות חדר המחשב? 

אספקת חשמל היא יסוד בסיסי בתשתית חדר המחשב.  הפסקת חשמל, או מערכת חשמל באיכות ירודה היא הסיבה העיקרית ל”נפילת” חדרי המחשב. לעיתים קרובות, קריסת מערכות החשמל של החדר מתקיימת לא בעת הפסקת חשמל אלא כתוצאה מטעות מקומית או תכנונית, אך בעיקר בשימוש בנוהגים   (Practices)   לא עדכניים.

מערכת אספקת החשמל של חדר המחשב מורכבת משש רמות:

1. הגריד – חברת החשמל וארון מרכזי
2. גנראטור גיבוי ומתג העברה אוטומטי ( ATS )
3. מערכת גיבוי אל פסק ( UPS ) ומתג BYPASS
4. ארון החשמל
5.PDU  - Power Distribution Unit  ברמת הארון
6. ספקי הכוח של השרתים עצמם

מנהלי אולם המחשב בדרך כלל אינם מעורבים ב 4 הרמות הראשונות, אך יש להם אחריות למדיניות ויישום של רמות 5 ו 6 .  לא מעט נפילות מביכות מתרחשות כתוצאה ישירה מיישום שגוי של ה PDU. 

כמעט לכל השרתים הנמכרים היום יש שני ספקי כוח.  עובדה זו יכולה לשפר מאוד את זמינות המידע אם היישום הפיזי הוא  נכון.  במקרים רבים, בשל יישום שגוי, שני ספקי כוח אינם מוסיפים ערך כלל ויתרון זה מתבזבז או אף הופך לחיסרון.

בחדר מחשב ברמה 4  ( Tier 4 ) יש שתי מערכות של אספקת  החשמל ובכל מערכת (ענף) מצויים  כל 6 המרכיבים שהוזכרו מעלה. כל ענף יכול לתמוך ב 100% מצרכי החדר. זוהי יתירות של 2N  וזה גם המחיר:  עלות כפולה. 

בשל שיקולי עלות, מעטים חדרי המחשב של Tier 4  ולכן אין לנו בד”כ יתירות של 2N.  אנו מתפשרים   משיקולי עלות- תועלת ואילוצים אחרים.    

נתמקד אם כך בשיפור היתירות בעלות נמוכה  ובדרכים שאפשריות לנו כמנהלי אולמות המחשב ליישם בקלות ובמהירות כלומר בסעיפים 5 ו 6.

במקרים בהם מותקן PDU אחד ברמת הארון, הרי שהיתירות מוגבלת רק למקרה של כשל באחד מספקי הכוח של השרת.  ברור שזו לא חוכמה גדולה וזה גם לא מקרה מעניין.

ברוב המקרים מותקנים שני PDU בארון.  תקוותנו השלמה היא שכל ספק כוח מחובר ל PDU אחר. במקרים כאלו כל ספק כוח עובד ב 50% מהעומס.  במקרה של כשל  בספק אחד, עובר כל העומס לספק השני.  תצורה זו נוטעת במנהל החדר תחושה של בטחון בזכות היתירות. עם זאת, רבים אינם מודעים לנוהגים הנכונים ( best practices ) ומיישמים זאת בצורה לא נכונה. 

לדוגמא,  ראיתי מקרים רבים בהם ה PDU מועמס ל 60% מיכולתו.  ובכן מה הבעיה? 
הבעיה היא שבמקרה של כשל בענף A, כל העומס מועבר ל  PDU B . במקרה כזה, PDU B  סופג עומס של 120% והארון נופל.    

נוהגים נכונים:

חוק מס 1:  העומס על שני ה PDU ( ביחד) בארון צריך להיות לא יותר מ 80% מהעומס המקסימאלי של הארון 

חוק מס’ 2:  העומס המקסימלי על כל PDU צריך להיות לא יותר מ 40% מהעומס המקסימאלי של הארון.

כלומר, אם הנקודה מאפשרת 20A  לארון , כל PDU יכול להיות מועמס ל 8A לכל היותר , ושניהם ביחד 16A ( כלומר 80% מ 20A)

מומלץ מאוד להתקין PDU שהוא Metered , כלומר ניתן לראות מהו העומס על ה PDU באמפר.  בישראל קוראים לזה בדרך כלל PDU חכם  (להבדיל מ PDU מנוהל שמאפשר גם כיבוי והדלקה מרחוק)

מומלץ מאוד לבחור ב Meterd PDU (חכם) שמאפשר גישה מרחוק דרך IP ולקבל התראות ב SNMP במקרה והעומס עובר את רמת הסף המותרת. זה מוריד מאוד את עומס העבודה הכרוך בפיקוח על נושא זה ומשפר מאוד את אמינות חדר המחשב. דוגמאות לפסי שקעים חכמים ומנוהלים  והנה PDU חדש וחכם במיוחד

לחזרה לבלוג הקליקו כאן


Add comment פברואר 27, 2008

מה יקרה לחדר המחשב שלך ברעידת אדמה?

גם בזמן רעידת אדמה מתונה יחסית, ארונות השרתים בחדר המחשב עלולים לקרוס. 

התוצאה:

•    Downtime
•    אובדן הכנסה
•    איבוד נתונים
•    נזק לציוד יקר ערך
•    זמן התאוששות ארוך

ראו תמונה מחדרי מחשב בקליפורניה לאחר רעידת אדמה של 6.7 בסולם ריכטר.

image002 

נהוג לחשוב, שמיגון IT מפני רעידות אדמה הוא עניין יקר ומורכב.  לא כך הדבר. ניתן למגן היום בקלות רבה ארונות שרתים ואחסון קריטיים מפני רעידות אדמה.

מעט רקע: רעידות אדמה נמדדות בדרך כלל לפי סולם ריכטר. סולם זה הוא סולם לוגריתמי. כלומר, רעידת אדמה בעוצמה 6 לפי סולם ריכטר חזקה פי 10 מרעידה בעוצמה 5.

בארה”ב קיים תקן טלקורדיה המגדיר ארבע רמות סיכון לפי מיקום גיאוגרפי בארה”ב. התקן מגדיר את רמה 4 (מדינת קליפורניה) כרמת הסיכון הגבוהה ביותר.  בדיקה לפי תקן זה לרמה 4 מעמידה את ציוד ה IT ברעידות המדמות רעידת אדמה בעוצה של 8.3 לפי סולם ריכטר.

קיים  בסיס לבידוד סיסמי שמבודד את השפעת רעידת האדמה מן הארון.  הבסיס משתמש בשיטות המשמשות מהנדסים ברחבי העולם לצורך הגנה על בניינים,גשרים ומבנים הנדסיים שונים מפני רעידות אדמה. 

image006

הבסיס המבודד עבר בהצלחה רבה מבחנים שנעשו בארה”ב וביפן לפי התקן המחמיר של ZONE 4 . מבחן לפי תקן זה מדמה רעידת אדמה של עד  8.3 לפי סולם ריכטר.  ראו סרט.

ניתן אם כך היום להבטיח שרידות של שרתים ומערכות IT קריטיות  גם בעת רעידות אדמה חזקות.  ניתן להשיג שרידות זו בקלות ובעלות נמוכה יחסית.  ראו תמונות של ארונות שרתים ואחסון  בחדר מחשב רגיל.  ארונות אלו מוגנים מנזקי רעידות אדמה.

image008

 image009

בחדרי מחשב עובדים שלא ניתן להשבית בהם ציוד, ניתן לבצע התקנה חמה עם מערכות עובדות. ראה תמונה.  בפרויקט זה הלקוח מחדר המחשב של בואינג בארה”ב, אנו מרימים את ארונות השרתים באמצעות מערכת הידראולית שתוכננה במיוחד ליישום זה.  הבסיסים הותקנו מתחת לארונות החמים, ואח”כ הורדו הארונות בזהירות.

image012

חברות מובילות בעולם ,משתמשות בשיטה זו בכדי להשיג את ההגנה הגבוהה ביותר למסגרות ולציוד ה-IT היקר שלהן.


Add comment פברואר 7, 2008


Top Posts

רשומות אחרונות

Blogroll

Categories

Tags Cloud

אולמות מחשב ארונות מקוררי מים הארקה חדר מחשב ירוק חוות שרתים חשמל לחות מרכזי נתונים ניהול חדרי מחשב ניהול כבילה רעידות אדמה רעש רצפה צפה שדרוג חדרי מחשב שרידות שרתי להב ASHRAE Best Practices Blade Servers Data center green data center Green IT grounding a data center High Density High Density Cooling KVM KVM Over IP Paragon PDU / Fail safe Switch row cooling Uncategorized virtualization Water Cooling

עמודים

ארכיון

הבלוג הוקם ומנוהל בסיוע: