Posts filed under ‘UPS’

הקלות הבלתי נתפסת של נפילת מרכזי מחשוב

איני בקיא בלטינית, דבר שלא הפריע לי רבות במהלך חיי, אך ביטוי אחד בלטינית חקוק בזיכרוני מאז ששמעתי את אחד ממורי הבלתי נשכחים משתמש בו:   " Perpetuum Mobile "בתרגום לעברית – תנועה נצחית. מכונת תנועה נצחית היא מכונה היפותטית שמבצעת עבודה או תנועה ללא הפסק מבלי לצרוך אנרגיה חיצונית.  מכונות תנועה נצחית הן בלתי אפשריות למימוש לפי ההבנה המדעית של ימינו שכן הן מנוגדות לחוקי הפיזיקה.  מפאת גילי המתקדם והסתיידות העורקים הבלתי נמנעת המתלווה לכך איני זוכר בדיוק באילו חוקים מדובר ואני מקווה שהקורא לא ייטור לי על כך.

ההנהלה הבכירה של ארגונים רבים נוטה לעיתים לחשוב על הDatacenter הארגוני כחסין מנפילות. קיים תמיד ועובד תמיד. מכונה של תנועה נצחית. כל כך נצחית עד שאין להשקיע משאבים ואנרגיה מחשבתית באספקטים של המשכיות העסקית הקשורים בחדרי המחשב.

מחקר של חברת Ponemon אליו התוודעתי בכנס AFCOM האחרון הראה שנפילות של מרכזי מחשוב תכופות הרבה יותר משחשבתי. המחקר כלל שיחות עם 450 מנהלי חדרי מחשב בארה"ב והתמקד בתקופה של 24 החודשים האחרונים. 41 מתוך הנשאלים זכו לביקור ותחקיר מעמיק באתר הדטה סנטר עצמו כדי לחקור את הסיבות והנסיבות הקשורות לאובדן ההמשכיות העסקית שלו.

לא פחות מ 95% ממרכזי המחשוב שנדגמו סבלו מקריסה משמעותית ( unplanned downtime ) אחת או יותר  בשנתיים האחרונות. ממוצע הקריסות בשנתיים האחרונות היה 2.4 פעמים בשנתיים לקריסה מליאה של הדטה סנטר ו 6.8 פעמים בשנתיים לקריסה חלקית. קריסה חלקית מוגדרת כנפילה של שורת ארונות אחת או יותר.

הסקטור הבנקאי וחוות האירוח ( Co-Location )  הראו ביצועים טובים יותר מהממוצע אך לא בהרבה: הם קרסו באופן מלא 1.8 ו 1.9 פעמים ( בהתאמה) בשנתיים האחרונות. הביצועים של סקטור הציבורי והרפואי היו פחות טובים מהממוצע. אישית הופתעתי מהממצאים משום שהם מראים שחוות האירוח בארה"ב אינן מספקות רציפות עסקית טובה יותר ממרכזי המחשוב הארגוניים.

זמן הדמימה ( downtime ) הממוצע לקריסה מליאה של הדטה סנטרים שקרסו היה 102 דקות .  זמן הדמימה הממוצע לקריסה חלקית  של הדטה סנטרים שקרסו היה 152 דקות.

החוקרים ביקרו ב 41 ממרכזי האירוח שקרסו כדי לאמוד את העלות הממוצעת של נפילת מרכזי המחשוב.  עלות קריסה מליאה של חוות השרתים הייתה כ 680,000 דולר בממוצע ועלות קריסה חלקית הייתה 258,000 דולר בממוצע. השונות בנתון זה היא גבוהה מאוד בהתאם לסקטור העסקי. בענף המלונאות עלות הקריסה הממוצעת היה כ 85,000 $ בלבד לעומת M1.1 $ בסקטור התקשורת.  עלות הקריסה של מרכזי המחשוב נובעת בעיקר מאובדן הכנסות, אובדן נתונים, נזק לחומרה, אובדן שעות עבודה, ואובדן לקוחות.

היריעה קצרה מכדי שנוכל להגיע לדיון מעמיק בסיבות ובנסיבות הקשורות לקריסה של חדרי שרתים וכיצד למנוע אותן. די אם נאמר שניהול מתקדם של הדטה סנטר מחייב בקרה ברמות שאינן נפוצות היום בישראל. אסתפק בדוגמה קצרה אחת מני רבות. דיון מעמיק יותר אנו מספקים בהדרכות שאנו עורכים ללקוחות בנושא נוהגים מיטביים ( Best Practices ).

98% מהפסקות החשמל בארה"ב אורכות פחות מ 10 שניות. במהלך אותו זמן קצר, עובר העומס מהחדר אל מערכות האל-פסק ( UPS ) ואלו, כמעט תמיד, תלויות במצברים לאספקת האנרגיה החשמלית. אחת הסיבות המובילות לקריסה של חוות שרתים היא לא אחרת מהמצברים. מצברי הגיבוי הם מוצרים אלקטרו-כימיים עשויים בטכנולוגיה בת 200 שנה והם מככבים ברשימת הסיבות המובילות לקריסת מרכזי מחשוב ב58%  מהמקרים!

יתכבד נא המנמ"ר ויסור לחדר האנרגיה שלו. אנחש שלא ביקר שם זמן רב ואולי אף פעם לא. בכל "בנק" של מצברים, יש בדרך כלל עשרות מצברים. בכל מצבר – 6 תאים. כלומר, מאות תאים חשמליים מזינים את האל פסק שלנו. בשורה התחתונה,  תא כושל אחד, יכול להפיל את מרכז המחשוב.

שלוש השיטות הנפוצות בישראל להתמודד עם סיכון זה הן
·    לא לעשות דבר ולקוות לטוב (אופטימיות היא תכונה כובשת)
·    או להחליף מצברים כל 3 שנים ( הוצאה עצומה ומיותרת).
·    המדקדקים מזמינים ספק שיבצע בדיקה למצברים כל חצי שנה או שנה שזה טוב וראוי אך יקר ולא מקטין את הסיכון ברמה ניכרת.

בקרת מצברים בזמן אמיתי

חיישנים ותוכנה המאפשרים לבקר בזמן אמיתי את "בריאות" המצברים


הנוהגים המתקדמים של היום קובעים שיש לבקר את המצברים באופן רציף ובזמן אמיתי באמצעות מערכת חיישנים ייעודיים אשר משדרים את נתוני המצבר דרך IP לשרת ייעודי. התוכנה מאפשרת לא רק לבקר את "בריאות" המצברים אלא גם לחזות במדויק מתי יגיעו למצב של כשל וניתן להחליף אותם מבעוד מועד. שימוש מעין זה של מערכת בקרת מצברים מאפשר לא רק לצמצם סיכונים באופן משמעותי אלא גם להוריד את עלויות התפעול השוטפות.

את בקרת המצברים ניתן לבצע או על ידי רכש חומרה ייעודית או כשירות מבוסס IP שבמסגרתו אנו מתקינים את מערכת הבקרה ומבצעים את ניתוח הנתונים וניהול האתראות דרך IP.  לפרטים, פנו אלי או לאבי סולומון avi@schneider.co.il

מאי 7, 2011 at 4:48 pm כתיבת תגובה

UPS : פיתוח ישראלי ל-IT ירוק בתחום מערכות אל-פסק

אני שמח להביא לבלוג זה מאמר מעניין מאוד פרי עטם של מאיר אזרד מהנדס חשמל בכיר באינטל – ישראל ואבי פינס, CTO של אביאם מערכות. מאמר מאיר עיניים זה מראה כיצד ניתן באמצעות חשיבה רעננה לשפר את נצילות מערכות חדרי המחשב, לחסוך אנרגיה וגם כספים רבים. שיטת ECO MODE בשימוש במערכות אל פסק שנבחנה על ידי המהנדסים אזרד ופינס אומצה ע"י חברת ליברט העולמית ומשמשת חברות מובילות ברחבי העולם.

1. מבוא

שיטת INTELLIGENT ECO MODE)  IEM) , אשר מוצגת במאמר זה, מתבססת על עקרון קיים המכונה ECO (הזנת העומס מרשת החשמל תוך מעבר מהיר ל-ON LINE במקרה של הפרעות חשמל). שיטת IEM מספקת הגנה לעומס מפני הפרעות והפסקות חשמל ובנוסף מאפשרת שליטה של מערך בקרה מרכזי למעבר למצב ON LINE במקרה שצפויות הפרעות קשות או בזמן ביצוע פעילויות קריטיות במערכת החשמל. שיטת IEM הינה יוזמה של חברת אינטל לטובת קידום חיסכון באנרגיה.ליישום השיטה ופיתוחה נשכרה מחלקת המו"פ של חברת EMERSON-LIEBERT והתוצאה מיושמת כיום במצב "הרצה" בחברת אינטל חיפה זה כ-6 חודשים ומניבה תוצאות משביעות רצון.

עקרון ה-IEM מבוסס על הגדרות זמני התגובה והמעבר על פי ניתוח אופייני זמן תגובת מערכות מחד, ואופייני הרגישות של העומסים (למשל: מערכות קריטיות ומחשבים) מאידך, ניתן לקבוע כי הגנת העומס נשמרת גם בשיטת IEM.

פעולה בשיטת IEM פותחת אפשרויות יישום ושימוש בטוחות בשימוש עקרון ה ECO תוך הקטנת בזבוז החשמל במערכות האל פסק בערך ב-8% ומביאה לחיסכון משמעותי בעלויות החשמל.

שיטת IEM מסתמכת על טכנולוגיות קיימות וניתנת ליישום מהיר בשטח בשינוי תוכנה ובקרות בלבד. החיסכון הצפוי בהפעלה בהיקף מלא עשוי להגיע למאות אלפי ₪ בשנה.

2. מערכות אל פסק בשיטת המרה כפולה (On-Line)

מבנה מערכת אל פסק הפועלות בשיטת המרה כפולה מתואר בציור מספר 1.

clip_image002[4]

ציור 1: מערכת אל פסק On-Line

המערכת כוללת מיישר/מטען, ממיר, מצברים ומפסק סטטי. במצב עבודה רגיל המיישר מיישר את מתח הרשת ומזין את הממיר, הממיר מייצר מחדש מתח סינוסי טהור ומיוצב ומזין את העומס הקריטי (מסלול 1). במקרה של הפרעות או הפסקות חשמל, הזנת הממיר נמשכת ללא הפרעה מהמצברים למשך זמן הגיבוי המתוכנן (מסלול 2). לאחר חזרת החשמל המיישר/מטען טוען מחדש את המצברים. המפסק הסטטי מבצע עקיפה אוטומטית ומסונכרנת של המערכת ומזין את העומס מהרשת במקרה של תקלה בממיר ועומס יתר (מסלול 3). ניתן לבצע גם עקיפה ידנית לצורך תחזוקה או השבתה של מערכת האל פסק.

מערכת אל-פסק הפועלת בשיטת המרה כפולה מבטיחה מתח מיוצב ומסונן ברמת איכות גבוהה ביותר וללא תלות בטיב אספקת החשמל מהרשת, וזאת משום שהיא מייצרת מתח בעצמה.

שיטת המרה כפולה הינה השיטה הנפוצה ביותר במערכות בהספק מעל 2~3 קוו"א.

3. שיטת ECO

מערכות אל-פסק On-Line רבות כוללות אופציית הפעלה בשיטת ECO (קיצור של Economy). בשיטה זו המפסק הסטטי מחבר את העומס לרשת כל הזמן, במקרה של הפרעות חשמל, המפסק הסטטי עובר לעבוד מהממיר והמערכת פועלת במצב On-Line עד שמתח הרשת מתיצב, ואז היא חוזרת לעבודה מהעוקף.

אופני העבודה בשיטת ECO מתוארים בציור 2. העומס מוזן רוב הזמן מחברת חשמל (מסלול 4) ועובר להזנה מהממיר במקרה של הפרעות או הפסקות חשמל (מסלול 5). הממיר עשוי להיות מוזן מהרשת או מהמצברים (תלוי ברמת ההפרעות ברשת).

image004

ציור 2: מערכת אל פסק בשיטת ECO

שיטת ECO מוצעת בד"כ כאופציית הפעלה למערכת On-Line רגילה. היצרנים בד"כ אינם מוסרים מפרטים של תכונות אופן הפעלה זה (כגון זמן תגובה, רגישות להפרעות וכו'). הנתון היחיד שהיצרנים כן מפרטים הינו הנצילות, שהיא גבוהה מהנצילות באופן המרה כפולה רגיל.

מכיוון שאין מפרטים מסודרים לטיב מתח התפוקה, יש חשש להפעיל מתקנים קריטיים בשיטת ECO. נוסף לכך, במערכות רבות המעבר משיטת ECO לשיטת On-Line אינו פשוט ומחייב כיבוי והפעלה מחדש של המערכת. כלומר, אין אפשרות נוחה לשלוט במערכת לפי דרישות המתקן.

4. השוואה בין On-Line ל-ECO

השוואה בין השיטות (בהתיחסות למערכות בהספק של כ-500 קוו"א) מובאת בטבלה הבאה:

  On-Line ECO
נצילות 92%~93% 97%~98%
איכות מתח התפוקה גבוהה מאד גבוהה
ניסיון רב מועט/אפסי

מטבלה זו נראה בבירור כי לשיטת ECO פוטנציאל גדול לחיסכון באנרגיה, ביחוד במערכות אל פסק גדולות. השאלה המתבקשת היא – מדוע השימוש בשיטה זו מועט?

נראה לנו כי לקוחות נמנעים משימוש בשיטת ECO מהסיבות הבאות:

  • איכות מתח התפוקה ממערכת הפועלת בשיטת ECO נמוכה יותר מאיכות מתח התפוקה ממערכת הפועלת בשיטת On-Line.
  • ניסיון משמעותי בשיטת ECO יכול להתקבל רק בשימוש במתקנים גדולים "חיים".
  • אין מתנדבים לבחון את השיטה במתקנים הקריטיים שלהם…

תוסיפו לכך את העובדות הבאות:

  • אין ניסיון בשימוש בשיטת ECO במתקנים גדולים
  • תעשיית מערכות ההספק היא שמרנית
  • שיטת ECO במערכות המרה כפולה גדולות היא חדשה יחסית (מספר שנים)

והסיבה לתפוצה הנמוכה של שיטת ECO נעשית ברורה.

לזכותה של שטת ECO ניתן לאמור כי מתקנים אשר משתמשים במפסקים סטטיים ובמערכות
Off-Line מהווים הוכחה חלקית לכך שאופן ECO יכול לפעול בהצלחה.

5. מהי איכות מתח התפוקה הנדרשת למערכות קריטיות?

שרתים ומחשבים מודרניים מתוכננים לפעול בתחום מתחי הזנה רחב והרגישות שלהם להפרעות מתח הינה נמוכה. בציור 3 מובא גרף ITIC, שהינו התקן המקובל לעמידות ציוד מיחשוב בהפרעות חשמל (מחשבים שרתים וציוד הקפי של רוב היצרנים עומדים במפרטים אלה). מגרף זה ניתן לראות כי מחשבים ושרתים מודרניים מסוגלים ל"ספוג" הפסקות חשמל של 20 מילישניות ולעמוד במתחי יתר של 500% למשך 10 מילישניות.

בציור 4 מובא גרף הרגישות של ציוד במתקני יצור של מוליכים למחצה, מהגרף נראה בבירור כי ציוד זה רגיש אף פחות משרתים ומחשבים.

למרות האמור למעלה, ברור שמתקנים חיוניים כגון מרכזי מחשוב צריכים הגנת On-Line כדי לתפקד במצבים קשים (למשל בזמן סערות ברקים) וכן בזמן יישומים קריטיים.

clip_image006[4]

ציור 3: גרף ITIC

clip_image007[4]

ציור 4: גרף SEMI F47

6. מהי איכות המתח במתקנים קריטיים?

משך הזמן הכולל של הפרעות מתח (כולל הפסקות) באתרים אמינים יחסית הינו בערך 0.04% (3 שעות לשנה בערך). נתון זה מבוסס על סקרים פנימיים באתרי אינטל בישראל.

יש לזכור, כמובן, שזהו סך הזמן הכולל היכול להתבטא במספר רב של הפרעות קצרות שכל אחת מהן עלולה להשבית מרכז מחשוב או ציוד קריטי לזמן ארוך מאד.

משמעות הנתון הזה הוא ש-99.96% מהזמן, מערכת אל-פסק שעובדת בהמרה כפולה משפרת איכות מתח שהיתה ממילא איכותית דיו לעומס הקריטי.

כלומר, ניתן להגדיר את הפסדי ההמרה במערכת On-Line, במשך 99.96% מהזמן, כבזבוז.

7. IEMIntelligent ECO Mode

מניתוח הנתונים שסקרנו לעיל, הגענו לאיפיון משופר של שיטת ECO – אשר יענה על הדרישות של אתרים קריטיים. להלן תקציר המפרטים העקריים של IEM:

  • IEM הוא שיפור של שיטת ECO הקיימת
  • IEM מאפשר שליטה מלאה בזמן אמיתי על אופן הפעולה של מערכת האל-פסק (ECO או On-Line) ומאפשר העברה בין אופני הפעולה ללא השפעה על העומס
  • IEM תוכנן ונבדק לעמידה בגרף ITIC ו- SEMI F47
  • IEM מבטיח רמה מספקת של איכות התפוקה של האל פסק לדרישות העומסים הקריטיים
  • IEM מבטיח שיפור בנצילות מערכת האל פסק
  • IEM מבטיח את הגמישות הנדרשת להשגת שתי המטרות:
    • חיסכון באנרגיה (רוב הזמן)
    • שליטה להעברה להמרה כפולה כאשר נדרש

מכיון שהטכנולוגיה הבסיסית של ECO קיימת, פיתוח ובדיקת השיפורים שנדרשו עבור IEM היה קצר וזול יחסית. הפיתוח והבדיקות בוצעו ע"י מחלקת הפיתוח של "אמרסון-ליברט" על מערכות סטנדרטיות של "אמרסון-ליברט".

חשוב לציין כי הנתון הקשה ביותר לבדיקה אינו תגובת המערכת להפסקת חשמל מלאה, אלא דווקא התגובה להפרעות קטנות. לצורך זה יצרה "אמרסון-ליברט" מחולל הפרעות מיוחד בהספק של 160 קוו"א. בציור 5 מובאות צורות גלים בכניסת וביציאת המערכת הנבדקת, תחת עומס. ונראה כי אפילו הפרעה קצרה מזוהה ע"י המערכת ומתוקנת תוך זמן קצר ביותר (כ-3 מילישניות) עמוק בתוך מעטפת הביצועים הנדרשת.

בדיקות נצילות אישרו שמערכת בשיטת ECO חוסכת כ-66% מבזבוז האנרגיה של מערכת בשיטת On-Line.

image008

ציור 5: תגובת מערכת בשיטת ECO להפרעה בהזנה

8. היתרונות של IEM

שיטת IEM מתגברת על החסרונות והבעיות שמפריעות ליישום שיטת ECO:

  • אפשרות הכנסה הדרגתית ומבוקרת, של IEM למתקנים גדולים
  • מאפשר בדיקה של המערכת והממיר על העומס בכל עת (מעבר גמיש בין אופני העבודה)
  • מאפשר מניעת תקלות לעומס הקריטי ע"י העברה להמרה כפולה כאשר צפויות:
    • הפרעות והפסקות חשמל
    • סערות ומזג אויר לא יציב
    • ביצוע פרויקטים קריטיים בעומס
  • שילוב של IEM במערכות אל פסק עם יתירות מאפשר חיסכון באנרגיה מבלי לותר על איכות ההגנה (ראה דוגמה בהמשך)
  • מנהל המערכת יכול להתאים את אופן העבודה (On-Line או IEM) לתנאי העבודה. (דוגמה: ניתן להעביר את המערכות להמרה כפולה בלילה כאשר התעריף זול מחד וזמינות כוח אדם טכני לשרות נמוכה יותר)

בציורים 6-8 מובאת דוגמה ליישום של IEM במתקן עם יתירות:

העומס הקריטי מוזן משתי מערכות אל פסק (הזנה כפולה). מערכת אחת ב-On-Line והשניה ב-IEM (ציור 6). במקרה של תקלה במערכת On-Line בקרת המבנה מעבירה את מערכת מס' 2 ל-On-Line.

בשיטה זו העומס מוגן כל הזמן ברמה גבוהה וניתן לחסוך לפחות חצי מהבזבוז. אם השרתים מאפשרים קביעת רמת ההעמסה בכל אחת מההזנות (אפשרות קיימת בשרתים משוכללים) ניתן להגיע לחיסכון מכסימלי ע"י העמסה מלאה של מערכת IEM והעמסה נמוכה על מערכת ה-On-Line.

clip_image011[4]

ציור 6: יישום IEM במתקן עם יתירות (הזנה כפולה)

clip_image013[4]

ציור 7: תקלה במערכת On-Line

clip_image015[4]

ציור 8: בקרת מבנה מעבירה את מערכת IEM ל-On-Line

9. החיסכון הכספי בשימוש ב-IEM

חישוב החיסכון הכספי בעבודה בשיטת IEM צריך לכלול את החיסכון בבזבוז של המערכת עצמה, חיסכון במיזוג האויר הנדרש וחיסכון בהפסדים אחרים (בזבוז בשנאים ובכבלים וכו').

החישוב הבא בוצע למתקן טיפוסי, בעומס קבוע, בחיבור מתח גבוה, בהספק של 5000 קוו"ט במחיר 35.4 אג' לקווט"ש. התוצאות מובאות בטבלה המצ"ב:

החישוב נעשה בהנחה שהמערכות במתקן מועמסות ב-75%.

מהתוצאה נראה שהחיסכון הכספי השנתי הינו משמעותי מאד (מעל 1 מיליון ₪ לשנה).

 

On Line ECO Mode הפרש
הפסדי אל-פסק 7% 2.7% 4.3%
ס"ה הפסדים במתקן* 10.8% 4.8% 6.0%
הספק עומס במתקן kW 5000 kW
הפסדים kW 605 252 353
צריכה שנתית בקוט"ש 3,094,736
עלות אנרגיה ב₪\קוט"ש 0.354
חיסכון שנתי ב-₪ ₪ 1,095,537

10. סיכום ומסקנות

  • העובדה שהמדובר בשיפור בטכנולוגיה קיימת איפשר לנו:
    • להשיג חיסכון משמעותי בעלויות אנרגיה
    • לבצע את הפיתוח בלוח זמנים קצר ביותר
    • עלות הפיתוח היתה נמוכה מאד יחסית לחיסכון
  • החיסכון הצפוי באנרגיה הוא משמעותי ואנו מקווים שיעודד את
    התעשיה לפתח שיפורים נוספים ב-IEM
  • שיתוף הפעולה בין "אינטל" ל"ליברט-אמרסון" – אשר שילב ידע מעשי מהשטח עם יכולות פיתוח יצר ערך נוסף למשתתפים בפרויקט

אנו רואים גם כי המודעות לסביבה ( Environmental Awareness ) היא פרמטר חדש שיש להתחשב בו בתהליך קבלת ההחלטות. וכי הקריטריונים הקודמים שהתייחסו רק להחזר השקעה מול אמינות (ROI/MTBF), מוחלפים בקריטריונים פרגמאטיים יותר אשר מתייחסים גם להיבט הסביבתי (חיסכון באנרגיה) כשיקול בהחלטה.

חשוב מאד לציין כי:

יישום שיטת IEM מחייב סקר הנדסי ומעקב ביצוע.

אין לבצע פרויקט IEM ללא סקר הנדסי ומעקב ביצוע!

לקבלת העתק של המאמר, כתבו לי

יגאל  שניידר

דצמבר 7, 2008 at 3:11 pm 3 תגובות


פידים

הבלוג הוקם ומנוהל בסיוע: