Posts tagged ‘CDU’
מה בין הטמפרטורה בחדרי השרתים לבחירת ה PDU ?
כדי לחסוך בחשבון החשמל, ארגונים נאורים מכוונים את מערכות מיזוג האוויר בחדרי השרתים כך שהאוויר הקר שנצרך על ידי השרתים יהיה בסביבות 24 מעלות צלזיוס. בפוסט הזה נידרש להשלכות של מהלך זה על ה Rack PDU .
מהי הטמפרטורה בחלקו האחורי של ארון השרתים? ובכן זה תלוי בשרתים. יש שרתים שפולטים אוויר חם ב 10 מעלות מהאוויר הקר שינקו. יש שרתים, בעיקר שרתי להב ושרתי HPC, שפולטים אוויר חם ב 25 -20 מעלות מהאוויר הקר שינקו. להפרש הטמפרטורה הזו אנחנו קוראים Delta T.
אם טמפרטורת האוויר הקר שיונק השרת היא 25 מעלות, הרי שבהסתמך על הכתוב לעיל, הטמפרטורה בחלקו האחורי של הארון יכולה לנוע בין 35 ל 50 מעלות.
כבר פגשתי מנהלי חוות שרתים שנחרדו מטמפרטורות אלו. אל חשש, מה שחשוב לפעולתו התקינה של השרת היא הטמפרטורה (והלחות) של האוויר הנכנס לשרת. לא של האוויר היוצא ובוודאי לא הטמפרטורה במקומות אחרים בחלל החדר.
עם זאת, בחלק האחורי של ארון השרתים יש ציוד אקטיבי. וחשוב מאוד לוודא שציוד זה יכול לעבוד בטמפרטורות של 55 מעלות.
פסי השקעים החכמים/ מנוטרים ( PDU ) הם חלק חיוני מהדטה-סנטר המתקדם. מדובר בציוד אקטיבי לכל דבר וחשוב מאוד לוודא שהם יכולים לעמוד ולעבוד בטמפרטורת סביבה של 55 מעלות בחלקו האחורי של הארון.
יצרני Rack PDU העומדים בכך: Server Technology, Raritan, Emerson .
מדדים להתייעלות אנרגטית בחדרי מחשב
כאשר חדרי המחשב צורכים יותר ויותר אנרגיה, ועלות חשבון החשמל נהפכת למרכיב משמעותי מהוצאות התפעול של חדר המחשב ( שמעתי כבר על עד 40% ) , ברור שיש מקום להתייעלות ששכרה הוא חיסכון רב.
התייעלות אנרגטית מאפשרת גם לחדרי IT שהגיעו, לכאורה, לקצה קיבולת התשתית שלהם, להשיב לעצמם קיבולת "אבודה" ולהגיב ביתר קלות לצרכי הארגון.
כמו תמיד, כדי להשתפר, עלינו בראש וראשונה להבין היכן אנו נמצאים היום ואח"כ למדוד את התקדמותנו. כיצד למדוד אם כן את היעילות בצריכת האנרגיה של חדר המחשב ?
ארגון הגריד הירוק הציע שני מדדים: PUE ו DCiE אותם הזכרנו בפוסט קודם. מכון UPTIME (www.uptimeinstitute.org) מציע 4 מדדים לבחינת היעילות האנרגטית של חדר המחשב. שניים מהם מעניינים במיוחד.
SI-POM: סה"כ צריכת הספק של חדר המחשב לחלק בצריכת ההספק של כל ציוד ה IT כפי שהוא נמדד בשקעי החשמל של הציוד (או בפסי השקעים). מתקבל מס' טהור שכן חילקנו וואט ב וואט.
כיצד מודדים? את המונה מדדנו בשעון החשמל של החדר. את המכנה מדדנו על ציוד ה IT (פסי שקעים מתקדמים מספקים נתון זה ).
H-POM: צריכת הספק (AC ) של ציוד ה IT ב וואט כפי שהוא נמדד בשקע החשמל שלו חלקי צריכת הספק DC של רכיבי המחשוב .
כיצד מודדים? את המונה ניתן לקבל מפס שקעים מתקדם המאפשר קבלת נתונים מכל שקע . טכנולוגיה זו נקראת POPS – per outlet power sensing . את המכנה ניתן לקבל מנתוני ציוד ה IT עצמו.
למנהל חדר המחשב שמגרד את פדחתו במבוכה היכן לאתר נתונים אלו מזומנת תשובה מפתיעה. פס השקעים, מה שהיה המוצר הכי פחות מעניין טכנולוגית בסביבת חדר המחשב הפך למוצר היי-טק לכל דבר . פס שקעים ( PDU ) מתקדם מאפשר איסוף והצגת נתונים של צריכת החשמל של כל שרת וכל ארון שרתים. ניתן לגשת ל PDU ב IP , לשלוט על כל שקע בנפרד, לשגר התראות, לוודא יתירות ואף לבצע הסרת עומסים אלגנטית. לגבי הנתונים למדדים שהזכרנו מעלה, פס השקעים המתקדם יאסוף ויבקר את נתוני צריכת האנרגיה של כל ציוד ה IT. לקבלת white paper בנושא זה , כתבו לי.
CDU ( או PDU ): הסרת עומסים חכמה מבטיחה רציפות עסקית
רציפות עסקית (uptime) או אפס זמן השבתה (zero downtime) היא הגורם המניע החשוב ביותר בתכנון ובהפעלה של מרכזי נתונים כיום, מפני שהעלות של כל דקה שהמערכות מושבתות היא אלפי דולרים. חברות המפעילות מרכזי נתונים ברמה 3 וברמה 4 מחזיקות גם באתרים מרוחקים וגם באתרים משותפים (co-location facilities) שרתים אשר חיוניים לתפקודה השוטף לא פחות מהשרתים הממוקמים באתר הראשי. כדי להבטיח רציפות עסקית יש צורך בפתרונות חדשים וחדשניים. אחד הפתרונות הוא יחידות חכמות לחלוקת זרם בארון (CDU – Cabinet Power Distribution Units) שיכולות לספק יכולת הסרת עומסים חכמה (Smart Load Shedding). הפתרון מבוסס על CDU של חברת Server Technology
הסרת עומסים חכמה מאפשרת למפעיל להסיר עומסים על סמך שלושה משתנים תפעוליים חשובים:
1) האם האל-פסק פועל מהמצברים
2) הטמפרטורה בארון עולה מעל המותר
3) העומס הנוכחי עולה על המותר
משתני המפתח הללו מאפשרים למשתמש לקבוע מראש אילו מכשירים אינם חיוניים לפעילות השוטפת, להסיר אותם במקרים שמתעוררת בעיה ובכך להבטיח רציפות עסקית ולהגן על המכשירים החיוניים שבתוך הארון.
מי שמעונין ב white paper המלא שכתבנו בנושא זה מוזמן לכתוב לי ל yigals@schneider.co.il ואשלח לו / לה במיידי. כמו כן יש דיון בנושא יישום נכון של יתירות ב PDU בפוסט קודם
חג שמח
Metered PDU : יישום נכון של יתירות בחדרי המחשב
האם ספקי כוח כפולים בשרת משפרים את שרידות חדר המחשב?
אספקת חשמל היא יסוד בסיסי בתשתית חדר המחשב. הפסקת חשמל, או מערכת חשמל באיכות ירודה היא הסיבה העיקרית ל"נפילת" חדרי המחשב. לעיתים קרובות, קריסת מערכות החשמל של החדר מתקיימת לא בעת הפסקת חשמל אלא כתוצאה מטעות מקומית או תכנונית, אך בעיקר בשימוש בנוהגים (Practices) לא עדכניים.
מערכת אספקת החשמל של חדר המחשב מורכבת משש רמות:
1. הגריד – חברת החשמל וארון מרכזי
2. גנראטור גיבוי ומתג העברה אוטומטי ( ATS )
3. מערכת גיבוי אל פסק ( UPS ) ומתג BYPASS
4. ארון החשמל
5.PDU – Power Distribution Unit ברמת הארון
6. ספקי הכוח של השרתים עצמם
מנהלי אולם המחשב בדרך כלל אינם מעורבים ב 4 הרמות הראשונות, אך יש להם אחריות למדיניות ויישום של רמות 5 ו 6 . לא מעט נפילות מביכות מתרחשות כתוצאה ישירה מיישום שגוי של ה PDU.
כמעט לכל השרתים הנמכרים היום יש שני ספקי כוח. עובדה זו יכולה לשפר מאוד את זמינות המידע אם היישום הפיזי הוא נכון. במקרים רבים, בשל יישום שגוי, שני ספקי כוח אינם מוסיפים ערך כלל ויתרון זה מתבזבז או אף הופך לחיסרון.
בחדר מחשב ברמה 4 ( Tier 4 ) יש שתי מערכות של אספקת החשמל ובכל מערכת (ענף) מצויים כל 6 המרכיבים שהוזכרו מעלה. כל ענף יכול לתמוך ב 100% מצרכי החדר. זוהי יתירות של 2N וזה גם המחיר: עלות כפולה.
בשל שיקולי עלות, מעטים חדרי המחשב של Tier 4 ולכן אין לנו בד"כ יתירות של 2N. אנו מתפשרים משיקולי עלות- תועלת ואילוצים אחרים.
נתמקד אם כך בשיפור היתירות בעלות נמוכה ובדרכים שאפשריות לנו כמנהלי אולמות המחשב ליישם בקלות ובמהירות כלומר בסעיפים 5 ו 6.
במקרים בהם מותקן PDU אחד ברמת הארון, הרי שהיתירות מוגבלת רק למקרה של כשל באחד מספקי הכוח של השרת. ברור שזו לא חוכמה גדולה וזה גם לא מקרה מעניין.
ברוב המקרים מותקנים שני PDU בארון. תקוותנו השלמה היא שכל ספק כוח מחובר ל PDU אחר. במקרים כאלו כל ספק כוח עובד ב 50% מהעומס. במקרה של כשל בספק אחד, עובר כל העומס לספק השני. תצורה זו נוטעת במנהל החדר תחושה של בטחון בזכות היתירות. עם זאת, רבים אינם מודעים לנוהגים הנכונים ( best practices ) ומיישמים זאת בצורה לא נכונה.
לדוגמא, ראיתי מקרים רבים בהם ה PDU מועמס ל 60% מיכולתו. ובכן מה הבעיה?
הבעיה היא שבמקרה של כשל בענף A, כל העומס מועבר ל PDU B . במקרה כזה, PDU B סופג עומס של 120% והארון נופל.
נוהגים נכונים:
חוק מס 1: העומס על שני ה PDU ( ביחד) בארון צריך להיות לא יותר מ 80% מהעומס המקסימאלי של הארון
חוק מס' 2: העומס המקסימלי על כל PDU צריך להיות לא יותר מ 40% מהעומס המקסימאלי של הארון.
כלומר, אם הנקודה מאפשרת 20A לארון , כל PDU יכול להיות מועמס ל 8A לכל היותר , ושניהם ביחד 16A ( כלומר 80% מ 20A)
מומלץ מאוד להתקין PDU שהוא Metered , כלומר ניתן לראות מהו העומס על ה PDU באמפר. בישראל קוראים לזה בדרך כלל PDU חכם (להבדיל מ PDU מנוהל שמאפשר גם כיבוי והדלקה מרחוק)
מומלץ מאוד לבחור ב Meterd PDU (חכם) שמאפשר גישה מרחוק דרך IP ולקבל התראות ב SNMP במקרה והעומס עובר את רמת הסף המותרת. זה מוריד מאוד את עומס העבודה הכרוך בפיקוח על נושא זה ומשפר מאוד את אמינות חדר המחשב. דוגמאות לפסי שקעים חכמים ומנוהלים והנה PDU חדש וחכם במיוחד