Archive for מרץ, 2011

עמידות של חדרי מחשב ברעידות אדמה

בהמשך לפוסטים קודמים בנושא עמידות של ארונות שרתים וחדרי מחשב ברעידות אדמה , ובעקבות הרעידה הגדולה ביפן, נשאלתי מס' פעמים השבוע מה השיטה המועדפת להגנה על הרציפות העסקית של ארגונים בעלי חדרי מחשב  בעת רעידות אדמה.

קיימות שתי שיטות עיקריות:

1.    קיבוע ארון השרתים לבטון
2.    בסיס מבודד (בסיס סיסמי) מתחת לארון השרתים.

לא אחזור על הפוסטים הקודמים. חשוב רק לציין שהשיטה הראשונה מונעת את הנפילה הפיזית של הארון אך לא מונעת נזק חמור לציוד ה IT ובוודאי שאינה מסייעת רבות לקיום הרציפות העסקית. אמנם, צוות העובדים לא יפגע מנפילת ארון, אך בתום רעידת האדמה , החברה תיאלץ לרכוש ולהתקין ציוד IT חדש, כולו או חלקו, והסכנה היא לאובדן רציפות עסקית למספר שבועות. לא נוח לי להשתמש בשפה בוטה אך זהו, לעניות דעתי, כסת"ח.

הבסיס הסיסמי (קרוי ISOBASE ) מספק הגנה מליאה,  סופג את האנרגיה הקינטית של רעידת האדמה ומגן על מערכות ה IT שימשיכו לעבוד גם בעת רעידת האדמה.

הרי לינק לסרט שמשווה בין שתי השיטות.

המרעד המעבדתי מדמה את התנודות של  רעידת האדמה בעיר KOBE ביפן.    הארון השמאלי מעוגן לרצפה.  הטראומה  על ציוד ה IT בארון המעוגן לרצפה ברורה. ציוד IT שאינו מוקשח יינזק באופן בלתי הפיך.

בארון הימני לעומת זאת, ציוד ה IT ימשיך לעבוד באין מפריע. גם מערכות האחסון.

לפי מייל שקיבלתי מדון האבארד, מחברת WORKSAFE שבקשר עם לקוחותיה מיפאן, אף ארון המצויד בבסיס הסיסמי לא ניזוק ברעידת האדמה העצומה ( 9 בסולם ריכטר)  שהתרחשה בשבוע שעבר.

אני מביע את הערכתי והזדהותי עם העם היפאני בעת קשה זו.

מרץ 20, 2011 at 1:47 pm כתיבת תגובה

גל של חדשנות בחדרי המחשב

גל של חדשנות שוטף את טכנולוגיות הדטה סנטר בעולם ובישראל. תחום חדרי המחשב היה תמיד פעיל מאוד אך מנומנם ברמה הטכנולוגית. בשנים האחרונות חוקי התכנון השתנו לחלוטין וכך גם הנוהגים המיטביים ( Best Practices ).

לפני מס' חודשים נועדתי עם חברה ישראלית המתכננת חדר מחשב חדש שיעלה לאוויר, לפי תוכניותיהם, ב 2015. אמנם אני מצדיע לחברות ישראליות החושבות לטווח ארוך, אך הדבר גרם לי להרהר נוגות בלוחות הזמנים הנהוגים לעיתים בתעשייה שלנו.  פרויקט הקמה של אולם מחשוב הוא פרויקט מורכב,  יצירת אומנות יחידנית אשר הכול בה מפותח מאפס ונתפר כולו לפי צרכי הלקוח. נכון?  לא בהכרח.

אחת המגמות המתחזקות בתחום חדרי המחשב היא מודולים המבוססים על מערכות בתצורות אשר נוסו ונבדקו במפעל ( pre-configured ), וקל להתקינם בחדר המחשב ולדעת מראש את רמת הביצועים שנקבל ( Pre-engineered ).  הרחבה והגדלה ניתנים לביצוע בקלות יחסית ( scalable ) .

הגישה החדשה מאפשרת הקמה מהירה יותר, השקעה התחלתית נמוכה יותר, מתקנים יעילים יותר ולכן גם הוצאות תפעול נמוכות יותר לאורך חיי חדר המחשב.

מאחר וחברה מקימה לעצמה חדר מחשב אחת לכל 5 עד 20 שנים, הרי כשארגון מבקש להקים לעצמו חדר מחשב חדש, זו התנסות חדשה לרוב מובילי הפרויקט. אל צוות המפעל חוברים יועצים וקבלנים חיצוניים שלהם יותר ניסיון (אנו מקווים) ונוצר צוות פרויקט אשר אין לו ניסיון משותף.  הצוות מתחיל את התכנון מאפס (דבר משתלם ביותר למתכננים) ונשען על ידע לא מושלם ולא עדכני. זו הסיבה העיקרית לכך ששלב התכנון אורך בדרך כלל חודשים רבים (במקרים אחדים גם מספר שנים), כמו גם שלב הבניה, ושהפרויקט ברובו מבוסס על ניסוי וטעייה ולא על נוהגים מיטביים. גם בהתחשב בעבודה הקשה של צוות הפרויקט, עלות התמשכות הפרויקט והטעויות בהחלטות התכנוניות עולים לארגון כסף רב.  התוצאה הסופית היא חדר מחשב ייחודי באמת אשר אין זהה לו והדבר נזכר כאן לא כמחמאה (אולי להיפך) אלא כציון עובדה.

התופעות הללו מתרחשות לא רק בחדרי מחשב הנבנים במבנה חדש על קרקע בתולית (Greenfield data center ) אלא גם בפרויקטים של שדרוג חדרי מחשב ( datacenter upgrade ).  גבשדרוג חדרי מחשב מדובר בד"כ  בהוספת יכולות של אספקת חשמל ומיזוג אוויר ושיפור מערך הכבילה. וגם כאן צוותים שהוקמו אד-הוק עובדים כדי לשדרג את חדר מחשב. במרבית המקרים גם פרויקטים אלו יכולים להיות מנוהלים ביותר יעילות אם ישתמשו ב"אבני בנין" שהן Pre-Engineered, Pre-Configured.

הנוהגים המיטביים מאפשרים היום הוספת מודולים פנימיים ( Pods ) המכילים מס' משתנה של ארונות שרתים, מערכות מיזוג ממוקד ומערכות חלוקת חשמל המורידות באופן דרמטי  את זמני התכנון והיישום הנדרשים כמו גם את העלויות. ראו תמונה של POD שבו ארונות שרתים, מיזוג אוויר ותקשורת. ניתן לשלב גם אל פסק (אם כי לא נהוג).

מודול ( POD ) המכיל ארונות שרתים, תקשורת וכבילה, מיזוג אוויר ו PDU.

ניתן להרחבה ושכפול באופן מודולארי

דוגמא נאה לצורך המחשה היא חדר מחשב הנבנה על פי השמועה על ידי מייקרוסופט באיידהו שבארה"ב.  גודל החדר כ MW 5, ענק במושגים ישראליים אך לא במושגי מייקרוסופט,  והוא יושלם תוך 28 שבועות מיום חתימת החוזה. החדר בנוי ממודולים של KW 600 כ"א כל מודול בנוי ממספר מבנים טרומיים המובלים לאתר במשאית ומחוברים תוך ימים לתשתית.  ראו תמונה של חדר אנרגיה של MW 1 אשר הותקן ב 5 ימים.

חדר אנרגיה של MW 1 ב 5 ימים. נבנה במפעל. הורכב באתר.

דוגמא נוספת:  בוודאי שמעתם על מיזם ה VBLOCK של EMC  ו CISCO.  ובכן, אם חשקה נפשכם במתקן אחסון ( storage ) מתקדם ביותר, בוודאי ששקלתם את ה VBLOCK. ובכן ניתן לרכוש את ה VBLOCK ב 6 תצורות: V0, V1, V2 וכל אחת מהן ברמת מינימום ומקסימום. חברת פנדויט ( Panduit )  מציעה לדוגמה את כל התשתית הפיזית  ל VBLOCK ברמה הנדרשת במק"ט אחד. ראו תמונה:

 

במקט אחד: ארונות וכל התשתית הפיזית ל VBLOCK

VBLOCK

מרץ 10, 2011 at 7:17 pm כתיבת תגובה

חיסכון באנרגיה בזמן אמיתי ונהלים מיטביים. מה ניתן ללמוד מ eBay ?

זירת המסחר eBay היא אחת מזירות המסחר האינטרנטי הגדולות בעולם, ולכן היא דורשת שרידות מוחלטת ממרכז המחשוב שלה; כל זמן דמימה (downtime) יכשיל עסקאות ששוויין יותר מ-2,000 $ לשנייה. משום כך חייבים אנשי הצוות במרכז המחשוב העולמי של eBay לספק הן רציפות עסקית (uptime) והן גמישות ברמה הגבוהה ביותר, וכל זאת תוך שמירה על עלויות נמוכות.
זהו אתגר מורכב בהחלט, שכדי להצליח בו דרושה חדשנות מתמדת.

מאז שהתחילה לפעול, בנתה eBay שנים-עשר מרכזי מחשוב, ועומס החישובים רק הולך וגובר. לא פלא שגם עלויות התפעול של מרכזי המחשוב של החברה גדלות מדי שנה, במקביל לצמיחה העסקית הרצופה. בשל כך בנתה חברת eBay תוכנית ארבע-שנתית, והתחילה להפעיל אותה במרכזי המחשוב שלה. לתוכנית יש יעד שאפתני: להקטין את הוצאות החשמל בחצי תוך הכפלה של ביצועי החישוב; יחד עם זאת, המבנה של התשתית החדשה ישפר את המהימנות ואת מהירות התגובה התפעולית.

כדי להשיג יעדים אלה, תמזג חברת eBay את נכסיה ותקטין את מספרם של מרכזי המחשוב שלה. כל מרכז מחשוב חדש ייבנה מן היסוד במטרה להיות חסכוני באנרגיה ככל האפשר, בלי לפגוע ברציפות העסקית.
"אסטרטגיה מוצלחת במרכזי מחשוב מניחה שדרישות המחשוב יגדלו מדי שנה, אבל היא מאפשרת להם לגדול כנדרש בלי לייקר באופן פרופורציוני את עלויות התפעול," מסביר דין נלסון (Dean Nelson), דירקטור בכיר ב-eBay לתפעול ואסטרטגיה במרכזי המחשוב אותו פגשתי בכנס שערכה חברת Starline . "אנו חייבים לשבור את הקשר הליניארי שבין עומס החישובים לבין עלויות התפעול. לשם כך עלינו לעשות קפיצת דרך ביכולות שלנו בתחומי החיסכון באנרגיה, כוח החישוב וניצול השרתים."

במאי 2010 חנכה eBay את מתקן הדגל שלה, אבן הפינה של האסטרטגיה החדשה למרכזי המחשוב, פרויקט 'טופז'. במתקן זה, הממוקם בסאות ג'ורדן, יוטה, השקיעה חברת eBay את ההון הרב ביותר שהשקיעה אי פעם בפרויקט יחיד, והוא מחזיק כשליש מתשתית השרתים העולמית של החברה. אף על פי שהפריסה במרכז הנתונים כוללת את כל היתירות הנדרשת לצורך מהימנות בסיווג Tier IV, מתגאה מתקן 'טופז' בנצילות שימוש בחשמל (PUE) בגובה 1.4 בלבד.

נהלים מיטביים ליעילות מירבית
בתשתיות של 'טופז' שולבו מנגנונים חדשניים לחיסכון באנרגיה. חמישה מרכיבים מרכזיים בתכנון 'טופז' מעוררים עניין מיוחד בשל ערכם ובשל התאמתם לכל מרכז מחשוב מודרני:

1. הפרדה פיזית וסגירה של מעברים קרים /חמים כדי להגיע ליעילות קירור מירבית, התקינה eBay פתרון להפרדה בין מעברים. eBay בחרה בסגירה של המעבר החם, לא לפני שתכננה אותו בתשומת לב, ניסתה אבטיפוס שלו וביצעה מדידות. סגירת המעבר החם מתבצעת על ידי הפרדה קשיחה של המעברים ותיעול האוויר החם החוזר אל מערכות המיזוג דרך התקרה הכפולה.

האוויר החם חוזר ליחידות המיזוז דרך התקרה

2. הפצה של 400V לכל ארון בחלק מהארונות ב-eBay יושבים שרתי להב מרובים, ולכן החברה רצתה שכל המסדים יהיו מסוגלים לספק עומסים בהספק של עד 17kW. אפשר, אמנם, להשיג זאת גם בשיטה המסורתית, אבל ב'טופז' בחרו למתוח את כבלי המתח הגבוה עד לארונות, והוזילו משמעותית את העלויות. משום שכל מסד מקבל חשמל במתח 400V, מצטמצמים אובדני הכוח בשנאים מורידי המתח ועל הקווים, ויחד עם זאת החברה חוסכת בתשתיות הנחושת. eBay בחרה לספק מתח תלת-פאזי של 400V לשני פסי שקעים חכמים במסד (הנקראים גם "PDU במסד"). מערכות ה-PDU במסדים, מספקות לכל שרת מתח חד-פאזי של 240V. מתח זה נמצא בתוך טווח הפעילות של כל ספק כוח של ציוד IT כלשהו. בזכות ביטולן של המרות מתח מיותרות, הפצת 400V מקטינה את עלויות האנרגיה ב-2-3% בערך בהשוואה להפצת 220V.

3. מדידה מפורטת של צריכת חשמל בשרתים נהוג לומר שהמדד הכלכלי החשוב ביותר בעיניהם של צוותי התפעול במרכזי המחשוב של eBay הוא העלות המצרפית הכוללת לכל חיפוש. ומשום שכל דור שרתים חדש מציע שיפורים אדירים בביצועי ה-CPU, חברת eBay מחליפה את השרתים שלה במחזוריות של שנתיים; הרווח בביצועים פֶּר וואט גבוה ממחירו של הציוד החדש. אבל חברת eBay תקטין באמת את העלות לכל חיפוש רק אם תכלול בחישוביה את כל עלויות התפעול של כל שרת חדש שהיא רוכשת, ולא רק את מחירו. ועלות התפעול הגבוהה ביותר של כל מכשיר היא ההוצאה על צריכת החשמל שלו. כדי לאתר הזדמנויות לחיסכון המרבי, eBay התקינה במסדים מערכות PDU של חברת Raritan הקוראות את צריכת החשמל המדויקת בכל ספק כוח ובכל שרת בודד. פסי השקעים של Raritan מספקים מידע רציף על צריכת החשמל בקוט"ש בכל מכשיר בודד במרכז המחשוב, בדיוק של 1%. רמת דיוק זו מאפשרת, על פי התקינה, חיוב לקוחות על פי מדידה זו. פסי שקעים חכמים אלו מיועדים לספֵּק הן את צרכי ה-IT והן את צרכי המתקן כולו, והן מזינות, בזמן אמיתי, את הנתונים שהן אוספות למערכות ניהול המבנה ורישום הציוד של eBay. במושגי קונסורציום Green Grid, הן מבצעות ניטור PUE מקטגוריה 3 (או PUE3). "פסי שקעים חכמים נותנים לי את הדיוק שאני צריך בשביל לחשב את עלויות התפעול האמיתיות שלי בכל שרת עד האגורה האחרונה," אומר נלסון. "כך אני יכול להכיר את פרופיל היעילות של כל אחד מספקי הציוד, וכשאני מכין את סבב ה-RFP הבא של השרתים, אני יכול לגבש דרישות שיחזירו את מחירן."

4. מדידת טמפרטורה ברזולוציה גבוהה פרויקט 'טופז' שילב מנגנונים מהפכניים שונים במערכת הקירור שלו, ואז פנה להמשיך ולייעל אותה בזמן אמיתי – הן בהיבט העלויות והן בהיבט המהימנות – מתוך היכרות עם סביבת הפעילות של כל אחד מהשרתים. רוב מרכזי המחשוב מודדים ומבקרים את טמפרטורות האוויר היוצא ממערכות המיזוג ואת טמפרטורת האוויר החוזר אליהן. אבל נתונים אלה מוסרים מידע מקורב בלבד על סביבת השרתים האמיתית. הקירובים מאלצים את צוות המתקן לקחת מרווחי ביטחון ולקרר קירור עודף, וזהו צעד בזבזני, בהגדרה. חברת eBay, לעומת זאת, יודעת מהן טמפרטורות הכניסה והיציאה המדויקות בכל ארון וארון במרכז המחשוב 'טופז'. בפרט, מאמצים ב'טופז' את המלצות ASHRAE לניטור סביבתי של שרתים, ומודדים את הטמפרטורה בשלושה מפלסים של המעבר הקר: למעלה, באמצע ולמטה. מדידות אלה מתווספות למדידות במעבר החם. בזכות הניטור הרצוף יכולה eBay לכוונן את משתני הקירור ליעילות מרבית, ויחד עם זאת לקבל התראה מיידית על כל בעיה ברמת השרת. הקורא יזכור את החיישנים ותוכנת LiveImaging מאחד הפוסטים הקודמים.

בקרה המאפשרת שליטה על מיזוג האוויר ואופטימיזציה של צריכת החשמל

5. פסי צבירה (busway) עיליים להפצת חשמל ברוב מרכזי המחשוב פרוס מבוך תת רצפתי של קווי חשמל היוצאים מלוחות PDU אל הארונות. אלא שמבנה כזה מפריע לאוורור ובכך משבש את יעילות הקירור. כל זה קורה מתחת לרצפה הצפה ולכן לא זוכה לתשומת לב רבה, אבל עלול להיות משמעותי. יתרה מזאת, תכנון סטנדרטי המכין חיבורי "שוט" (power whips) תת-רצפתיים ייעודיים לכל מפסק, צורך כבלי נחושת מיותרים שאינם מנוצלים היטב, ואף מגביל את גמישות הזיווד של ארונות חדשים. כדי לפתור את הבעיה, משתמשים ב'טופז' בפסי צבירה עיליים של חברת starline להפצת חשמל אשר מאפשרים חיבור קל של הארונות למקור כוח של 400A. לאורכה של כל שורת ארונות מתוחים שני מסלולים, וכל אחד מהם מספק כוח חלופי ובכך מבטל לחלוטין את הצורך בחיבורי "שוט" תת-רצפתיים. תוך דקות אפשר להוסיף שקעים למארזים מוגנים במפסק אוטומטי בכל נקודה לאורך שורת הארונות, במקום להמתין מספר ימים עד שיגיע חשמלאי ויתקין עוד "נקודות חיבור".

סיכום
חברת eBay מעוניינת מאוד בשיפור המהימנות של מערכות המחשוב שלה, שכן זמן דמימה עולה לה 2,000 $ לשנייה, כלומר $120,000 לדקה. בגלל היקף הפעילות הגדול של החברה, היא חייבת לשמור שההוצאות על ציוד ועל חשמל לא יצאו משליטה. משום כך פיתחה eBay מודל למרכזי המחשוב שלה, המבטיח פעילות IT ברמת מהימנות גבוהה מאוד וגם מוזיל את עלויות התפעול ב-50% בהשוואה למרכזים הישנים שהיא מוציאה מפעילות בהדרגה. גם מרכזי מחשוב צנועים יותר שיאמצו את הנהלים המיטביים בתעשיית ה-IT כפי שעשתה eBay, יכולים להאריך את זמן הרציפות העסקית (uptime), לקצץ בהוצאות ולהתייעל, תוך שימוש בציוד זמין ובטכניקות ותהליכים פשוטים.

מרץ 7, 2011 at 4:32 pm כתיבת תגובה


פידים

הבלוג הוקם ומנוהל בסיוע: