Archive for יוני, 2009

הגדרות היתירות של חדרי מחשב ( Tier System )

 חברות שלהן חדרי מחשב צריכות לאזן בין שני צרכים.  הצורך ברציפות עסקית לעומת הצורך בחיסכון בהשקעות ( CAPEX) ובהוצאות התפעול ( OPEX ) .

מחד גיסא, הצורך בזמינות מידע ורציפות עסקית מכתיב יתירות בתכנון תשתית חדר המחשב.  מאידך גיסא, יתירות עולה כסף. יתירות מכתיבה השקעות משמעותיות בחומרה והוצאות תפעול גבוהות יותר בחשבון החשמל ובחוזי שירות.  על כן, על המנמ"ר להגדיר במדויק מה רמת היתירות הנדרשת בחדר שלו ולהבין את ההשלכות העסקיות כולן.

רמת היתירות מוגדרת על פי 4 רמות ( Tiers ): מרמה 1 ( Tier I ) עד רמה 4 ( Tier IV ) .  הגדרת הרמות נעשתה על יד מכון האפטיים ( www.uptimeinstitute.org ) שהוא האורים והתומים בתחום חדרי המחשב.

חדרי מחשב  ברמות  I ו II נועדו לתת מענה לטווח קצר ולתמוך בטכנולוגיה הנוכחית בלבד. אלו פתרונות טקטיים שבהם שיקול העלות הוא שיקול כמעט בלעדי. במקומות בהם ל IT חשיבות אסטרטגית נחוץ פתרון ברמות III ו IV שנותנים מענה לרציפות העסקית ומאפשרים קליטת טכנולוגיה חדישה בקלות יחסית.

Tier I:  בחדר מחשב ברמה I ניתן ביטוי לרצון החברה להכיל את ציוד ה IT בתחום בו יש תשתית מתאימה (בניגוד, למשל, לתשתית משרדית).  חדר רמה 1 טיפוסי  יהיה חדר מחשב סגור, מערכת אל-פסק ( UPS ) שתייצב את המתח ותיתן מענה להפסקות חשמל קצרות, מערכת מיזוג אוויר 24/7 וגנראטור להפסקות חשמל ארוכות יותר. אין יתירות ( רמה N ).  אין אפשרות לביצוע טיפולים בציוד התשתית ללא השבתה. כמו כן, במקרה של תקלה בציוד התשתית,  יסבול האתר מהשבתות.

Tier II: בחדר מחשב ברמה II תהיה יתירות כלשהי למערכות קריטיות של חשמל ומיזוג אוויר. בדרך כלל היתירות ( N+1 ) תהיה במערכות כגון UPS, צ'ילרים, משאבות וגנראטור. טיפולי שירות תקופתיים יגרמו להשבתות.  תקלות חומרה במרכיבי התשתית יכולים גם הם לגרום לקריסת החדר באופן זמני.

Tier III: בחדר מחשב ברמה III התכנון מאפשר טיפולי שירות לתיקון ומניעה ללא השבתה ( concurrent maintenance ).  כלומר, ניתן להשבית כל רכיב תשתית כגון UPS, ארון חשמל או יחידת מיזוג ללא השבתה של ציוד IT. לכל מוליך תשתית פעיל יהיה "תאום" פסיבי שיכנס לעבודה במקרה של כשל במוליך הפעיל. גם כאן היתירות במערכות היא ברמה של ( N+1). ההבדל הגדול הוא שבאתר זה ניתן לבצע עבודות שירות תקופתיות מה שיקטין בודאי גם את מס' התקלות.

Tier IV : חדר מחשב ברמה IV הוא אל-כשל ( Fault Tolerant ) . יש בו את כל מה שנכלל ברמה III אך שום כשל בודד אינו יכול לגרום להשבתה מליאה או חלקית. כל מרכיבי התשתית פעילים בו זמנית.

ברור שאם מערכת המיזוג מתוכנת לפי רמה II אך מערכת החשמל לפי רמה I, חדר המחשב הוא ברמה I. דירוג חדר ברמה 2.5 זו המצאה ישראלית שאין לה אחיזה בתורה המקצועית.

בעת תכנון ושדרוג חדרי מחשב, חשוב שהמנמ"ר יגדיר במדויק את צרכי הארגון בכל הקשור לרציפות העסקית.  שיטת הדרוג ל 4 רמות מאפשרת למנמר בחינה מסודרת של עלות מול תועלת.

יוני 17, 2009 at 5:56 pm 2 תגובות

טעויות נפוצות בהעברת חדרי מחשב

כל פרויקט של העברת חדר מחשב ממיקום אחד למיקום אחר הוא שונה ומיוחד. בכנס המנמרים בבולגריה ריכלנו על חברת סלקום שבצעה לא מזמן פרויקט העברה מצוין שזכה להערכה רבה. עם זאת, פרויקטים אחרים רבים נכשלים או נתקלים בבעיות שגורמות לעיכובים, הוצאות ו downtime ארוך מהמתוכנן.

לדוגמא, פרויקט אחד התעכב משום שבעת ההעברה הסתבר שפסי השקעים שהותקנו באתר החדש לא היו מתאימים. נושא זה עיכב את ההעברה שהייתה אמורה להתרחש במהלך סוף השבוע עד לאספקת והחלפת פסי השקעים. במקרה אחר, סימון לא מדויק של כבלים אופטיים גרם לחיווט לא נכון של מערכות תקשורת ולעיכובים ופגיעה ברציפות העסקית. במקרה שלישי , נהג מלגזה לא מנוסה ( וגם ללא רישיון) הפיל מתג והחל מחול מטורף להחלפת החומרה. מאחר והחברה לא חזתה סיכון זה, עברו מס' ימים עד להחלפת החומרה.

קל אם כך להבין מדוע פרויקטים של העברה נכשלים. בסופו של דבר נמצא הפתרון אך התהליך הלא מושלם יקר וגורם להפרעות ברציפות העסקית.

אנו, באלכסנדר שניידר זיהינו 5 טעויות נפוצות שיכולות לטרפד פרויקט העברה
1. חברות לא יודעות מה נקודת הפתיחה שלהן. חברות לא יודעות במדויק מה יש להן ומה הן מעבירות. אין מיפוי של התלות בין היחידות השונות.
2. לא מתוכנן המיקום המדויק של כל הציוד שעובר. ההנחה שיש מקום להכל וש"זה יסתדר" אינה עובדת בד"כ.
3. היעדר תוכנית העברה מפורטת כולל מי אחראי למה ומתי.
4. היעדר זיהוי סיכונים והיעדר תוכנית מניעה והורדת סיכונים.
5. ביצוע לקוי בשל יועצים, מובילים וקבלנים לא מנוסים ובחירת ספקים לפי קריטריון מחיר. פרויקטים של העברת חדרי מחשב נכשלים בגלל סיבות רבות אך ניתן למנוע כמעט את כולן. דבר אחד בטוח: זהו פרויקט חשוב ורגיש שיש לו השפעה רבה על הרציפות העסקית של הארגון ועל יוקרת המנמר.

אנו בחברת אלכסנדר שניידר ממליצים על המתודולוגיה הבאה:

1. דע מה נקודת המוצא. החל בסקר מפורט של חדר המחשב הישן. ערוך רשימת מצאי וקישורים. בחן מה סדרי העדיפויות של הארגון ומה האילוצים. בחן היטב את תשתית החשמל והמיזוג של האתר החדש לפני ההעברה.
2. תכנן את האסטרטגיה של ההעברה. הגע להסכמה עם הלקוחות הפנימיים מה ניתן להשבית ומתי. הבן את יכולות אתר ה DR אם הוא קיים. ערוך סקר סיכונים. הבן את הסיכונים והכן אלטרנטיבה לכל תקלה.
3. הכן תוכנית מפורטת כולל לו"ז וקבע אחריות שמית לכל משימה. תכנן ברמת תוכנית העמדה לחדר וברמת התקנות בכל ארון. בדוק מה התלות ההדדית שבין השלבים השונים. צפה סיכונים וערוך תוכנית לצמצום הסיכונים.
4. כנס את הצוות ועבור על תוכנית הסיכונים. יתכן ששיקולי עלות יגרמו לך לקחת סיכון מחושב. זה בסדר כל עוד זה נעשה במחשבה תחילה.
5. מנה מנהל מנוסה לתיאום בין הקבלנים, הספקים וצוות ה IT. בפרה-פרזה על דברי אפרים קישון, מחקר של סוציולוגים סקנדינביים מצא שעבודה רצופה במשך 36 שעות גורמת לעייפות וטעויות. הכן צוותי גיבוי רעננים והחלף עובדים כל 12 שעות לכל היותר .

פרויקט העברה של חדר מחשב חשוב מידי מכדי לסמוך על המזל. ארגונים שיקפידו על יישום חמש הנקודות הנ"ל ישפרו במידה ניכרת את סיכויי הצלחת הפרויקט.

יוני 11, 2009 at 4:26 pm כתיבת תגובה


פידים

הבלוג הוקם ומנוהל בסיוע: