question_answerپرسش و پاسخ فنی تجهیزات اچ پی (سرور اچ پی- ذخیره سازهای اچ پی- قطعات سرور و ذخیره سازها)

اگر رام سیستم خراب شد، سیستم بصورت اتوماتیک در اغلب موارد برروی Redundant Rom سوئیچ می‌کند، اگر بصورت اتوماتیک نتواند این کار را انجام دهد، گام‌های زیر را انجام دهید:
  1. سرور را خاموش کنید و برق آن را قطع کنید
  2. سرور را در بیاورید.
  3. پنل دسترسی را جدا کنید
  4. سوئیچ‌های 1، 5 و 6 را از صفحۀ System Maintenance Switch برروی حالت ON یا فعال تغییر حالت دهید.
  5. پنل دسترسی را مجدداً نصب نمائید
  6. سرور را در فریم یا Enclosure نصب کنید و سپس روشن نمایید.
  7. بعد از انجام System Beeps، گام‌های 1 تا 3 را تکرار کنید
  8. سوئیچ‌های 1،5و 6 را به حالت OFF تغییر حالت دهید.
  9. گام‌های 5 و 6 را تکرار نمائید.
اگر هر دو نسخه فعال و بکاپ ROM خراب شده است، مادربورد را جهت تعمیرات یا تعویض برای واحد فنی ارسال نمایید. جهت سوئیچ کردن به Backup ROM زمانی که ROM سیستم سالم است، از UEFI System Utilities استفاده کنید.
در صفحه Post پیغام خطا یا در IML با پیغامی با عنوان Uncorrectable Machine Check exception مواجه می‌شوید.
دلایل :
دلایل زیادی می‌تواند برای خطای فوق وجود داشته باشد، لطفاً پیغام خطاها را با دقت مطالعه نمائید.
اقدام‌ها:
  1. متن پیغام خطا را کامل بخوانید جهت حل مشکل دقیق‌تر و موارد ذیل را انجام دهید:

    1. اگر متن پیغام خطا مستقیماً اشاره به تعویض پردازنده AMD نمائید، قبل از تعویض آن حتماً درباره آن پردازنده مطالعه نمائید، شاید به درستی نصب نشده است. ضمن اینکه حتماً درباره آن پردازنده مطالعه کنید. (اطلاعات نگهداری و راهنمای خدمات) شاید برای مدل‌های خاص نکته‌هایی ذکر شده باشد مثل استفاده از Heatsink، FAN یا Power خاص
    2. اگر مشکل حل نشد گام بعدی را انجام دهید.
  2. فایل‌های Active Health System و OS Log را دانلود نمائید.
  3. فریمور سرور را بروزرسانی نمائید.
    نکته : فریمور سرور را بیشتر از یکبار بروز رسانی ننمائید، اگر مشکل با یکبار بروزرسانی حل نشد، گام بعدی را انجام دهید.
  4. اگر مشکل حل نشد، با واحد خدمات فنی شرکت HPE تماس بگیرید.
  1. یک یا تعدادی از پردازنده‌ها توسط سرور پشتیبانی نمی‌شود
  2. پیکربندی پردازنده توسط سرور پشتیبانی نمی‌شود
  3. رام سرور، برروی حالت رام اصلی و جاری نمی‌باشد
  4. پردازنده معیوب شده است
توصیه : جهت اجتناب از خرابی و آسیب زدن به پردازنده یا برد سیستم توصیه می‌شود، حتما افراد فنی و مجرب پردازنده را تعویض یا برروی سرور نصب کنند.
اقدام‌ها
  1. مطمئن شوید پردازنده توسط سرور پشتیبانی می‌شود. ضمن اینکه نصب پردازنده نیازمند گام‌های ویژه نصب می‌باشد و باید طبق دستورالعمل انجام شود.
  2. مطمئن شوید رام سرور نسخه جاری باشد.
  3. هر دو پردازنده باید یک مدل باشند و حالت ترکیب پردازنده در یک سرور پشتیبانی نمی‌شود.
  4. اگر سرور دارای یک پردازنده نصب شده است، پردازنده را مجدد جا بزنید، اگر مشکل حل شد یعنی پردازنده درست نصب نشده بود.
  5. اگر سرور دارای یک پردازنده نصب شده است، آن را با پردازنده سالم جابجا نمائید.
  6. اگر سرور دارای چندین پردازنده نصب شده است، هر کدام از آن‌ها را تست کنید:
    1. همه پردازنده‌ها غیر از پردازنده اول را در بیاورید
    2. همه پردازنده‌ها را یک به یک برروی سرور بگذارید و تست کنید، برای تست هر پردازنده طبیعتاً نیاز به راه اندازی مجدد در هر مرحله خواهید بود.
دلایل :
  1. فلش ROMPaq سیستم خراب شده است
  2. ROM سیستم خراب شده است
  3. بعد از بروزرسانی SYSROM توسط ROMPaq سرور در Boot دچار خطا می‌شود.
  4. هیچ گونه Logical Drive توسط کنترلر دستگاه ساخته نشده است
  5. Boot Order کنترلر به درستی تنظیم نشده است.
  6. فریمور نادرست یا معیوب گزارش شده است.
اقدامات:
  1. جدول Boot order کنترلر را بررسی کنید
  2. به Redundant Rom یا رام ثانویه وصل شوید، دسترسی به آن در سرورهای Blade و غیر Blade تا حدودی شبیه به هم است
  3. روش‌های حل مشکل OS Boot را بررسی کنید (این مورد در سوالات فنی بعدی جواب داده شده است)
اگر ROM سیستم خراب شد، سیستم بصورت اتوماتیک در اغلب موارد برروی Redundant ROM سوئیچ می‌کند، اگر بصورت اتوماتیک نتواند این کار را انجام دهد، گام‌های زیر را انجام دهید.
  1. سرور را خاموش کنید و برق آن را قطع نمائید.
  2. در صورت ضرورت، سرور را از رک درآورده و جدا نمائید.
  3. دَر سرور (Access Panel)را بردارید
  4. سوئیچ‌های 5,1 و 6 را از صفحۀ System Maintenance Switch برروی حالت ON یا فعال تغییر دهید
  5. پنل دسترسی را مجدداً نصب کنید
  6. سرور را برروی رک نصب کنید
  7. سرور را روشن نمائید.
  8. بعد از انجام System Beeps، گام‌های 1 تا 3 را تکرار کنید.
  9. سوئیچ‌های 1، 5 و 6 را به حالت OFF تغییر حالت دهید.
  10. گام‌های 5 و 6 را تکرار نمائید.
اگر هر دو نسخه فعال و بکاپ ROM خراب شده است، مادربورد جهت تعمیرات یا تعویض برای واحد فنی ارسال شود.
جهت سوئیچ کردن به Backup ROM زمانی که ROM سیستم خراب نشده است، از UEFI System Utilities استفاده کنید.
خطاها، تلاش‌های مکرر، تایم اوت‌ها و خطاهای ناخواسته درایوها زمانی که از کابل Mini SAS استفاده می‌شود.
دلایل : کابل Mini SAS به پایان طول عمر خودش رسیده است.
اقدامات : طول عمر کانکنتور Mini SAS حدود 250 بار اتصال و قطع اتصال می‌باشد (چه برای کانکتورهای internal و چه External)
اگر از کابل کهنه استفاده می‌کنید، احتمالاً به پایان طول عمر خود نزدیک شده است و آن را جایگزین نمائید.
اقدامات لازم :
  1. نسخه فریمور فعلی را بدست آورید
  2. بررسی کنید، آخرین نسخه دردسترس فریمور را برای دستگاه شما کدام نسخه است.
  3. اگر برروی دستگاه ‌تان TPM یا Trusted Platform Module نصب و فعال شده است، لطفاً قبل از بروزرسانی دستگاه BitLocker را بر روی ویندوز غیر فعال کنید.
  4. آخرین نسخه فریمور دستگاه را دانلود و بروز نمائید
  5. چک نمائید که فریمور دستگاه را دانلود و بروز نمائید.
  6. اگر برروی دستگاه TPM نصب و فعال شده است، بعد از کامل شدن بروزرسانی BitLocker را مجدد فعال نمائید.
در صفحه پست یا پیغام‌های IML اشاره به خطای System Board  یا Power Backplane می‌شود.
اقدام‌ها:
  1. پیغام‌های خطا را کامل بخوانید واگر پیغامی به قطعه خاص اشاره کرده است، آن را تست نمایید.
  2. چک کنید قطعی یا عدم اتصال برروی مادربورد و پاور بک پلین وجود نداشته باشد و جاگذاری مجدد پردازنده ضروری نیست.
  3. قطعاتی که اخیراً نصب کرده‌اید را در بیاورید.
  4. سرور را خاموش کنید و همه پاورها را از سرور خارج کنید، باتری سیستم را به مدت 10 دقیقه در بیاورید و مجدد نصب کنید و سرور را روشن نمائید. برای پیدا کردن جای باتری سیستم از اسناد راهنمای آن سرور استفاده کنید.
  5. جهت برگرداندن تنظیمات BIOS به حالت پیش فرض از F9 و تنظیم مجدد NVRAM استفاده کنید، اگر سیستم بالا نمی‌آید از سوئیچ SW6 برروی System Maintenance Switch جهت reset کردن NVRAM استفاده کنید.
  6. از فایل AHSV جهت خواندن و حل مشکل فوق استفاده کنید، اگر مورد حل نشد، با خدمات فنی شرکت تماس بگیرید.
بعضی مواقع حافظه پایدار یا Persistent Memory در سیستم عامل قابل رویت نمی باشد، این قضیه معمولاً زمانی اتفاق می‌افتد که NVDIMM قابل استفاده نباشد (معیوب باشد).
راه حل یک :
خطاهای حافظه غیر قابل اصلاح در NVDIMM منطقی وجود دارد و پاکسازی محدوده آدرس فعال نیست.
راه کار : در ابزارهای UEFI System گزینه Persistent Memory Address Range Scrub را فعال نمائید.
راه حل دو :
داده‌های پیکربندی نامعتبر در یک یا چند دستگاه ذخیره سازی پشتیبان وجود دارد
راه کار: دستگاه‌های ذخیره سازی پشتیبان را راه اندازی کنید
راه حل سه :
حافظه فیزیکی کافی در سرور وجود ندارد.
راه کار:
  1. IML را جهت پیغام خطای مموری و راه کارهای توصیه شده بررسی کنید
  2. حافظه جدید و اضافی نصب کنید
راه حل چهار:
عملکرد حافظه پایدار مقیاس‌پذیر غیر فعال است زیرا یک NVDIMM فیزیکی در سرور نصب شده است.
راه کار: NVDIMM فیزیکی را از روی سرور بردارید.
یک درایو حافظه پایدار به طور بالقوه می‌تواند توانایی خود را برای ماندگاری داده‌ها پس از بوت شدن سیستم عامل از دست بدهد. وقتی این اتفاق می‌افتد، سرور به سیستم عامل اطلاع رسانی می‌کند و این اتفاق بسته به نسخه سیستم عامل توسط آن کنترل می‌شود.
راه حل یک :
موارد: درایو حافظه در پاکسازی رنج آدرس خطای آستانه عمر را می‌دهد .
راه کار: با استفاده از UEFI System Utilities دستگاه‌های ذخیره سازی پشتیبان را مجدداً راه اندازی کنید.
راه حل دو:
موارد : ظرفیت منبع تغذیه بکاپ از عملیات بکاپ پشتیبانی نمی‌کند.
راه کار:
  1. IML را جهت پیغام‌های مرتبط با منبع تغذیه بکاپ بررسی نمائید.
  2. قطعات منبع تغذیه بکاپ را با بررسی IML جایگزین کنید.
راه حل سه:
موارد : کنترلر NVDIMM در حین اجرا و عملیاتی شدن دچار خطا شده است.
راه کار :
  1. IML را جهت بررسی پیغام‌های مرتبط با کنترلر NVDIMM بررسی نمائید.
  2. گام‌های توصیه شده در IML را اجرا کنید.
وقتی که درایو Persistent Memory بر چسب Read Only یا فقط خواندنی می‌خورد معمولا نشان دهنده این است در طی فرآیند بوت عدم توانایی بکاپ از NVDIMM شناسایی شده است.
راه حل یک :
موارد :
  1. فرآیند بکاپ قبلی با خطا مواجه شده است
  2. فرآیند برگرداندن بکاپ فعلی با خطا مواجه شده است
  3. درآماده سازی کلی دچار خطا شده است
  4. کنترلر یک NVDIMM دچار خطا شده است
راه کار : IML را جهت پیدا کردن خطا یا اشکال بررسی نمائید.
راه حل دو:
موارد: نیاز دائمی به انرژی پشتیبان حافظه از توان باتری پشتیبان موجود بیشتر است.
راه کار : هر قطعه سخت افزاری که اخیراً برروی سرور نصب کردید  را در بیاورید
راه حل سه :
موارد: منبع انرژی بکاپ بصورت کامل شارژ نشده است و فرآیند شارژ توسط کاربر رد شده است.
راه کار : سیستم را ری استارت کنید و منتظر شوید بکاپ منبع انرژی کامل شارژ شود.
راه حل چهار:
موارد: منبع انرژی بکاپ بصورت کامل شارژ نشده است و پردازش فرایند شارژ نیز Time Out می‌دهد.
راه کار :
  1. IML را جهت پیغام های مرتبط با منبع برق بکاپ بررسی کنید و عکس العمل ‌های مقتضی و توصیه شده را انجام دهید
  2. اگر مشکل حل نشد، منبع برق بکاپ را جایگزین نمائید.
زمانی که درایو Persistent Memory  در سیستم عامل نمایش داده نمی‌شود این علامت معمولاٌ نشان دهنده استفاده نشدن در NVDIMM می‌باشد.
دلایل:
قابلیت Uncorrectable Memory Error و Address Range Scrubbing  فعال نشده است. برای اینکار از طریق UEFI System Utilities گزینۀ Persistent Memory Address Range Scrub را فعال کنید.
  • از صفحۀ System Utilities گزینه
System Configuration > BIOS/Platform Configuration(RBSU) > Memory Options > Persistent Memory Options > Persistent Memory Integrity Check
را انتخاب کنید
  • برروی Enabled کلیک کنید.
  • تنظیمات را ذخیره کنید.
دلایل :
  1. تنظیمات مموری فعلی که برروی دستگاه تنظیم شده است از مموری نصب شده پشتیبانی نمی‌کنند.
  2. مموری نصب شده با توجه به تنظیمات فعلی به درستی نصب نشده است.
اقدامات :
  1. جهت استفاده با تنظیمات درست، رول‌های چینش رم در سرورتان را از طریق اسناد HPE بررسی کنید. (معمولاً در سرور چسبانده شده است)
  2. می‌توانید گزینه نشان دادن خطای مموری را غیر فعال کنید
  3. از مموری‌های پشتیبانی شده برروی سرور استفاده کنید.
  4. با بررسی و تغییر تنظیمات مورد نیاز در منوهای System Utilities مشکل را حل نمایید.
پیغام خطایی نمایش داده می‌شود که نشان می‌دهد یک خطای سلامت حافظه رخ داده است که می‌تواند موارد زیر باشد:
  1. ماژول HPE Persistent Memory به پایان سطح سلامتی مفید خود نزدیک می‌شود.
  2. ماژول HPE Persistent Memory یک خطای بحرانی را تجربه کرده است و ممکن است دیگر قابل استفاده و عملیاتی نباشد.
  3. ماژول HPE Persistent Memory مشکلی را تجربه کرده است و دیگر قابل انعطاف نیست
دلایل:
ماژول HPE Persistent Memory وضعیت عدم سلامتی را گزارش می‌دهد که می‌تواند یکی از عوامل ذیل باشد:
  1. بلاک یدکی (Spare) وجود ندارد یا تعداد کم دارد
  2. نیاز به قطعه یدکی
  3. یک شکست داخلی بحرانی
اقدامات :
  1. بازدید حوادث مرتبط در IML و پیگیری اقدامات توصیه شده
  2. بکاپ‌گیری از همه اطلاعات ذخیره شده در نواحی ثابت و سالم ماژول HPE Persistent Memory
  3. اگر مشکل ادامه پیدا کرد به وب سایت پشتیبانی HPE مراجعه نمائید.
  4. اگر باز هم مشکل ادامه پیدا کرد ماژول HPE Persistent Memory را تعویض و جایگزین نمائید.
  • بصورت خطا در صفحۀ Post یا در صفحه IML مشاهده می‌شود.
  • سیستم متوقف می‌شود. (System Halts)
دلایل موارد فوق :
  1. تعدادی بیشتر از نهایت تعداد پشتیبانی سرور از حافظۀ NVDIMM برروی سرور نصب شده است.
  2. DIMMای که توسط سرور پشتیبانی نمی‌شود برروی آن نصب شده است
  3. ترکیبی از انواع DIMMها که در سرور پشتیبانی نمی‌شود در کنار یکدیگر قرار داده شده است.
  4. NVDIMMها و RDIMMها با ترتیب نادرست در کنار یکدیگر نصب شده‌اند.
  5. حداقل یک DIMM استاندارد برروی پردازنده یک مطابق دستورالعمل چینش رم‌ها نصب نشده است.
  6. یک HPE Smart Storage Hybrid Capacitor برروی سرور نصب شده است.
عکس العمل‌های توصیه شده:
  1. پیغام‌های IML را بازدید کنید، دلایل غیرفعال شدن NVDIMMها در آنجا ثبت می‌شود. مراحل ذکر شده در پیغام خطا را انجام دهید .
  2. مطمئن شوید DIMMهای نصب شده بر طبق دستورالعمل چینش، چیده شده باشند.
  3. DIMMهای پشتیبانی نشده را حذف کنید
  4. مطمئن شوید HPE Smart Storage Battery برروی سرور نصب شده باشد، ضمن اینکه اچ پی ایSmart Storage Hybrid Capacitor، ان وی دیم ‌ها (NVDIMM) را پشتیبانی نمی‌کند.
به عنوان مثال توسط یک پیغام خطا نشان می‌دهد که مشکلی در اعمال پیکربندی هدف وجود دارد.
 
دلایل:
  1. پیکربندی هدف را نمی‌توان با حافظه درخواستی اعمال کرد
  2. هنگام تلاش برای اعمال پیکربندی هدف، DIMMها یا تنظیمات DIMM گم شده یا از دسترس خارج شده.
اقدامات:
  1. پیغام خطای مرتبط را در IML بازدید نمایید و اقدامات توصیه شده را دنبال کنید.
  2. مطمئن شوید ماژول‌های HPE Persistent Memory شناسائی شده‌اند و از لحاظ سلامتی OK هستند و اینکه نسخه فریمور آن‌ها یکی باشد.
  3. لاگ‌های خطای مربتط با HPE Persistent Memory را بازدید کنید جهت اطلاعات اضافی
  4. مطمئن شوید از ابزار پشتیبانی شده جهت تنظیمات HPE Persistent Memory برای ایجاد پیکربندی هدف استفاده شده است.
  5. اگر کماکان موضوع پابرجا بود به وب سایت پشتیبانی HPE مراجعه نمائید.
  1. همۀ NVDIMMها غیر فعال شده‌اند.
  2. همۀ NVDIMMها برروی پردازنده غیرفعال شده‌اند
دلایل موارد فوق :
  1. قابلیت Node Interleaving فعال شده است .
  2. زمانیکه NVDIMMها نصب شدند، حالت AMP جاری پشتیبانی نمی‌کند.
  3. NVDIMMهای جدید برروی سرور نصب شده‌اند.
  4. NVDIMMهای نصب شده در اسلات دارای Backup Power نمی‌باشند.
عکس العمل‌های توصیه شده:
  1. پیغام‌های IML را بازدید نمائید، دلایل غیرفعال شدن NVDIMMها در آنجا ثبت شده است. مراحل ذکر شده در پیغام خطا را انجام دهید.
  2. اطمینان پیدا کنید از همۀ تنظیمات ابزارهای UEFI System که پشتیبانی NVDIMM در آن‌ها پیکربندی شده باشد.

    1. اگر Node Interleaving فعال شده است، غیر فعال کنید.
    2. اگر AMP یا Advance Memory Protection به هر حالتی غیر از حالت Advanced ECC Support تنظیم شده باشد، تغییر دهید به حالت Advanced ECC Support و تنظیمات را ذخیره نمائید.
  3. اگر NVDIMMهای جدید می‌خواهید نصب و فعال کنید، اصول بهداشتی را رعایت کنید
  4. چک کنید NVDIMM نصب شده برروی اسلات خاص، آن را پشتیبانی کند، منتقل کنید برروی اسلاتی که از NVDIMM پشتیبانی می‌کند.
  5. مطمئن شوید HPE Smart Storage Battery پشتیبانی شده، بدرستی نصب شده باشدو برروی سرور کار می‌کند.
اگر در IML پیغامی مبنی بر اتمام عمر رم  HPE Persistent Memory ظاهر شود.
دلایل آن به شرح ذیل می‌باشد:
  1. یکی از رم‌ها یا ماژول HPE Persistent Memory Module (PMM) گزارشی برمبنای درصد کمی از عمر مشخص شده باقیمانده را ثبت می‌کند. در آینده نزدیک امکان تعویض Block امکان پذیر نخواهد بود و جهت جلوگیری از خطاها یا خرابی اطلاعات به فکر بکاپ باشید.
  2. یکی از رم‌ها یا ماژول PMM گزارشی بر مبنای طول عمر آن به مقدار بسیار کم کاهش پیدا کرده و بایستی سریعاً تعویض شود را ثبت می‌کند.
چه گارهایی باید انجام دهید؟
  1. صفحه IML یا integrated Management Log را جهت بررسی پیغام‌های خطا مشاهده نمائید و عکس العمل‌های مقتضی و توصیه شده را انجام نمایید.
  2. از اطلاعات ذخیره شده در مناطق مختلف Persistent بکاپ گیری نمائید. (از ماژول HPE Persistent Memory)
  3. ماژول HPE Persistent Memory را با ماژول جدید جایگزین کنید (تعویض کنید)
اگر در حین نصب سیستم عامل، پروسه نصب قادر به تشخیص کنترلر HPE Smart Array S100i SR Gen10 نباشد چه اقداماتی باید انجام شود؟
  1. اگر جهت نصب سیستم عامل از طریق intelligent provisioning بروز رسانی شده اقدام نمائید با این مشکل مواجه نخواهید شد.
  2. در صورت لزوم بصورت دستی درایور کنترلر فوق را نصب کنید.
بعضی مواقع که قابلیت Raid Mode غیر فعال باشد کنترلر HPE Smart Array S100i SR برروی سرور Gen10 در دسترس یا قابل مشاهده نخواهد بود.
دلایل:
هنگامی‌که کنترلر HPE Smart Array S100i SR در سرور فعال باشد و حالت Raid Mode در تنظیمات UEFI غیرفعال باشد، درایوها به عنوان AHCI Drives یا درایوهای HPE H220i فهرست می‌شوند و کنترلر Raid در صفحۀ Post یا Device Manager قابل رؤیت و در دسترس نخواهد بود. هنگامی‌که حالت Raid Mode فعال است ، درایوها به عنوان درایوهای HPE Smart Array S100i G10 ظاهر می‌شوند.
چه اقداماتی باید انجام شود؟
  • سرور را راه اندازی مجدد (Reboot) نمائید.
  • در زمان فرآیند Post با زدن کلید F9 وارد صفحۀ تنظیمات UEFI System Utilities شوید.
  • وارد مسیر زیر شوید:
System Configuration> BIOS / Platform Configuration (RBSV) > Storage Options > SATA Controller Options > Embedded SATA Configuration > Smart Array SW Raid Support and Press the Enter Key.
  • در صفحۀ تنظیمات SATA Controller، برای گزینه Embedded SATA Configuration از منوی قابل انتخاب Smart Array SW Raid Support را انتخاب و برروی Ok  کلیک نمائید.
  • اگر اخطاری با مشخصات ذیل برای شما نمایش داد، Ok را بزنید.
Smart Array SW Raid is Not Supported When the Boot Mode is Configured in Legacy Bios Mode
  • دگمۀ F12 را بزنید که به معنی ذخیره و خروج می‌باشد.
  • جهت ذخیره تغییرات اعمال شده برروی Yes-Save Change کلیک نمائید.
  • برروی Reboot کلیک نمائید.
جهت تشخیص خطاها و تولید بازخورد درباره خرابی یا خطاهای آرایه‌ها از ابزارهای تشخیص شرکت HPE باید استفاده شود که در ذیل درباره آن‌ها توضیح داده شده است.
  • HPE SSA یا HPE Smart Storage Administrator
HPE SSA از طریق Intelligent Provisioning یا بوت از طریق فایل ISO SPP بصورت آفلاین قابل دسترس می‌باشد. صمناً با دانلود و استفاده از فایل قابل اجرای HPE SSA از طریق محیط سیستم عامل بصورت آنلاین می‌تواند در دسترس باشد.
  • System Event Log
لاگ‌های مرتبط به خطاهای درایوها و آرایه توسط سرویس HPE Smart Array SR Event Notification در Event Log سیستم عامل ویندوز مایکروسافت ثبت می‌شود، که شامل اطلاعات تشخیص داده شده اخیر توسط کنترلر سرور می‌باشد. ضمن اینکه سرویس AMS شرکت HPE گزارش این رویدادها را در Event Log لینوکس ثبت می‌کند
  • IML یا Integrated Management Log
گزارش تشخیص خطا مرتبط با Smart Array بصورت پیام Post در حین Boot سرور برای کاربر نمایش داده می‌شود و همچنین این Logها در صفحۀ UEFI Health Log و IML داخل iLO ثبت می‌شود.
  • HPE iLO
فریمور iLO بصورت مداوم وضعیت Smart Array را مستقل از سیستم عامل مانیتور می‌کند و آن‌ها را بصورت Failure Event Log در IML و صفحه وب iLO و iLO Restful API و SNMP ثبت می‌کند.
گاهاً زمان پاسخ دهی سرور کندتر و دیرتر از حالت عادی می‌شود، در ذیل دلایل این عمر بررسی می‌شود:
دلایل :
  • فضای ذخیره سازی پر شده است
  • تکنولوژی رمزگذاری استفاده شده یا فعال شده در سیستم عامل باعث کاهش عملکرد شده است.
  • در حال انجام ریکاوری درایو مجازی (RAID) می‌باشد. منظور در حال Rebuild کرد هارد جایگزین می‌باشد.
اعمال:
  1. مطمئن شوید درایو یا Raid مود نظر پر نشده باشد. اگر نیاز بود فضای خالی آن درایو را افزایش دهید. شرکت HPE توصیه می‌کند حداقل 15 درصد فضای خالی همیشه برروی درایو داشته باشید.
  2. درباره تکنولوژی یا فناوری رمزگذاری سیستم عاملی که با آن سر و کار دارید مطالعه کنید، که چه عواملی می‌تواند باعث کاهش عمکلرد سرور شود.
  3. از طریق HPE SSA بررسی کنید و مطمئن شوید که حالت ریکاوری درایو مجازی در حال انجام نباشد.
بعضی مواقع اطلاعات داخل درایو یا RAID غیرقابل دسترس می‌باشد؟
دلایل:
  1. فایل‌ها خراب شده‌اند
  2. اطلاعات سرور آلوده به ویروس شده‌اند.
  3. ماژول TPM نصب شده است ولی به درستی برروی سرور فعال نشده است.
کارهایی که باید انجام شود:
  1. مطمئن شوید فایل‌ها خراب نشده باشند. با اجرا و استفاده از ابزار Repair توسط سیستم عامل برای حل مشکل اقدام نمایید.
  2. توسط ابزار اسکن آنتی ویروس که حتماً به روز می‌باشد بررسی کنید که اطلاعات توسط ویروس آلوده نشده باشند.
  3. زمانی که TPM نصب شده باشد و قابلیت BitLocker توسط ویندوز سرور فعال شده باشد، مطمئن شوید که TPM توسط UEFI System Utilities فعال شده باشد.
  4. اگر TPM 2.0 نصب شده است، مطمئن شوید سرور با UEFI Boot Mode تنظیم شده باشد.
  5. زمان انتقال اطلاعات رمزنگاری شده به سرور جدید، فرآیند ریکاوری اطلاعات در سیستم عامل جدید به درستی انجام شود.
گاهاً پیغام خطا یا خرابی درایو در صفحۀ POST یا HPE SSA یا HPE SSA DUCU و همچنین برروی LED درایو مورد نظر توسط سرور اعلام می‌شود که می‌تواند از موارد ذیل باشد:
دلایل :
  1. خرابی Smart Array
  2. خرابی درایو مورد نظر
  3. خرابی کابل SAS یا Back Plain مورد نظر
  4. اتصالات ناقص یا اشتباه
عملکرد :
  1. سلامتی و اتصالات قطعات با قطعات سالم دیگر بررسی شود
  2. در صورت نیاز سرور توسط SPP به آخرین نسخه بروز رسانی شود
اگر خطای SSD Smart Wear Error در صفحه Post یا بصورت یک پیغام در IML مشاهده شود.
قطعه مورد نظر حداکثر محدوده و توان Write را ردکرده است یا اینکه نزدیک به نهایت امکان رایت خود رسیده است.
عملکرد:
قطعه یا درایو مورد نظر را عوض کنید
گاهاً زمان پاسخ دهی سرور کندتر و دیرتر از حالت عادی می‌شود، در ذیل این امر بررسی می‌شود:
دلایل :
  1. فضای ذخیره سازی پرشده است.
  2. تکنولوژی رمزگذاری استفاده شده یا فعال شده در سیستم عامل باعث کاهش عمکلرد شده است.
  3. در حال انجام ریکاوری درایو مجازی (RAID) می‌باشد. منظور در حال Rebuild هارد جایگزین می‌باشد.
کارهای ذیل باید انجام شود:
  1. مطمئن شوید درایو یا RAID مورد نظر پر نشده باشد. اگر نیاز بود فضای خالی درایو را افزایش دهید، شرکت HPE توصیه می‌کند حداقل 15 درصد فضای خالی همیشه برروی درایو داشته باشید.
  2. درباره تکنولوژی یا فناوری رمزگذاری سیستم عاملی که با آن سروکار دارید مطالعه کنید، که چه عواملی می‌تواند باعث کاهش عملکرد سرور شود.
  3. از طریق HPE SSA بررسی کنید و مطمئن شوید که حالت ریکاوری درایو مجازی درحال انجام نباشد.
گاهاً پیغام خطا یا خرابی درایو در صفحۀ Post یا HPE SSA یا HPE SSADUCLI و همچنین برروی LED درایو مورد نظر توسط سرور اعلام می‌شود که می‌تواند از موارد ذیل باشد:
  • خرابی Smart Array
  • خرابی درایو مورد نظر
  • خرابی کابل SAS یا Backplane مورد نظر
  • اتصالات ناقص یا اشتباه
عملکرد:
  1. سلامتی و اتصالات قطعات با قطعات دیگر سالم بررسی شود
  2. در صورت نیاز سرور توسط SPP به آخرین نسخه بروزرسانی شود.
اگر خطای SSD Smart Wear error در صفحه Post یا بصورت یک پیغام در IML مشاهده شود: قطعه مورد نظر حداکثر محدوده و توان write را ردکرده است یا اینکه نزدیک به نهایت امکان Write خود شده است.
کاری که باید انجام شود : قطعه یا درایو مورد نظر را عوض کنید.
جهت تشخیص خطاها و تولید بازخورد درباره خرابی یا خطاهای آرایه‌ها از ابزارهای تشخیص شرکت HPE باید استفاده شود که در ذیل درباره آن‌ها توضیح داده شده است:
  • HPE SSA یا HPE Storage Administrator
HPE SSA از طریق Intelligent Provisioning یا بوت از طریق فایل ISO SSP بصورت آفلاین قابل دسترسی می‌باشد. ضمناً با دانلود و استفاده از فایل قابل اجرای HPE SSA از طریق محیط سیستم عامل بصورت آفلاین می‌تواند در دسترس باشد.
  • System Event Log
لاگ‌های مرتبط به خطاهای درایوها و آرایه‌ توسط سرویس HPE Smart Array SR Event Notification در Event Log، سیستم عامل ویندوز مایکروسافت ثبت می‌شود، که شامل اطلاعات تشخیص داده شده اخیر توسط کنترلر سرور می‌باشد. ضمن اینکه سرویس AMS شرکت HPE گزارش این رویدادها را در Event Log لینوکس ثبت می‌کند.
  • IML یا Integrated Management Log
گزارش تشخیص خطا مرتبط با Smart Array بصورت پیام Post در حین Boot سرور برای کاربر نمایش داده می‌شود و همچنین این Logها در صفحۀ UEFI Health Log و IML داخل iLO ثبت می‌شود.
  • HPE iLO
فریمور iLO بصورت مداوم وضعیت Smart Array را مستقل از سیستم عامل مانیتور می‌کند و آن‌ها را بصورت Log یا Failure Event در IML و صفحه وب iLO و iLO RESTful API و SNMP ثبت می‌کند.
در صورتی‌که برروی سرور درایو ذخیره‌سازی نصب کردید ولی توسط سرور قابل تشخیص نبود باید موارد ذیل بررسی شود:
  1. مطمئن باشید مشکل از نبود جریان برق نباشد (کابل و اتصال برق Backplane)
  2. مطمئن شوید همه اتصالات به درستی انجام شده باشند
  3. بررسی شود اگر برای موارد ذیل بروزرسانی فراهم باشد حتماً اقدام نمائید:
    1. Smart Array Controller Firmware
    2. Dynamic Smart Array Driver
    3. Host Bus Adapter Firmware
    4. Expander Backplane SEP Firmware
    5. System ROM
  4. مطمئن شوید کابل درایو یا Backplane به درستی متصل شده باشد.
  5. وضعیت LED درایوها را بررسی کنید برای اینکه مطمئن شوید وضعیت نرمال نمایش داده شود.
  6. مطمئن باشید درایو مورد نظر توسط سرورتان پشتیبانی می‌شود.
  7. برق سرور را یکبار قطع و وصل کنید.
  8. مطمئن شوید Bay درایو مورد نظر با نصب درایو در یک Bay دیگر معیوب نباشد. (تست درایو توسط Bay دیگر)
  9. مطمئن شوید جابجائی یا جایگزینی هارد جدید در داخل Array توسط درایو هم سایز یا بزرگتر باشد.
  10. با اجرای HPE SSA بررسی کنید که توسط کنترلر تشخیص داده می‌شود و اینکه می‌تواند در Raid شرکت کند یا نه.
  11. مطمئن شودید درایو کنترلر به درستی نصب شده باشد و کنترلر حتما درایو مورد نظر را پشتیبانی می‌کند.
  12. اگر از Storage Enclosure استفاده می‌شود، مطمئن شوید که حتماً قطعه مورد نظر روشن باشد.
  13. اگز از SAN Switch استفاده می‌شود، مطمئن شوید دیسک‌ها توسط Virtual SAN Manager برای سرور Zone بندی شده باشند.

اگر کنترلر HPE Smart Array S100SR برروی سرور نصب شده است مطمئن شوید در UEFI Smart Array S100i SR، RAID Mode و Boot Mode فعال شده باشد. (این کنترلر درایوهای SAS را پشتیبانی نمی‌کند)

در صورتیکه سرور درباره درایو اعلام خرابی یا Fail کرده باشد. باید موارد زیر بررسی شود:
  1. مطمئن باشید اتصلات حتماً انجام شده باشد.
  2. بررسی شود اگر برای موارد ذیل بروزرسانی فراهم باشد حتماً اقدام شود:

    1. Smart Array Controller Firmware (فریمور کنترلر)
    2. Dynamic Smart Array Driver (درایور کنترلر)
    3. Host Bus Adapter Firmware (فریمور HBA)
    4. Expander Backplane SEP Firmware (فریمور SAS Expander)
    5. System ROM
  3. مطمئن شوید کابل درایو یا Backplain به درستی متصل شده باشد.
  4. مطمئن شوید کابل درایور سالم باشد و با یک کابل دیگر سلامتی آن را چک کنید.
  5. مطمئن شوید که Blankهای درایوها به درستی متصل شده باشند بخصوص در زمانی که سرور در حال کار باشد. دمای بیش از اندازه درایوها باعث پاسخ کند یا اعلام خرابی درایوها می‌شود.
  6. HPE SSA را اجرا کنید و وضعیت خرابی درایو را آنجا بررسی کنید.
  7. مطمئن شوید جابجایی یا جایگزینی هارد جدید در داخل Array توسط درایو هم سایز یا بزرگتر باشد.
  8. مطمئن شوید جایگزینی‌هارد جدید در داخل Array دارای نوع یکسان باشد. از قبیل SAS,SATA یا SSD.
  9. برق سرور را یکبار قطع و وصل کنید.
  10. اگر با موارد فوق درایو مشاهده شد توسط سرور بررسی کنید فریمور آن را و در صورت امکان بروزرسانی نمائید.
جهت بروزرسانی فریمورها یا ROM سرورها از روش‌های زیر استفاده می‌شود؟
  1. استفاده از گزینه Firmware Update در System Utilities
  2. استفاده از دستور FW Update در Embedded UEFI Shell
  3. استفاده از SPPها یا Service Pack For Proliant
  4. استفاده از راه‌کارهای Online Flash
Service Pack for Proliant:
SPP مجموعه نرم افزارها و فریمورها را، جهت آپدیت توسط تک فایل ISO قابل دانلود از سایت HPE در اختیار ما قرار می‌دهد. این راهکار از HPE SUM جهت راه اندازی پروسه آپدیت استفاده می‌کند. SPP می‌تواند بصورت آنلاین برروی ویندوز یا لینوکس اجرا شود، یا بصورت آفلاین مثل یک سیستم عامل توسط فایل ISO بوت شود.
Smart Update Manager (SUM):
SUM ابزاری نوآورانه برای نگه داشتن سیستم عامل ، درایورها و نرم افزارهای سیستم HPE ProLiant ، HPE Synergy، HPE BladeSystem و HPE Moonshot و گزینه های مرتبط با آن به روز و ایمن است.
این ابزار یک رابط منعطف و قابل انطباق بصورت گرافیکی تحت وب یا بصورت اسکریپت‌های خط فرمان در اختیارتان قرار می‌دهد.
Smart Update Manager سخت افزارهای نصب شده و نسخه‌های فعلی سیستم عامل، درایورها و نرم افزار سیستم را شناسایی می‌کند، یک توصیه به روزرسانی را ارائه می‌دهد و به روز رسانی‌ها را به روشی کارآمد برای کاهش تأثیرگذاری بر روی عملیات‌ها اعمال می‌کند.
SUM رابط‌های مختلفی را برای اعمال به روزرسانی‌ها فراهم می‌کند، بنابراین می‌توانید رابط کاربری را انتخاب کنید که پاسخگوی نیاز شما باشد. سرورها را در حالت آفلاین یا آنلاین، محلی یا از راه دور از طریق مرورگر وب یا به صورت تعاملی یا خودکار  می توانید به روز کنید.
ویژگی‌های کلیدی SUM شامل :
  1. موتور جستجوگر جهت بررسی نسخه‌های سخت‌افزاری، فریمور و نرم افزاری نصب شده برروی سرور
  2. SUM بروز رسانی‌ها را برحسب ترتیب درست از بابت وابستگی بعضی از آپدیت‌ها انجام می‌دهد.
  3. بررسی وابستگی‌های داخلی
  4. فرایند بروز رسانی محلی بصورت اتوماتیک و قدم به قدم
  5. حالت گرافیکی تحت وب
  6. توانایی جهت ساخت ISOهای سفارشی برای سرور یا قطعه خاص
  7. پشتیبانی از iLO Repository (فقط در سرورهای نسل 10 و iLO5)
  8. راه اندازی بروزرسانی فریمور و نرم افزار، جهت چندین سرور بصورت همزمان
  9. بروزرسانی آفلاین بصورت محلی توسط SPP
  10. ایجاد Log بصورت گسترده در همه حالت‌ها
نکته:

SUM از کنترلرهای شخص ثالث (تجهیزاتی که توسط HP ساخته نشده) پشتیبانی نمی‌کنند

برخی از سرورهای شرکت HPE از قابلیت Redundant ROM پشتیبانی می‌کنند با این ویژگی شما جهت انجام هرگونه تنظیم یا بروزرسانی در ROM بدون نگرانی می‌توانید اقدام نمائید. سرورها دارای یک ROM واحد ولی با دو عدد ROM Image مجزا کار می‌کنند. در پیاده سازی استاندارد، یک طرف ROM حاوی نسخه برنامه فعلی ROM می‌باشد، در حالی که طرف دیگر ROM حاوی نسخه پشتیبان است.

نکته: سرورها موقع فروش دارای نسخه عین هم در ROM اصلی و در ROM ثانویه تحویل مشتری می‌شوند.

دلایل و مزایای ایمنی و امنیتی این قابلیت:

زمانیکه شما می‌خواهید عمل Flash یا بروز رسانی برروی ROM سیستم انجام دهید، مکانیزم عمل Flash به این شکل است که موقع نوشتن ROM جدید،  ROM فعلی را بعنوان بکاپ جایگزین ROM ثانویه می‌کند. این عمل باعث می‌شود شما قادر باشید به راحتی بین ROM اصلی و ROM ثانویه سوئیچ کنید، چرا که گاهاً امکان دارد ROM جدید به هر دلیل خراب باشد. ضمناً این ویژگی از نسخه ROM فعلی محافظت می‌کند حتی اگر در حین انجام فلش ROM دچار قطع برق شوید.

HPE SSA، ابزار اصلی جهت تنظیم آریه‌ها و RAIDها برروی کنترلرهای Smart Array SR می‌باشد. این ابزار در سه فرمت ظاهری در دسترس می‌باشد: HPE SSA GUI, HPE SSA CLI و HPE SSA Scripting .
در همه حالت ها توانایی Config  کردن کارت‌های Raid controller و یا Smart Array  وجود دارد اما در بعضی از آن ها از امکانات بیشتری نسیت به دیگر حالات بهرمند می شویم. ویژگی تست سلامت و تشخیص در HPE SSA در نرم افزار مشتقل HPE Smart Storage Administrator Diagnostics Utility CLI نیز موجود است.
در طی راه‌اندازی سرورها یا ماژول‌های محاسباتی نیاز به تنظیم آرایه و RAID می‌باشید قبل  از اینکه بخواهید سیستم عامل نصب کنید، شما می‌توانید آرایه‌ها را از طریق SSA تنظیم نمائید، ضمناً HPE SSA بصورت آفلاین در دسترس است از طریق Intelligent Provisioning و از طریق یک فایل ISO قابل بوت و یا بصورت آنلاین از طریق دسترسی به HPE SSA در محیط‌های آفلاین.
نکات مهم :
اگر قصد بروز رسانی سرور را دارید، حتماً قبل از اینکه فرآیند تنظیمات اولیه را انجام دهید آخرین نسخه از SPP یا Service Pack For Proliant را برای سرور دانلود نمائیدو سرور را با آن بروز رسانی نمائید. جهت استفاده از هر کدام از روش‌های دسترسی به HPE SSA می‌توانید آن را قبل از اجرای سیستم عامل اجرا کنید. در این حالت (آفلاین) کاربران می‌توانند، دستگاه‌ها و قطعات شناسایی شده و پشتیبانی شده را از قبیل کنترلرهای قابل انتخاب و یا کنترلرهای یکپارچه را پیکربندی یا نگهداری کنند. بعضی از ویژگی‌های HPE SSA فقط از طریق محیط آفلاین در دسترس می‌باشند از قبیل : تنظیم Boot Controller یا Boot Volume جهت دسترسی به HPE SSA در محیط آنلاین و استفاده از این روش می‌بایستی مدیر شبکه اقدام به دانلود فایل قابل اجرای HPE SSA و نصب آن در سیستم عامل بکند و با این روش ارزشمند می‌توانید HPE SSA آنلاین را بعد از اینکه سیتسم عامل اجرا شد اجرا نمائید.
سرورها دو نوع تنظیم برای بوت یا Boot Mode دارند: UEFI Mode یا Legacy BIOS Mode، هر کدام از آن‌ها کارایی و ویژگی‌های مخصوص به خود را دارند. بصورت پیش فرض نوع بوت برروی UEFI Mode تنظیم شده است و با این تنظیم و این انتخاب گزینه‌ها و امکانات ذیل در دسترس است:
  1. Secure Boot، UEFI Optimized Boot، Generic USB Boot، IPv6 PXE Boot، iSCSI Boot و Boot From URL
  2. Fibre Channel / FCoE Scan Policy
انتخاب Boot Mode باید براساس انتخاب سیستم عامل باشد (هر سیستم عامل با هر نوع بوت نمی‌تواند اجرا شود) و تغییرات این گرینه می‌تواند بر اجرای سیستم عامل تأثیر بگذارد.
پیش نیاز: اگر پیش فرض UEFI Mode باشد، جهت خروج از منوی UEFI Optimized Mode از کلید F9 استفاده کنید.
تنظیم و تغییر Boot Mode :
  1. از صفحه System Utilities گزینه System Configuration، سپس BIOS/Platform Configuration (RBSU) سپس Boot Option و در نهایت Boot Mode را انتخاب نمائید.
  2. یکی از گزینه‌های ذیل را انتخاب کنید:
    1. UEFI Mode (پیش فرض): جهت استفاده از سیستم عامل‌هایی که صرفاً در این حالت بوت می‌شوند.
    2. Legacy BIOS Mode (سیستم‌عامل‌های قدیمی): جهت استفاده از سیستم‌عامل‌هایی که صرفاً در این حالت بوت می‌شوند.
    3. سرور را ری استارت (بوت مجدد) کنید.
اگر با سرورهای HP کار کرده باشید احتمالا گزینه Secure Boot را داخل بایوس سیستم دیده‌اید. آیا می‌دانید این گزینه چیست و چکار می‌کند!؟
بوت امن ( Secure Boot) یک دفاع صنعتی استاندارد برای مقابله با حملات احتمالی مخرب می‌باشد.بدون بوت امن ، نرم افزارهای مخرب میتوانند قبل از بوت شدن سیستم عامل، سرور را مورد حمله قرار داده و در فاصله زمانی شروع بایوس و بارگذاری سیستم عامل ، اجرا شوند.بد افزارهایی که در این مرحله وارد شده‌اند امنیت سیستم عامل را بدون توجه به اینکه امنیتشان چگونه تامین می‌شود به خطر می اندازند. Secure Boot با جلوگیری از ورود نرم افزارهای مخرب در این مرحله از سیستم محافظت می‌کند.
قابلیت Secure Boot یک ویژگی امنیتی در سرورهاست که در داخل BIOS راه اندازی می‌شود ونیاز به سخت‌افزار خاصی ندارد. Secure Boot تضمین می‌کند که هر مؤلفه یا هر بخشی در فرایند بوت راه‌اندازی می‌شود حتماً دارای امضای دیجیتال باشد و این امضاء توسط گواهی قابل اعتماد تعبیه شده در UEFI BIOS باید تأئید شود.
Secure Boot در فرآیند بوت شناسایی و هویت نرم افزاری بخش‌های زیر را تأئید می‌کند:
  1. درایوهای UEFI لود شده از کارت‌های PCIe
  2. درایوهای UEFI لود شده از دستگاه‌ها و ابزارهای ذخیره‌سازی
  3. نرم افزارهای Preboot UEFI Shell
  4. OS UEFI Boot Loader
زمانیکه Secure Boot فعال باشد:
  1. اجزای فریمور و سیستم عامل‌هایی که دارای بوت لودر می‌باشند، بایستی دارای امضای دیجیتال مناسب برای اجرا در طول فرآیند بوت باشند.
  2. سیستم عامل‌ها باید از Secure Boot پشتیبانی کنند و بوت لودر UEFI با یکی از کلیدهای مجاز برای بوت امضاء شده باشد.
  3. شما می‌توانید گواهی‌های تعبیه شده در UEFI BIOS را با افزودن یا حذف گواهی‌های خود، از طریق کنسول مدیریتی به صورت مستقیم به سرور و یا از راه دور از طریق iLO Remote Console متصل کنید. همچنین شما می‌توانید Secure Boot را تنظیم کنید:
    • استفاده از گزینه‌های System Utilities
    • استفاده از دستور SEC Boot در Embedded UEFI Shell برای نمایش پایگاه داده، کلیدها و گزارش‌های امنیتی Secure Boot  
UEFI System Utilities برروی حافظه ROM سیستم تعبیه شده است و فابلیت‌ها و تنظیمات زیادی را در دسترس کاربر قرار می‌دهد که در ذیل بصورت خلاصه و کلی ذکر می‌شود:
  1. تنظیمات قطعات نصب شده بر روی سرور و تغییرات گزینه‌های آن
  2. فعال یا غیرفعال کردن ویژگی‌های سرور
  3. نمایش اطلاعات سیستم
  4. انتخاب کنترلر بوت اصلی و ترتیب بندی کردن آن‌ها
  5. پیکربندی گزینه‌های رم یا Memory
  6. اجرای محیط‌های preboot دیگر
  7. پشتیبانی از پارتیشن‌های بالای 2TB جهت بوت سیستم عامل‌هایی که قرار است برروی RAID نصب شوند
  8. قابلیت Scure Boot جهت بالا بردن امنیت در سطح فریمور، سیستم عامل و نرم افزارها
  9. رابط گرافیکی مدرن UEFI که کاربر براحتی بتواند از آن استفاده کند
  10. استفاده از UEFI Shell تعبیه شده که کمک می‌کند جهت اجرای ابزارها و اسکریپت‌ها در محیط های preboot
بوت UEFI سرور چیست ؟
UEFI مخفف Unified Extensible Firmware Interface است. این عبارت معادل رابط نرم افزاری قابل توسعه یکپارچه می‌باشد. در واقع uefi سرور همان BIOS سرور است اما با قابلیت‌های بیشتر و پیشرفته‌تر uefi مانند bios ، اولین برنامه‌ای است که هنگام بوت سستم اجرا می‌شود و وظیفه شناساندن سخت افزار‌ها را به سیستم عامل بر عهده دارد. از امکانات بوت uefi می‌توان به قابلیت Secure boot ،بوت سریعتر ویندوز و … اشاره کرد .
پورت Service Port یک پورت USB می‌باشد که با برچسب iLO در قسمت جلویی سرورهای Proliant Gen10 و ماژول‌های محاسباتی Synergy قرار دارد. زمانیکه دسترسی فیزیکی به سرور دارید، از طریق Service Port موارد زیر را می‌توانید انجام دهید:

iLO Service Port

 دانلود فایل Active Health System Log برروی فلش USB قابل پشتیبان، زمانیکه از این قابلیت استفاده می‌کنید، فلش USB وصل شده به این پورت توسط سیستم عامل میزبان (Host) قابل دستیابی نخواهد بود.

  • اتصال یک کلاینت (مانند لب تاپ) توسط آدابتور USB به Ethernet که قابل پشتیبانی باشد، جهت دسترسی به صفحۀ وب iLO، Remote Console،CLi،iLO RESTful API یا اسکریپت‌ها
شرکت HPE جهت انجام امور فوق حتماً از تبدیل USB به Ethernet خود شرکت با پارت نامبر Q7Y55A استفاده شود.
زمانیکه در حال استفاده از iLO Service Port می‌باشید:
  1. همه اعمال شما در iLO Event Log ثبت می‌شود.
  2. چراغ UID سرور برای نشان دادن وضعیت Service Portچشمک زن خواهد بود.
  3. شما نمی‌توانید از Service Port جهت بوت هر قطعه ای در سرور استفاده کنید.
  4. شما نمی‌توانید از Service Port دسترسی به سرور داشته باشید
  5. از طریق سرور دسترسی به قطعه وصل شده به Service Port نخواهید داشت.
قابلیت iLO Federation مدیریت چندین سرور را از طریق یک سیستم توسط یک صفحه وب iLO امکان‌پذیر می‌کند. زمانیکه این قابلیت فعال شود iLO توسط Multicast Discovery و ارتباط نظیر به نظیر با سرورهایی که در یک iLO Federation Group می‌باشند ارتباط برقرار می‌کند. زمانیکه صفحه iLO Federation لود می‌شود، یک درخواست داده از iLO سیستمی که صفحه وب آن در حال کارکردن می‌باشد به سیستم‌های نظیر ارسال می‌گردد و از آن سیستم نظیر به نظیرهای دیگر، تا زمانیکه همه اطلاعات سیستم‌های شرکت کننده در یک iLO Federation Group جمع آوری شود، ادامه خواهد یافت.
iLO Federation ویژگی‌های ذیل را پشتیبانی می‌کند:
  1. برای نمایش سلامت سرور و اطلاعات مدل Group Health Status
  2. اتصال Scripted Media به سرورهای عضو گروه Group Virtual Media
  3. مدیریت وضعیت Power سرورهای عضو گروه Group Power Control
  4. تنظیم Dynamic Power Caps برای سرورهای عضو گروه Group Power Capping
  5. آپدیت فریمور سرورهای عضو گروه Group Firmware Update
  6. وارد کردن لایسنس برای iLO سرورهای عضو گروه Group License Installation
  7. انجام تنظیمات اعضای گروه Group Configuration
هر کاربری قادر به دیدن اطلاعات صفحه‌های iLO Federation می‌باشد، اما جهت استفاده از ویژگی‌های iLO Federation نیاز به خرید لایسنس می‌باشد.
IP شامل بخش‌های زیر می‌باشد:
  • Critical Boot Drive درایوهای بوت اضطراری
  • Active Boot Drivers
  • Erase Utility ابزارهای جهت پاک کردن اطلاعات
  • Deployment Setings تنظیمات راه اندازی سریع
موارد مهم
  1. با اینکه سرور شما بصورت پیش فرض با درایوها و فریمورهای پیش فرض می‌باشد و قابل استفاده است ولی جهت دسترسی به آخرین ویژگی‌های IP حتماً آخرین نسخه آن را دانلود کرده و آپدیت نمائید.
  2. برای سرورهای پرولیانت فریمور توسط intelligent provisioning Firmware update Utility بروز رسانی می‌شود.
  3. اگر ورژن فعلی که برروی سرور بالا می‌باشد جهت انطباق با سیستم عامل نیاز می‌باشد، فریمور را بروز رسانی نکنید
نکته : IP بصورت مستقل برروی هر سرور نصب می‌شود و صرفاً جهت استفاده در همان سرور طراحی شده است و قابلیت مدیریت تنظیمات چند سرور بصورت همزمان نمی‌باشد.
IP جهت کمک برای نصب سیستم عامل‌های ذیل نیز استفاده می‌شود:
  • Microsoft Windows Server
  • Red Hat Enterprise Linux
  • SUSE Linux Enterprise Server
  • VMware ESXi/vSphere Custom Image
 همه ورژن‌های سیستم عامل‌های فوق پشتیبانی نمی‌شود و برای هر نسل و هر سروری متفاوت می‌باشد.
  1. مطمئن شوید همه کابل‌ها و پورت‌ها بصورت درست و امن متصل شده باشند و موارد زیر انجام شود:
    1. اگر از KVM Switch استفاده می‌کنید، مطمئن شوید سرور به سوئیچ درست نصب شده است.
    2. اگر از سرورهای قابل نصب در رک استفاده می‌کنید، کابل‌های متصل به باکس Switch را چک کنید و مطمئن شوید که سوئیچ برای سرور درست تنظیم شده است
    3. اگر از سرورهای ایستاده استفاده می‌کنید، اتصال کابل ورودی به سرور را چک کنید
  2. اگر شما KVM Switch دارید، مطمئن شوید همه کابل‌ها و متصل کننده‌ها دارای طول مناسب هستند و توسط سوئیچ پشتیبانی می‌شوند.
  3. مطمئن شوید درایوهای مناسب برروی سیستم عامل نصب شده‌اند
  4. درایو را مجدد نصب کنید به دلیل اینکه امکان دارد درایو فعلی معیوب و با اشکال باشد.
  5. سیستم را راه‌اندازی مجدد کنید و چک کنید بعد از اینکار موس یا کیبورد کار می‌کند یا نه.
  6. با یک موس یا کیبورد دیگر تست کنید، در صورتیکه مشکل همچنان ادامه دارد آن پورت یا کلاً System ILO مادربرد مشکل دارد و باید مادربرد عوض شود، در غیر اینصورت اگر مشکل حل شد، موس یا کیبورد شما مشکل دارد
  7. مطمئن شوید موس یا کیبورد به پورت مناسب وصل شده باشند، مطمئن شوید در زمان Post لامپ‌های کیبورد روشن می‌شوند یا نه، اگر روشن نشدند پورت را جابجا کنید.
  8. موس و کیبورد را حتماً تمیز کنید.
  1. زمانی که ماژول TPM (Trusted Platform Module) برروی سرور نصب باشد و قابلیت استفاده از آن در تنظیمات UEFI سرور فعال شده باشد و همچنین در صورتی‌که قابلیت BitLocker جهت رمزگذاری درایوها فعال شده باشد، همیشه قبل از اینکه موارد زیر انجام دهیم حتماً BitLocker را غیر فعال نمائید:
    • راه اندازی مجدد (Restart) سیستم جهت انجام هر کاری بدون PIN یا هر گونه پسوردی در زمان بالا آمدن
    • آپدیت فریمور زمانی که ماژول TPM نصب شده باشد یا اینکه قابلیت در تنظیمات UEFI (Chipset-TPM) فعال شده باشد.
    • ارتقای قطعات دارای قابلیت بوت (آپگرید Boot Components)
    • جایگزین کردن مادربرد سیستم
    • جایگزین کردن مادربرد سیستم جهت جابجائی یا حذف TPM
    • غیرفعال کردن یا درآوردن ماژول TPM
    • انتقال دیسک یا درایوی که BitLocker فعال روی آن باشدبه سرور دیگر
    • اضافه کردن قطعات PCI اختیاری مثل کنترلرهای ذخیره‌سازها یا کارت شبکه‌ها
    • نصب ماژول 0 زمانیکه قابلیت Chipset-TPM در تنظیمات UEFI فعال شده باشد.
  1. بعضی مواقع سرور در زمان بالا آمدن در صفحه Post یا IML پیغام خطای مبنی بر خراب بودن باتری کنترلر نشان می‌دهد. دلایل این ایراد می‌تواند یکی از موارد ذیل باشد:
    1. ارتباط با باتری دچار مشکل شده است (کابل آن به مادربرد وصل نشده است)
    2. خروجی ولتاژ باتری فعال نشده است.
    3. باتری معیوب شده است.
    کارهایی که بایستی انجام شود:
    1. مطمئن شوید باتری کنترلر نصب شده باشد، هک خودش و هم کابل ارتباطی با سرور
    2. فریمور سرور بخصوص ROM بروز باشد
    3. اگر باز هم پیغام خطا دریافت کردید باتری را عوض کنید و یا فایل Active Health System Log را دانلود کنید و برای کارشناسان شرکت ارسال نمائید.
  1. وقتی یک درایو خراب می‌شود، برروی همه درایوهایی که به آن درایو در یک آرایه بوده‌اند تأثیر می‌گذارد. هر درایو منطقی (Logic Drive) در یک آرایه از روش تحمل خطای متفاوتی استفاده می‌کند. بنابراین هر درایو منطقی می‌تواند تإثیرات متفاوتی را تجربه کند.
    RAID0: این نوع RAID قابلیت تحمل خطا را ندارد، اگر هر کدام از درایوهای شرکت کننده در آن خراب شود، کل آرایه از دسترس خارج می‌شود.
    RAID1: قابلیت تحمل خطا فقط تا یک درایو را دارد
    RAID10: قابلیت تحمل خطای چند درایو را دارد و تعداد آن به تعداد دیسک‌های شرکت کننده در آن آرایه بستگی دارد.
    RAID5: قابلیت تحمل خطا تا یک درایو را دارد
    RAID50: قابلیت تحمل خطا تا یک درایو در هر گروه Parity را دارد.
    RAID6: قابلیت تحمل خطا تا 2 درایو در یک زمان را دارد.
    RAID60: قابلیت تحمل خطا تا 2 درایو در هر گروه Parity را دارد.
    RAID10(ADM) و RAID1(ADM): قابلیت تحمل خطای چند درایو را دارد، البته در صورتی‌که بیشتر از 2 درایو در یک آرایه آینه‌ای خراب نشوند
  1. جابجایی درایو (Drive Roaming) اجازه می‌دهد که شما بتوانید درایوها یا RAIDها را جابجا کنید بدون آنکه به اطلاعات آسیبی وارد شود. شما می‌توانید یک یا تعداد بیشتری درایو را که در RAID از آن‌ها استفاده شده، در صورتیکه جای خالی دارید را به شرط اینکه به همان کنترلر وصل باشد جابجا کنید. علاوه بر موارد فوق شما می‌توانید یک آرایه کامل از RAID را کلاً از یک کنترلر به یک کنترلر دیگر منتقل کنید، حتی اگر کنترلر مقصد در یک سرور دیگر باشد، وضعیت درایو مجازی بعد انتقال دیسک‌ها کما کان Good نمایش داده خواهد شد و مشکلی پیش نمی‌آید.
    نکته: قابلیت جابجائی درایو یک ویژگی Offline می‌باشد، یعنی سرور باید خاموش باشد. فعلاً هیچ راه کاری برای درآوردن درایو و جابجائی آن در سرور روشن وجود ندارد و نمی‌توان با سرور روشن درایو دیسک‌ها را جابجا کرد.
  1. در صورتیکه نمی‌توانید از طریق MicroSD سیستم را بوت نمائید، می‌تواند یکی از عوامل زیر دلیل آن باشد:
    1. در جدول Drive Boot Order بوت شدن از طریق MicroSD تنظیم نشده است.
    2. MicroSD Card توسط iLO شناسائی نشده است.
    3. MicroSD Card درست نصب نشده است.
    در موارد فوق کارهای زیر باید انجام شود:
    1. مطمئن شوید در جدول Drive Boot Order بوت شدن از طریق MicroSD تنظیم شده باشد.
    2. با ورود به صفحه وب iLO مطمئن شوید MicroSD نصب شده توسط iLO شناسائی شده است.
    3. برق سرور را قطع کنید، حافظه MicroSD را دوباره نصب کنید و سپس سرور را روشن نمائید.
  1. علامت :
    1. در طی فرآیند Post کنترلرها پیغام خطا داشته باشند
    2. کش غیرفعال شده است.
    دلایل
    1. سخت افزار یکی یا چندتا از کنترلرها بصورت فیزیکی آسیب دیده است
    2. یک یا چند تا از کنترلرها توسط سرور پشتیبانی نمی‌شود
    3. کنترلرهای نصب شده قابلیت Redundant را پشتیبانی نمی‌‌کنند.
    4. یکی یا چند تا از کنترلرها بصورت درست نصب نشده‌اند
    5. فریمور یک یا چندتا از کنترلرها بروز نمی‌باشد یا سازگار نمی‌باشد.
    6. HPE Smart Storage Battery نصب نشده است
    7. HPE Smart Storage Battery به مادربرد سیستم وصل نشده است.
    8. کابل ماژول کَش به بورد رایزر وصل نشده است. در صورتیکه کنترلر به یکی از درگاه‌های PCIe وصل شده باشد.(
    اقدامات :
    1. مطمئن شوید کنترلرها توسط سرور پشتیبانی می‌شود.
    2. مطمئن شوید همه کنترلرها نصب شده‌اند و درست درجای خود هستند.
    3. مطمئن شوید کنترلر‌ها سازگار برای این قابلیت می‌باشند
    4. مطمئن شوید کنترلرها دارای فریمور سازگار برای این قابلیت می‌باشند.
    5. مطمئن شوید اندازۀ کش کنترلرها سازگار می‌باشد.
    6. مطمئن شوید HPE Smart Storage Battery نصب شده و بصورت صحیح به برد سرور متصل شده باشد.
    7. مطمئن شوید همه کابل کنترلرها بدرستی نصب شده‌اند
    8. اگر مشکل حل نشد، فایل AHS Log را دانلود کنید
    9. با کارشناسان شرکت جاده  ابریشم رایانه ارتباط برقرار کنید.
  1. دلایل
    1. نیازمندی‌های سرور از بابت رم به درستی عملیاتی نشده است
    2. یکی از رم‌ها خراب شده است
    3. رم غیر اصل برروی سرور نصب شده است
    4. رم به درستی و بصورت کامل در جای خود نصب نشده است
     
    چه کارهایی می‌توانیم انجام دهیم
    1. بصورت ایزوله و با حداقل رم سرور را تست نمائید که سلامت رم‌ها تست شود
    2. مطمئن شوید که رم‌ها براساس نیازمندی‌های سرور درست نصب شده باشد. بعضی از سرورها نیازمند این هستند که کانال‌های مموری باید کامل پرشود یا همه رم‌های شرکت کننده در یک کانال از لحاظ ظرفیت، نوع و سرعت عین هم باشند.
    3. چراغ‌های نشان‌های سلامت سرور را چک کنید
    4. رم‌های غیراصل را کلاً جدا کنید
    5. فریمور سرور را به آخرین نسخه بروزرسانی نمائید.
    6. رم را دوباره نصب کنید.
    7. رم را در اسلات‌های دیگر تست نمائید.
  1. iLO Default DNS name and user Account
    فریمور iLO با نام کاربری، کلمه عبور و نام DNS پیش‌فرض پیکربندی شده‌است. اطلاعات پیش فرض برروی هر سروری که دارای پردازنده iLO می‌باشد، برروی آن چسبانده شده‌است. از این اطلاعات جهت دسترسی کار برای شبکه از طریق مرورگر وب استفاده می‌شود.
    نام کاربری، Administrator
    کلمه عبور: یک رشته با 8 کاراکتر یا یک کلمه عبور پیش فرض رایج. نوع کلمه عبور پیش فرض وابسته به شماره SKU می‌باشد که در سفارش خرید سرور درج شده است.
    نام DNS: iLOxxxxxxxxxxxx
    این نام با عبارت iLO شروع می‌شود و به جای X شماره سریال سرور قرار می‌گیرد.
  1. در صورتیکه از طریق فلش USB نتوانید چیزی را بوت کنید یا سرور را مجبور کنید از طریق آن بوت کند می‌تواند یکی از دلایل زیر باعث آن شده باشد:
    1. USB Drive Key در تنظیمات UEFI System Utilities فعال نشده است.
    2. در جدول Drive Boot Order تنظیم نشده است که از طریق USB موردی بوت شود یا در اولویت‌های پائین قرار دارد.
    3. USB مورد نظر به درستی وصل نشده است.
    در موارد فوق کارهای ذیل باید انجام شوند
    1. مطمئن شوید کلاً استفاده از USBها در صفحه تنظیمات UEFI System Utilities فعال شده باشد.
    2. مطمئن شوید در جدول Drive Boot Order، امکان بوت از طریق USB Drive Key تنظیم شده باشد.
  1. دلایل
    1. سنسور دمای سیستم، دمای غیر عادی یا دمای گرم را ثبت کرده است، به علت تنظیمات پیش‌فرض یا دستی می‌تواند از یک دمای خاص به بالا هشدار دهد.
    2. Air Baffle یا Blank کلاً نصب نشده یا بصورت اشتباه نصب شده و باعث قطع جریان مناسب هوا شده.
    3. Heatsink پردازنده نصب نشده است یا کاملاً در جای خود قرار نگرفته
    4. فن استاندارد برروی سرور نصب نشده است.
    عکس العمل ما چه خواهد بود؟
    1. بروز رسانی سرور به آخرین ورژن از فریمور از قبیل فریمور iLO، System Bios و سایر فریمورها
    2. سربرگ دمای قطعات داخل iLO را چک کنیم، در صورتی که سنسور دماها، دمای حدود 10 درجه سلسیوس را ثبت کرده باشند باعث افزایش سرعت Fanها خواهد شد.
    3. چک کنیم که Air Baffle و همه Blankها از قبیل Drive balnk، Processor Heatsink Blank و Power Supply Blank و غیره نصب شده باشند.
    4. چک شود Processor Heatsink به درستی نصب شده باشد.
    5. چک شود Fanها به درستی نصب شده باشند و بررسی شود که سیستم می‌تواند دارای فن‌های Standard و Performance همزمان باشد.
این ابزار به صورت مستقیم برروی هر سرور جهت راه‌اندازی سرورهای پرولیانت و ماژول‌های محاسباتی Synergy از قبل نصب می‌باشد. این ابزار راه اندازی سرور را راحت‌تر می‌کند و روشی قابل اعتماد و ثابت برای این امر می‌باشد. همچنین نصب سیستم عامل را جهت آپدیت از طریق SPP آماده می‌کند. SPP یک نرم افزار سیستمی جامع و راه کاری جهت بروز رسانی سرورهای پرولیانت و Bladeها و انکلوژر آن‌ها و همچنین ماژول‌های محاسباتی Synergy می‌باشد. این اجزاء همراه حداقل فریمورها و سیتم عامل از طریق Intelligent Provisioning نصب می‌شوند. بعد از اینکه سرور کاملاً در این محیط لود شده می‌توانید بصورت یکجا همه فریمورها را آپدیت کنید، یا اینکه قطعات را بصورت تکی بروزرسانی کنید.
جهت دسترسی به IP :
  1. زدن دگمه F10 در صفحه Post سرور
  2. از طریق iLO و منوی Life Cycle Management، اگر از این طریق وصل شوید، می‌توانید بدون نیاز به Reboot به آن دسترسی داشته باشید.
مشکلات Smart Array می‌تواند به صورت‌های ذیل باشد:
  1. کنترلر در زمان Post قابل روئیت نیست
  2. کنترلر در زمان Post توأم با خطا نمایش داده می‌شود
دلایل :
  1. سخت افزار بصورت فیزیکی خراب شده باشد.
  2. کنترلر توسط این سرور پشتیبانی نمی‌شود
  3. کنترلر به صورت درست در جای خود نصب نشده است
  4. کنترلر خودش خراب می‌باشد.
  5. فریمور کنترلر بروز نمی‌باشد.
چه عملیاتی باید انجام شود؟
  1. بررسی شود آیا این کنترلر توسط سرورها پشتیبانی می‌شود یا نه؟
  2. بررسی شودد آیا کنترلر بصورت فیزیکی آسیب ندیده باشد.
  3. اگر کنترلر توسط BIOS سیستم قابل تشخیص است، کنترلر را دوباره جاگذاری نمائید.
  4. انجام تست سلامتی کنترلر توسط سرور.
  5. بروز رسانی فریمور کنترلر
  6. دانلود فایل AHSV و استفاده از آن جهت خواندن و حل مشکلات احتمالی
  7. اگر مشکل حل نشد، توسط فایل AHSV با کارشناسان شرکت HPE در ارتباط باشید.
  8. کنترلر را عوض کنید.
این سرویس یا پروتکل یک رابط وب امن است که توسط HPE میزبانی می‌شود و به شما اجازه می‌دهد، دستگاه‌های پشتیبان شده را از طریق یک رابط گرافیکی نظارت کنید
  • این سرویس با نظارت بر سلامت و عملکرد Active Health System (AHS) و iLO سرورها، جهت بهبود در عملکرد و پیش بینی و ممانعت از خطاها، یادگیری ماشین و تجزیه و تحلیل پیشگویانه را با هم ترکیب می‌کند.
  • همچنین با جمع آوری و تجزیه و تحلیل خودکار داده‌های سنسورها و تجهیزات سنجشی از راه دور از طریق AHS سرورها، که باعث به دست امدن استخراج بینش و تجربه از رفتارهای پایه‌ای نصب می‌شود، می‌تواند جهت حل مشکلات و بهبود در عملکرد توصیه‌هایی را فراهم کند.
iLO Amplifier Pack یکی از کاملترین و سریعترین راهکارها می‌باشد. این بسته نرم افزاری یک راه حل پیشرفته جهت بروز رسانی درایورها، فریمورها و بقیه دارایی های سرور می‌باشد. همچنین جهت انجام کاربردهای پیشرفته iLO نظیر در دسترس بودن با سرعت بالا، گزارش دقیق دارایی‌ها و آپدیت درایور و فریمور نیز بکار برده می‌شود.
این ابزار جهت پیدا کردن سریع سرورها و قطعات آن‌ها که می‌تواند به هزاران مورد برسد مناسب می‌باشد
این ابزار برای سازمان‌ها یا شرکت‌هایی که دارای تعداد بالای سرور می‌باشند توصیه می‌شود ، شما بجای بروزرسانی تک تک سرورها و قطعات آن‌ها را یکجا و گروهی از طریق iLO Amplifier Pack می توانید بروز رسانی نمائید. جهت دانلود نسخه رایگان می‌توانید به سایت HPE مراجعه نمائید و بعد از ثبت نام و ساخت اکانت HPE فایل iLO یا QVF این بسته را دریافت نمائید.

گاه در سرورهای HPE/HP به هنگام نصب قطعه جدیدی، عدم شناسایی یا سازگاری قطعه جدید با دستگاه به چشم می خورد که موجب عدم عملکرد صحیح آن قطعه میگردد. در اینگونه موارد میبایستی در ابتدا آخرین نسخه intelligent provisioning را Update کرده  و درگام بعدی آخرین نسخه SPP مرتبط به آن سرور را از سایت HP دریافت کرده و Upgrade می کنیم و در انتها iLO را به روز رسانی می کنیم  اغلب مشکلات پیش آمده با این روش برطرف می گردند.

رید‌کنترلر بصورت مجزا با حافظه کش (Cache) مخصوص به خود و تعداد Laneهای خاص خود، کارایی و جواب دهی بالاتری دارد. ولیکن SAS Expander از طریق اسلات PCIe به Raid Controller متصل می‌شود و از منابع آن استفاده می‌نماید. طبیعتاٌ کارایی Raid Controller و جواب‌ دهی به سرویس‌ها کندتر خواهد بود. در سناریوهایی که فقط هدف افزایش تعداد درایوها (استوریج‌ها) باشد مقرون بصرفه‌تر است، در غیر اینصورت بهتر است Raid Controller اضافه شود.

منظور از اصطلاح Lane تعداد هاردهایی می‌باشد که مستقیماٌ از طریق کابل SAS به کنترلر متصل می‌گردند.

باتری ذخیره‌ساز هوشمند یک منبع پشتیبانی مرکزی می‌باشد که در صورت خاموش شدن سرورها بصورت ناگهانی، انرژی الکتریکی لازم برای پشتیبان‌گیری از محتویات حافظه‌های Cache، برروی حافظه Flash موجود برروی کنترلر آرایه‌های هوشمند(Smart Array Controller) را تأمین می‌نماید.

زمان لازم برای شارژ مجدد باتری ذخیره ساز هوشمند :

96وات: 2ساعت برای حداکثر 24 تجهیز موجود برروی سرور

12وات: 1ساعت برای حداکثر3 تجهیز موجود برروی سرور

حداکثر مدت زمان پشتیبانی برای انجام انتقال داده 150 ثانیه می‌باشد. در این حالت باتری هوشمند ذخیره ساز، نیرو و زمان کافی برای پشتیبانی از انتقال داده‌های کش (Cached) شده از حافظه DDR به فلش را در اختیار قرار می‌دهد، حال داده‌ها تا زمان بازیابی مجدد اطلاعات از طریق کنترلر اصلی دستگاه محفوظ می‌ماند.

با بازگرداندن نیروی برق به سرور فرآیند بازسازی مقادیر داده‌های محافظت شده به درایوهای اصلی (HDD Or SSD) شروع می‌گردد.

لطفا زمانیکه به این مشکل برخورد کردید تک تک مراحل زیر را دنبال کنید.
1- حتماً برودت محل نگهداری سرور می‌بایست مورد سنجش قرار گیرد.(که حد نرمال دریک اتاق سرور معمولی بین 21-18  میباشد.)
2- تنظیم دما روی سرور BIOS/RBSU برروی خنک‌کننده بهینه تنظیم شود.
3-  اطمینان حاصل بفرمایید که Firmware سرور به آخرین نسخه ارائه شده توسط HP ارتقاء داده شده باشد.
4- لطفآ اطمینان حاصل کنید هیچ مولفه غیرسازگار و پشتیبانی نشده، مانند هارد وPCIe نصب نشده باشد.
5-لطفآ مطمین شوید که ROM و ilo در آخرین نسخه ارائه شده قرار داشته باشند.
6- در RBSU  دو گزینه” “Intel Turbo Boost Technology و همچنین Processor Jitter Contorl غیرفعال باشد.
7- مطمئن شوید که همه Baffles  و همه Blank ها مثل Blank  هارد و Blank  خنک‌کننده(Heat Sink) پردازنده و Blank پاور و… نصب شده باشند نهایتاً از برقراری جریان هوای مناسب در سرور اطمینان حاصل گردد.
8- .بخش مدیریت Logهای سرورتان را حتماً چک بفرمایید تا رویداد یا حرارت غیرمعمول ثبت نشده باشد.
9- در سرور های DL380G10 لطفآ پروفایل Workload را روی “High Performance Compute” /”Virtualization – Max Performance” در BIOS تنظیم گردد و سپس سرور مانیتور شود.

این مطلب در اینستاگرام شرکت می‌باشد

وقتی یک هارد خراب ­می­‌شود تمام Logical Driveها که در یک آرایه قرار دارند، تحت تاثیر قرار می­‌گیرند. هر Logical Drive در یک آرایه ممکن است از یک روش تحمل خطای متفاوتی استفاده کند.
  • تنطیمات RAID 0 خرابی هارد را تحمل نمی‌کند در صورت خرابی فیزیکی یک هارد در آرایه، تمامی Logical Driveهای RAID 0 در همان آرایه از کار می­‌افتد.
  • تنطیمات RAID 1 و RAID 10  تحمل خرابی چند هارد را دارد درصورتی­که هاردهای خراب Mirror یکدیگر نباشند.
  • تنظیمات RAID 5 تحمل خرابی یک هارد را دارد.
  • تنظیمات RAID 50 تحمل خرابی یک هارد در هر Parity Group را دارد.
  • تنظیمات RAID 6 تحمل خرابی دو هارد در یک زمان معین را دارد.
  • تنظیمات RAID 60 تحمل خرابی دو هارد در هر Parity Group را دارد.
در صورت بروز هر یک از موارد زیر، هارد شما خراب است.
  • وضعیت چراغ هارد به زنگ کهربایی شود.
  • هنگامیکه هارد خراب در داخل سرور یا دستگاه ذخیره‌‌­‌ساز قرار دارد LEDهای هارد قابل مشاهده هستند. چراغ Healt در جلوی سرور روشن می­‌شود. البته این چراغ وقتی مشکلات دیگری مانند خرابی فن، زمانیکه منبع تغذیه دوم(Redundant power)  از کار می­‌افتد، یا دستگاه بیش از حد گرم ­می شود نیز روشن می‌­شود.
  • هنگام راه­‌اندازی مجدد سیستم، پیام­های POST هاردهای خراب را لیست می­‌کند تا زمانیکه کنترلرکننده یک هارد عملکردی را تشخیص دهد.
  • منویHPE SSA تمام هاردهای خراب را لیست می­‌کند ونمایانگر هاردهای خراب با یک علامت مشخص است.( در بخش نرم­افزاری نگهداری سیستم منوی HPE SSA قابل مشاهده است.)
  • سیستم Insight Manager می­‌تواند هاردهای خراب را از راه دور در یک شبکه تشخیص دهد برای اطلاعت بیشتر به Insight Management DVD یا در وب سایت Hewlett Packard Enterprise مراجعه کنید.
  • صفحه مدیریت سیستم (SMH) بیانگر هارد خراب نیز هست.
  • بروی سرورهای اداری با سیستم­‌عامل ویندوز، سرویس اطلاع­‌رسانی رویداد، رویدادی را به سرویس‌­دهنده IML و گزارش رویداد سیستم در Microsoft Windows ارسال می­‌کند.
  • بروی سرورهای اداری با سیستم­‌عامل لینوکس، نمایندگان لینوکس این رویدادها رو ثبت می­کنند. در ورودی IML بروزرسانی/ پیام­‌ها / Var / Log را بوجود می­‌آورد
احتیاط: گاهی ممکن است یک هارد که قبلآ توسط کنتلرکننده­ای خراب شده باشد با خارج کردن هارد(در هاردهای hot-pluggable) و دوباره جا زدن هارد در همان جای قبلی، سالم نشان داده شود با این وجود در صورت تکرار این اتفاق برای همان هارد بهتر است به سرعت اقدام به تعویض نمایید زیرا ممکن است باعث از بین رفتن اطلاعت گردد.

شاسی و کنترلرهای 2052 همسان با 2050 می‌باشد. با این تفاوت که 2 عدد SSD 800GB جهت Read Cache و لایسنس AdvancedData Services و همچنین لایسنس 512 عدد Snapshot و Remote Snapshot به صورت پیش‌ فرض روی 2052 فعال و نصب می‌باشند. اگر مجموعه‌ای قابلیت‌های 2052 مقرون بصرفه‌تر است. همچنین روی 2050 بعلت نداشتن گواهی Performance Tiering همزمان از درایوهای SSD و SAS نمی‌توانید استفاده کنید مگر SSDها را به عنوان Read Cache استفاده کنید.

constructionتعمیر سرور اچ پی

تعمیر سرور HP و همچنین پشتیبانی آن، نیازمند کارشناسان مسلط در این زمینه است. شرکت جاده ابریشم رایانه ارائه دهنده خدمات پشتیبانی و تعمیر سرورهای اچ‌پی می‌باشد.
شما مشتری گرامی می‌توانید تمام نیازهای خود اعم از خدمات فنی، رفع نقص‌های پیش آمده، تعمیر، نگهداری و تامین قطعات و مشاوره در زمینه ارتقای تجهیزات سرور و شبکه خود را با کارشناسان ما در میان بگذارید و از خدمات و پشتیبانی تلفنی و حضوری در محل شما برای صرفه جویی در وقت و هزینه شما عزیزان استفاده نمایید.
تعمیر قطعات داخلی سرور
یکی از بیشترین مراجعاتی که به واحد پشتیبانی سرور جاده ابریشم رایانه می‌شود، تعمیرات قطعات سرور است. از کار افتادن بعضی از قطعات سرور می‌تواند به قیمت از رده خارج شدن خود سرور تمام شود. به عنوان مثال از کار افتادن هر یکی از فن‌های سرور، باعث عدم خروج هوای گرم داخل سرور به بیرون شده و در نهایت، قطعات سرور داغ می شوند. در این زمان سرور شما خاموش و در مواقعی ریست خواهد شد. همین اتفاق می‌تواند انجام تراکنش های روی سایت و یا جابجایی دیتای مهمی را در شبکه مختل کند. ادمین سرور باید با مشاهده چنین اختلالاتی به سرعت وارد عمل شده و از تکنسین تعمیرات سرور برای بررسی مورد کمک بگیرد. کارشناسان فنی شرکت  در این زمینه همیشه در کنار شما هستند.
از آنجایی که ارائه خدمات شبکه و سرور جز لاینفک یکدیگر هستند و ناکارآمدی هر کدام بر دیگری تاثیر گذار است بر این اساس این مجموعه پشتیبانی دائمی را به شما کاربران گرامی ارائه می‌­دهد که شما با استفاده از این پشتیبانی خدمات می‌­توانید با خیال آسوده و اطمینان خاطر نسبت به سلامت و کارایی بستر شبکه و سرورهای خود از این  نوع خدمات استفاده کنید. برای دریافت پشتیبانی با کارشناسان فنی شرکت تماس حاصل نمائید.

handymanتعمیر پاور سرور

آنچه که کنترل ولتاژهای ورودی قطعات مهم سرور مانند مادربورد، رم،هارد،cpu و… را در هر سروری با هر برندی به عهده دارد، پاور سرور است. این قطعه کارایی صحیح و سلامت قطعات مختلف را تامین می کند. همانطور که می‌دانید، پاورها به طور کلی چه در کامپیوتر و چه در سرور، با ساختار پاور سوئیچینگ خود، ولتاژ برق شهری را به به ولتاژهایDC تبدیل می کند و بر اساس میزان نیاز تعریف شده هر قطعه ای میزان برق لازم را روانه مدار برق آن مدار می‌کند.
پاورسوئیچینگ سرور به دلیل حساسیت بیشتر قطعات و همچنین اطلاعات موجود در سرورها، بسیار پیچیده‌تر از سیستم پاور در کامپیوترهاست. اگر ولتاژهای ورودی متناسب نبوده، بالاتر از حد تعریف یا پایین‌تر از آن باشد، پاور برق را به مدار داخلی ارسال نمی‌کند. با این تفاسیر متوجه شدیم که نقش پاور سرور تا چه حد حساس و مهم است، این قطعه با توجه به کارکردش، در نوسانات برق، نویزهای شبکه، از کار افتادن یو پی اس و… می‌تواند آسیب ببیند.
با آسیب پاور سوئیچینگ سرور، بهترین اتفاق این است که پاور به کلی از کار بیفتد و هیچ جریانی وارد سرور نشود. اما اگر خرابی پاور به گونه ای باشد که مدارات تصمیم گیری آن به اختلال بخورد ممکن است در تشخیص ولتاژ مناسب مدارهای داخلی به مشکل بخورد و باعث خرابی یا سوختن مدارها و قطعات مختلف و از دور خارج شدن سرور شود.
تعمیر پاور سرور، باید حتماً توسط متخصص آن انجام شود. خرابی پاور سرو به معنای عدم عیب یابی و رفع مشکل آن نیست. چه بسا در صورت کمک گرفتن از متخصص این حوزه می توانید قطعه ارزشمند و گران قیمت سرور خو را به راحتی بازیابی کنید. کارشناسان سخت افزار شبکه در شرکت جاده ابریشم رایانه  تخصص ویژه در تعمیرات و سرویس قطعات داخلی سرورها دارند، حل این مشکل را به ما بسپارید.
از علایم خرابی پاور سرور می تواند موارد زیر را برشمرد:
  • نمایش چراغ سبز چشمک زن، که از نشانه های اختلال در ولتاژ ورودی برق است.
  • پاور هنگام روشن شدن سرور صدای تق تق می‌دهد و در نهایت هم روشن نمی‌شود. این مشکل می تواند از علایم ولتاژ نامناسب ورودی و یا خرابی کنترلرهای ورودی برق باشد.
  • فن سرور فقط در حالت استندبای است و دور بالا کار نمی کند. این مشکل می تواند از ناقص روشن شدن پاور باشد.
  • پاور با قدرت روشن می شود اما بعد از چند دقیقه خاموش می‌شود. فن پاور و هیت سینک باید توسط متخصص بررسی شود.
  • چراغ نارنجی روی پاور روشن خاموش می شود. این مشکل می تواند از ولتاژ نامناسب خروجی باشد.

upgradeارتقاء قطعات سرور

همیشه وجود ایراد در سرور نیست که شما را متقاعد به کمک گرفتن از متخصص تعمیر و پشتیبانی سرور می‌کند. سخت افزار و نرم افزارهای شبکه و سرور مدام در حال آپدیت شدن و به روز شدن هستند. قطعات جدیدتر با فریم ویر‌های بهتر، ایرادات نسخه های قبلی را پوشش داده اند. سریعتر شده اند، ظرفیت و توان بالاتری پیدا کرده اند و کارایی بهتری دارند. در نتیجه برای داشتن بهترین بازدهی از شبکه و تجهیزات خود و همچنین استفاده از سیستم های نرم افزاری به روزتر، باید ارتقا سرور خود را همیشه در برنامه داشته باشید.
ارتقا سرور ممکن است در جهت نیاز شما به سرعت بالاتر، حافظه بیشتر یا توان پردازشی بیشتر انجام شود و یا برای استفاده از رول های مختلف یا نرم افزارهای مختلف ناچار به ارتقا قطعات خود نیز باشید. در هر صورت کارشناسان خبره ما با توجه به نیازسنجی شما، ظرفیت شبکه تان و همچنین انتظارات شما مشاوره لازم را در جهت ارتقای سرور به بهینه ترین حالت ارائه خواهند داد و همچنین تمام خدمات سخت افزاری و نرم افزاری مرتبط با ارتقا سرورتان را در اختیارتان قرار خواهند داد.
خدمات نرم افزاری سرورهای hp

انواع خدمات نرم افزاری سرور و شبکه نیز خواهد بود. برای نصب سیستم عامل مورد نظر خود، نصب رول های سرور و تنظیمات آنها، راه اندازی اکتیودایرکتوری و تنظیمات آن، نصب آنتی ویروس و نرم افزارهای تحت شبکه و… نیز می توانید از خدمات سروری ما استفاده کنید.خدمات شرکت در زمینه نصب، تعمیر و ارتقا سرور فقط شامل خدمات سخت افزاری نیست. این خدمات شامل :

ریکاوری و بازیابی اطلاعات سرور

یکی دیگر از خدماتی که در زمینه تعمیرات تخصصی سرور ارائه می‌شود، بازیابی اطلاعات از دست رفته شما روی سرور است. بازیابی اطلاعات نیز از خدمات پرطرفدار  شرکت بوده است که به بهترین نحو توسط کارشناسان ما انجام می‌شود. بازیابی و ریکاوی دیتای سرور به شدت حساس و پیچیده بوده و به راحتی با دستکاری های ناآگاهانه و جزیی می تواند غیر ممکن شود. برای بازگردانی صحیح و مطمیئن دیتای از دست رفته خود به ما اعتماد کنید.

سرویس های دوره ای سرور

سرورها به دلیل اینکه مدام باید در مدار باشند و خیلی کم پیش می‌آید که سرور برای مدتی از مدار خارج شود، باید از لحاظ سلامت وکارایی مدام مورد بازدید قرار بگیرند. همچنین در سرویس های دوره ای، حداقل هر سه ماه یکبار سلامت قطعات سرور بررسی و تست شود و در صورتی که سخت افزاری نیاز به تعویض، تعمیر یا ارتقا دارد این کار قبل از وقوع خرابی اساسی صورت بگیرد.

خدماتی که شرکت جاده ابریشم رایانه می تواند ارائه دهد:
  • سرویس دوره ای اتاق سرور (Server Room)
  • مشاوره رایگان جهت پشتیبانی و بروز رسانی قطعات و تجهیزات سرور HP
  • فروش و ارتقاء سرورها و استوریج های اچ پی
  • بازدید از سایت و تجهیزات موجود و تهیه نقشه و مدارک لازم جهت استقرار سرور یا تجهیزات ذخیره سازی
  • عیب یابی ، تعمیر ، نگهداری و انجام کلیه امور مربوط به سرورهای HP
  • نصب و راه اندازی و پشتیبانی سرور اچ پی
  • به روز رسانی، رفع مشکلات موردی بصورت مراجعه حضوری
  • عیب یابی و رفع مشکلات سخت افزاری سرور ها و ذخیره سازها (Storage)
  • ارائۀ مشاوره در خصوص شیوه تعمیرها و تعویض های سخت افزاری قطعات سرور
دیدگاه اصلی این مجموعه در حوزه خدمات و پشتیبانی بر این است که به کاربران سرورهای اچ‌پی این اطمینان خاطر را دهد که خدمات و مشاوره‌­های فنی ارائه شده توسط این مجموعه بر پایه پروتکل­‌های ارائه شده توسط کمپانی HPE است و نظرات فنی شخصی جایگاهی در ارائه این خدمات ندارد.
بدیهی است که خطاها، خرابی و کارایی پایین سرورها راندمان کاری مجموعه شما را به شدت کاهش می‌دهد و از این رو نیاز به عیب یابی و تامین قطعه سرورهای HP و رفع مسئله در کوتاهترین زمان ممکن، شرط لازم برای استمرار فعالیت های سازمان شماست که شرکت جاده ابریشم رایانه  با ارائه پشتیبانی حضوری و تعمیر سرور HP در اقصی نقاط کشور می ­تواند در مواردی که امکان ارسال سرور نباشد این خدمات را با بالاترین کیفیت در محل سرور ارائه دهد.
keyboard_arrow_up