واکاوی یک مشکل
ممکن است پاسخ این پرسشها واضح به نظر برسد؛ اما در بیشتر موارد شخصی که مسئولیت مدیریت مشکل را برعهده دارد، نمیداند وقتی در ITIL، از «مشکل» صحبت میکنیم منظور ما چیست. یکی از متداولترین اشتباهات این است که افراد «رخداد با دامنه تاثیرات وسیع» را به عنوان تعریف مشکل در نظر میگیرند.
در مفاهیم ITIL، «مشکل» به عنوان «دلیل ریشهای یک یا چند رخداد» تعریف شده است. یک رخداد زمانی پایان مییابد که مشتری قادر باشد به کار خود ادامه دهد؛ صرف نظر از اینکه دلیل ریشهای رخداد رفع شده است یا خیر. بنابراین یک رخداد میتواند بدون رفع علت ریشهای آن صرفاً با بهکارگیری یک راهکار موقت پایان یابد. در صورتیکه برای رفع مشکل لازم است ریشه و علت بروز رخداد تحلیل و مشخص شود.
اندیشیدن به این مطالب و پاسخ به سؤالات فوق باعث میشود ما هرچه بیشتر درصدد تشخیص مشکلات و ریشهیابی رخداد برآییم و در نتیجه از بروز مجدد رخداد جلوگیری کنیم.
در این بین همیشه روشهای گوناگونی برای تشخیص مشکلات وجود دارد. این روشها به دو بخش مدیریت پیشگیرانه و واکنشی تقسیم میشوند:
مدیریت واکنشی مشکلات، مبتنی بر شناسایی راهکاری برای رفع رخدادهایی است که با راهکارهای موجود قابل رفع نبوده و علت ریشهای بروز رخداد نیز ناشناخته است.
سناریو زیر نمونهای از مدیریت واکنشی مشکلات است: کاربر اول رخدادی در زمینه دریافت پیام خطا مبنی بر از دست رفتن ارتباط را اعلام میکند. کارشناس مرکز عملیات شبکه، مورد را بررسی کرده و متوجه میشود در ارتباطات فیبرنوری اختلالی بهوجود آمده و سعی میکند ارتباطات MPLS و رادیویی را فعال کند، ولی موفق به انجام اینکار نمیشود و تمام راه حلهایی که قبلاً برای رفع این خطا به او آموزش داده شده است را بهکار میگیرد ولی باز هم موفق نمیشود. درنتیجه مورد را به عنوان مشکل ثبت میکند تا در مدیریت مشکل، ریشه بروز رخداد تحلیل و مشخص شود.
شما در مدیریت واکنشی در زمینه رفع رخدادهایی اقدام میکنید که باعث اختلال در سرویس شده و مشتری را متأثر کرده است. در نتیجه، همیشه یک قدم عقب هستید.
مدیریت پیشگیرانه مشکلات با شناسایی و از بین بردن علت ریشهای رخدادهای تکراری از بروز مجدد آنها جلوگیری میکند. فعالیت اصلی مرتبط با مدیریت مشکل پیشگیرانه، تحلیل روند بروز رخدادها و بررسی علل ریشهای آنها است. در مدیریت پیشگیرانه سعی میکنیم با تکیه بر اصل پارتو با شناسایی ۲۰ درصد روندها و ریشهیابی و تجزیه و تحلیل آنها از بروز ۸۰ درصد رخدادها در آینده جلوگیری کنیم.
برای درک بیشتر این موضوع با ارائه یک مثال ادامه میدهیم: به دلیل اشکال در نرم افزار بانکی، پس از جابجایی پول، وجه از حساب مبدأ کسر شده ولی به حساب مقصد واریز نمیشود، کارشناسان به ازای هر کدام از این موارد یک رخداد ثبت خواهند کرد و بعد از رفع آن حداکثر تا ۷۲ ساعت پول به حساب مشتری باز میگردد. در این شرایط به علت بررسی هر تراکنش، بار زیادی روی سیستم خواهد بود، در صورتیکه در راهکار مدیریت پیشگیرانه چندین رخداد تکراری را بررسی و بعد از یافتن علت ریشهای آنها و اشکال نرمافزار، از طریق مدیریت تغییرات، آن را رفع خواهند کرد تا از تکرار رخدادهای مرتبط در آینده جلوگیری کنند.
سوالی همیشگی: از چه تکنیکی برای تحلیل ریشهای و رفع مشکل استفاده کنیم؟
تکنیکهای تحلیل علت ریشه (RCA) مانند Kepner – Tregoe ، تجزیه و تحلیل پارتو، طوفان مغزی، تحلیل بر مبنای ترتیب وقوع (Chronological Analysis)و تحلیل ارزش مشکل (Pain Value Analysis) مطمئناً به شما کمک میکنند. در صورت تمایل به کسب اطلاعات بیشتر در این خصوص به مقالهProblem Management1 مراجعه کنید.
دست در دست سایر فرآیندها
فرآیند مدیریت مشکل از یک سو با فرآیند مدیریت رخداد ارتباط داشته و در صورت لزوم به تشخیص علت ریشهای رخدادها و در نهایت از بین بردن آن میپردازد و گاهی هم به صورت حلقه واسط میان مدیریت رخداد و مدیریت تغییر است؛ به طوریکه خروجی فرآیند مدیریت مشکل، یک درخواست تغییر است و همچنین مدیریت مشکل، ارتباطی تنگاتنگ با فرآیند مدیریت دانش دارد.
شاید در این بین بهتر باشد برای مدیریت مشکل از یک نرم افزار ITSM کمک بگیریم تا بتواند امکان ثبت، دستهبندی و اولویتبندی مشکلات را فراهم کرده و با برقراری ارتباط بین رخداد، مشکل و تغییر، اطلاعات لازم به منظور ردیابی یک مورد را ارائه کند.
ذکر این نکته ضروری است که ثبت یک مشکل به تنهایی کافی نیست. شما باید یک مشکل را به درستی ثبت کرده و سپس در زمینه تحلیل و حل آن اقدام کنید. در غیر این صورت با انبوهی از موارد ثبت شده روبهرو خواهید شد.
مدیریت مشکل، الزام یا انتخاب؟
سازمانهایی که تنها به مدیریت رخداد اکتفا میکنند، اگر چه به مشتریان تضمین میدهند که سرویس آنها مطابق با توافقات و کیفیت مورد انتظار است اما ممکن است بارها و بارها سرویس با بروز یک نوع رخداد دچار اختلال شود و هر بار کارشناسان سازمان با بهکارگیری یک راهکار تکراری نسبت به رفع آن رخداد اقدام کنند. درست مانند یک آتش نشان که هربار آتشی برپا میشود در زمینه خاموش کردن آن اقدام میکند. آیا اثربخشتر نخواهد بود اگر علت بروز آتشسوزی بررسی و ریشه آن به صورت اصولی رفع شود؟! تحلیل ریشهای رخدادها باعث کاهش هزینههای ناشی از دوبارهکاریها، افزایش کارایی پرسنل، افزایش کیفیت و دسترسی خدمات و کاهش هدررفت انرژی ناشی از فعالیتهای غیر کارآمد میشود. علاوه بر آن، رویکرد پیشگیرانه مدیریت مشکل باعث میشود:
- سازمان قبل از آنکه مشتریانش دچار قطعی سرویس شوند، بر اساس موارد ثبت شده، مشکل را تشخیص و در زمینه رفع آن اقدام کند.
- با بررسی بهموقع روند رخدادهای تکراری تهدید از دست رفتن اعتماد مشتریان را به حداقل برساند.
- زمینههای بروز نارضایتی کارکنان به دلیل مواجهه با رخدادهای تکراری و اجبار به کارگیری راهکارهای غیر مؤثر و ناکارآمد را از بین ببرد.
به همین دلیل است که بسیاری از سازمانها زحمت و هزینه پیادهسازی مدیریت مشکل را بهجان میخرند و هزینههای طراحی فرآیند، آموزش کارکنان و استفاده از ابزار جهت پیاده سازی در سازمان را میپذیرند.
چطور مطمئن شویم در مسیر درست قرار داریم؟
در مرحله اول قبل از اینکه مدیریت مشکل به طور رسمی پیاده سازی شود باید موقعیت را بر اساس خط مبنا ترسیم و تنظیم کنید و موقعیت شروع را ثبت کنید. سپس اهداف را تعیین کرده و شاخصهای اصلی عملکرد (KPI) را مطابق با اهداف مشخص کنید تا در نهایت با نظارت و گزارش دهی در برابر این شاخصها، بتوانید جاری سازی مدیریت مشکل در سازمان را توجیه کنید.
در این بین، پیشنهاد ما استفاده از مدلهای مرجع پذیرفته شده همچون ITIL مبتنی بر به روشها و تجربیات برتر و استفاده از ابزارهایی است که این چارچوبها را پیادهسازی کردهاند تا بتوان با به کارگیری آنها از صحت مسیر، اطمینان حاصل کرد.
این یادداشت در رسانه اینترنتی راه پرداخت نیز منتشر شده است.
برای مطالعه سایر یادداشت های گروه فناوری پرند، اینجا کلیک کنید.