مهندسی تاب آوری:یک سخنرانی در 2025 دکتر سعید جوی زاده
“سلام به همه شما بزرگان، کارشناسان و علاقهمندان به دنیای پیچیده سیستمهای مدرن. به این جمع صمیمی و پرشور خوش آمدید! زندگی ما، سازمانهای ما و جوامع ما هر روز با پیچیدگیهای فزایندهای روبرو هستند که چالشهای جدیدی را پیش روی ما قرار میدهند. بیایید لحظهای تأمل کنیم:
- آیا تا به حال به این فکر کردهاید که چرا با وجود تمام تلاشهایمان برای جلوگیری از حوادث، باز هم شاهد رخدادهای ناخواسته هستیم؟
- آیا ایمنی فقط به معنای نبودِ شکست است، یا میتوانیم آن را به شیوهای توانمندتر تعریف کنیم؟
- و مهمتر از همه، اگر ایمنی را نه در جلوگیری از اشتباهات، بلکه در توانایی موفقیت در شرایط متغیر بدانیم، چه تفاوتی در رویکرد ما ایجاد خواهد شد؟
اینها سوالاتی هستند که “مهندسی تابآوری” (Resilience Engineering) به دنبال پاسخ به آنهاست [۲، ۵۴]. رویکردهای سنتی به مدیریت ایمنی، عمدتاً بر «ریسکها» و «شکستها» تمرکز داشتهاند، و آنها را نتیجهای از افت عملکرد عادی میدانستند [۲]. اما مهندسی تابآوری، دیدگاهی متفاوت ارائه میدهد: این رویکرد، شکستها و موفقیتها را دو روی یک سکه میبیند – آنها را پیامدهای متفاوتی از چگونگی کنار آمدن افراد و سازمانها با یک محیط پیچیده، مبهم و تا حدی غیرقابل پیشبینی میداند [۲].
تصور کنید یک ترازوی بزرگ دارید [۶۸]. در یک کفه، شکستها و حوادث قرار دارند و در کفه دیگر، موفقیتها و عملکردهای صحیح. رویکرد سنتی ایمنی سعی میکند با کاهش وزن کفه شکستها، تعادل را به سمت ایمنی سوق دهد [۶۸]. اما مهندسی تابآوری رویکرد دوم را ترجیح میدهد: با افزایش تعداد کارهایی که به درستی انجام میشوند، میتوان ایمنی را افزایش داد [۶۸]. هدف نهایی، افزایش تعداد موفقیتهاست، که کاهش شکستها را به دنبال خواهد داشت [۶۸].
عملکرد عادی در هر زمان نیازمند آن است که افراد و سازمانها فعالیتهای خود را با شرایط فعلی محیط کار تطبیق دهند [۲]. این تطبیق از طریق مصالحه بین کارایی و کامل بودن و اتخاذ “تصمیمات قربانیکننده” (Sacrificing Decisions) صورت میگیرد [۲]. از آنجا که اطلاعات، منابع و زمان همیشه محدود هستند، این تطبیقات تقریبی خواهند بود و در نتیجه، عملکرد متغیر است [۲]. در شرایط عادی، این موضوع اهمیت کمی دارد، اما گهگاه – و گاهی اوقات با نظمی آزاردهنده – تغییرپذیری عملکرد ممکن است به روشهای غیرمنتظرهای ترکیب شده و به نتایج ناخواسته منجر شود [۲].
ایمنی از دیدگاه مهندسی تابآوری، توانایی موفقیت در شرایط متغیر تعریف میشود [۵۴]. برای این کار، مطالعه “آنچه که درست پیش میرود” به همان اندازه مطالعه “آنچه که اشتباه پیش میرود” مهم است [۵۴]. مهندسی تابآوری معتقد است که درک عملکرد عادی یک سیستم اجتماعی-فنی، مبنای ضروری و کافی برای درک چگونگی شکست آن است [۵۴]. همچنین، افزایش ایمنی با بهبود تعداد کارهایی که به درستی انجام میشوند، هم آسانتر و هم مؤثرتر از کاهش تعداد کارهایی است که اشتباه پیش میروند [۵۴].
تعریف تابآوری را میتوان با اشاره به چهار توانایی اساسی که برای یک سیستم تابآور ضروری است، ملموستر کرد [۵۴، ۶۹]:
- توانایی پاسخگویی (Responding): دانستن اینکه چه کاری باید انجام شود [۶۹].
- توانایی پایش (Monitoring): دانستن اینکه به دنبال چه چیزی بگردیم [۶۹].
- توانایی پیشبینی (Anticipating): دانستن اینکه چه انتظاری داشته باشیم [۶۹].
- توانایی یادگیری (Learning): دانستن اینکه چه اتفاقی افتاده است [۶۹].
مهندسی تابآوری در عمل، به چگونگی ایجاد و مدیریت این چهار قابلیت میپردازد [۷۰]. هیچ سیستمی را نمیتوان تابآور نامید اگر یکی از این چهار قابلیت را نداشته باشد، و نبود یک قابلیت را نمیتوان با افزایش کیفیت یا کمیت دیگری جبران کرد [۱۹۳]. این چهار توانایی به یکدیگر وابسته هستند و برای مهندسی تابآوری ضروری است که این وابستگی را درک کنیم [۷۱]. در طول این سخنرانی، ما به تفصیل به هر یک از این چهار توانایی و کاربردهای عملی آنها در صنایع مختلف خواهیم پرداخت.
بخش اول: تابآوری و توانایی پاسخگویی (مقابله با وضعیت فعلی) (تقریباً ۴۵ دقیقه)
در این بخش، بر توانایی یک سازمان یا سیستم برای «مقابله با وضعیت فعلی» تأکید میشود [۷۲]. این بدان معناست که چگونه سیستم میتواند به خواستههای شرایط فعلی – یک موقعیت مختلکننده – پاسخ دهد [۷۲]. در سطح عملیاتی، “پاسخگویی به وضعیت” شامل ارزیابی وضعیت، دانستن اینکه به چه چیزی پاسخ دهیم، یافتن یا تصمیمگیری برای انجام چه کاری، و زمان انجام آن است [۷۲]. آمادگی برای پاسخگویی عمدتاً بر دو استراتژی تکیه دارد:
- اولین استراتژی، استراتژی پیشگیرانه است: پیشبینی موقعیتهای مختلکننده بالقوه و از پیش تعریف کردن راهحلهای آماده برای استفاده (مانند رویههای اضطراری، مهارتهای واکنش خاص، برنامههای واکنش به بحران و غیره) [۷۲].
- دومین استراتژی، استراتژی واکنشی است: تولید، ایجاد، اختراع یا استخراج راهحلهای موقت و بداهه [۷۲].
این بخش در مورد “تابآوری در زمان واقعی” است [۷۳]. در سطح مدیریت (طراحان، مدیران، مربیان)، مسائل مربوط به تابآوری در زمان واقعی شامل چگونگی اطمینان از در دسترس بودن منابع (افراد، شایستگی، تجهیزات) یا ایجاد به موقع آنها میشود [۷۳]. بنابراین، یک سوال کاملتر این است که چگونه میتوان آمادگی برای پاسخگویی را (در حال حاضر) ایجاد و (در آینده) حفظ کرد [۷۳].
ارتباط بین تابآوری و پیشبینی در نگاه اول، نقش پیشبینی هم آشکار و هم ساده است: وقتی رویدادها پیشبینی شده باشند، همه چیز بهتر پیش میرود [۷۴]. نمونه برجسته این موضوع، فرود موفقیتآمیز پرواز ۱۵۴۹ یو.اس. ایرویز بر روی رودخانه هادسون در سال ۲۰۰۹ است [۷۴]. این رویداد، که به «معجزه هادسون» معروف شد [۸۲]، نشاندهنده استراتژی “دفاع عمقی” (defence-in-depth) در برابر خطر برخورد پرنده بود که در سیستم هوانوردی مهندسی شده است [۷۴، ۸۱]. این دفاع شامل لایههای متعددی بود:
- اولین خط دفاعی: کاهش حداقل فرکانس برخورد پرنده [۷۴، ۱۰۴].
- دومین خط دفاعی: اطمینان از توانایی هواپیما و موتورهای آن برای تحمل برخورد با پرندگان بدون آسیب [۷۴، ۱۰۴].
- آخرین خط دفاعی: توانایی سیستم خدمه-هواپیما برای فرود در زمین آمادهنشده یا فرود اضطراری در آب با حداقل آسیب پس از از دست دادن کامل قدرت، و تخلیه ایمن مسافران [۷۴، ۱۰۴].
واضح است که پیشبینی سیستم هوانوردی برای از دست دادن کامل موتور، به بقا در رویداد رودخانه هادسون بسیار کمک کرد [۷۴]. طراحی هواپیما به خدمه امکان داد تا کنترل مسیر پرواز را حفظ کنند، رویههای از دست دادن دو موتور و فرود اضطراری در آب در دسترس بودند، و خدمه برای تخلیه اضطراری آموزش دیده بودند [۷۴].
با این حال، در حالی که از دیدگاه سیستم هوانوردی، از دست دادن دو موتور کاملاً پیشبینی شده بود، اما در مقیاس زندگی حرفهای یک خلبان، رویدادی بسیار نادر بود و برای خدمه، کاملاً غیرمنتظره بود [۷۴، ۹۲]. این نشان میدهد که پیشبینی در یک سیستم بزرگ به طور یکنواخت توزیع نمیشود [۷۴]. سیستم جهانی ممکن است رویدادهایی را پیشبینی کند که برای مقیاسهای محلی بسیار نادر هستند و حتی به آنها فکر هم نمیشود، در حالی که اپراتورهای محلی موقعیتهایی را پیشبینی میکنند که برای مقیاس بزرگتر بسیار جزئی هستند [۷۴]. این موضوع، “تعاملات بینمقیاسی” (cross-scale interactions) بین سطوح مختلف سازمان در یک سیستم را مطرح میکند [۷۴، ۱۳۹].
در مطالعهای بر روی متخصصان بیهوشی [۷۵]:
- آنها قبل از هر عمل جراحی، دامنهای خاص از “تغییرپذیری بالقوه” (potential variability) را پیشبینی میکنند [۷۵، ۱۳۲، ۱۳۳].
- پاسخها و منابع لازم را آماده میکنند [۷۵، ۱۳۲].
- تا زمانی که رویدادهای “غیرمنتظره” در مرزهای این منطقه باقی بمانند، احساس کنترل دارند [۷۵].
- زمانی که یک رویداد خارج از این منطقه قرار میگیرد (اغلب به دلیل خرابی تجهیزات یا مشکلات همکاری با تیم جراحی)، اولین چالش تشخیص آن است [۷۵، ۱۴۰].
- در بیشتر موارد، متخصصان بیهوشی با مشکلاتی روبرو شدند که یا باید وضعیت را شناسایی و درک میکردند یا تحت محدودیتهای زمانی بسیار شدید، پاسخهای مناسب را اجرا میکردند [۷۵، ۱۴۲].
نویسندگان رویدادهای “غیرمنتظره” را بر اساس ماهیت غافلگیری مربوطه، به دو دسته “موقعیتهای بالقوه” (envisaged before operation) و “موقعیتهای غیرقابل تصور” (unthought-of situations) طبقهبندی میکنند [۷۵، ۱۲۷، ۱۲۸]. در ۹ مورد از ۱۳ موقعیت “غیرقابل تصور”، متخصصان بیهوشی برای کمک با همکاران خود تماس گرفتند [۷۵، ۱۴۳]. آنها این تصمیمات برای فراخوانی منابع اضافی (به ویژه همکاران) را نشانه قابل مشاهده تغییر از موقعیتهای کنترلشده به موقعیتهای بحرانی میدانند [۷۵، ۱۴۴]. تابآوری در توانایی اپراتور نه تنها در تشخیص، بلکه در پذیرش – و به معنای واقعی کلمه “تصمیمگیری” – این است که سیستم از مرزهای تغییرپذیری بالقوه فراتر رفته است [۷۵، ۱۴۴].
این موضوع همچنین به رابطه پیچیدهتر بین تابآوری و پیشبینی اشاره دارد: تابآوری نه تنها با پیشبینی آنچه ممکن است اتفاق بیفتد، بلکه با پیشبینی “ظرفیتهای مقابله” (coping capacities) نیز مرتبط است [۷۶]. این بدان معناست که سیستم باید همیشه مراقب باشد که “ظرفیت انطباقی” (adaptive capacity) آن، همانطور که در حال حاضر پیکربندی و عمل میکند، برای پاسخگویی به خواستههایی که در آینده با آن روبرو خواهد شد، کافی است یا خیر [۷۶، ۱۲۱]. و از آنجا که ظرفیت انطباقی شامل پیشبینی نیز میشود، یک رابطه بازگشتی وجود دارد، یعنی تابآوری همچنین به معنای پیشبینی ظرفیتهای پیشبینی آینده است [۷۶]. این موضوع با تصمیم کاپیتان پرواز ۱۵۴۹ یو.اس. ایرویز برای عدم تلاش برای بازگشت به فرودگاه نشان داده میشود، زیرا چنین تصمیمی منجر به یک مسیر عملیاتی برگشتناپذیر با از دست دادن کامل کنترل و عواقب فاجعهبار اجتنابناپذیر در صورت اشتباه بودن میشد [۷۶].
آماده بودن برای ناآماده بودن: با این حال، شرایط تابآوری را نمیتوان به پیشبینی صرف محدود کرد [۷۷]. در حالی که رویدادها تنها در صورتی قابل کنترل هستند که تا حدی پیشبینی شده باشند، هرگز با جزئیات کامل پیشبینی نخواهند شد [۷۷، ۱۱۶]. از این رو، تابآوری مستلزم ترکیبی از آمادگی و خلاقیت، و پیشبینی و اتفاقی بودن (serendipity) است [۷۷، ۱۱۶]. یا به عبارت دیگر، یک سیستم تابآور باید هم آماده باشد و هم آماده باشد برای ناآماده بودن [۷۷]. در مورد هادسون، استراتژیهای پیشبینی در سطح سیستم در هوانوردی میتوانند به نتیجهای متناقض منجر شوند: ایجاد اپراتورهای ناآماده [۷۷]. این موضوع “تناقض تابآوری” (irony of resilience) را مطرح میکند: شایستگیهای “زمان واقعی” که برای مقابله با رویدادهای غیرمنتظره یا شدید در “نوک پیکان” (sharp end) مورد نیاز است، دقیقاً همانهایی هستند که در تلاش مداوم برای پیشبینی همه رویدادها و از پیش تعیین کردن پاسخهای مربوطه در سطح سیستم، از دست میروند [۱۱۷].
این دو مسئله حداقل دو چالش را مطرح میکند [۷۸]:
- اولین چالش، ارتباط بین آموزش و موقعیتهای “غافلگیری بنیادی” (fundamental surprise) است. چگونه میتوان افراد را برای چیزی که هرگز تصور نشده است، آموزش داد؟ در «درسهایی از هادسون»، استدلال میشود که این کار واقعاً ممکن است [۷۸]. با این حال، شرایط کارایی (از جمله شبیهسازی دقیق عاطفی و شناختی “غافلگیری واقعی”) توسط سیستم آموزش فعلی هوانوردی برآورده نمیشود [۷۸]. یکی از دلایل این امر میتواند الگوی غالب ایمنی هوانوردی باشد که فرض میکند عملیات پرواز را میتوان به طور کامل توسط رویهها مشخص کرد و در نتیجه خدمه باید به طور کامل به آنها پایبند باشند [۷۸، ۲۴۴].
- دومین چالش، ارتباط بین ویژگیهای تابآوری مهندسیشده در کل سیستم و ویژگیهای تابآوری اجزای محلی یا عوامل سیستم (مانند اپراتورهای خط مقدم) است. تابآوری در سطح سیستم جهانی را میتوان به عنوان یک ویژگی نوظهور از تعاملات رفتارهای عوامل منفرد در نظر گرفت، در حالی که در عین حال، تابآوری در سطح رفتار فردی حداقل تا حدی نتیجه طراحی سیستم جهانی است [۷۹]. بنابراین، “تابآوری در زمان واقعی” از طریق هر دو فرآیند “پایین به بالا” (bottom-up) و “بالا به پایین” (top-down) تولید میشود [۷۹]. وودز (Woods) به “تابآوری رو به پایین و رو به بالا” (downward and upward resilience) اشاره میکند تا این فرآیندهای مرتبط و پیچیده را توصیف کند [۷۹، ۱۵۷، ۱۶۰]. یک راه برای غلبه بر این تناقض ظاهری، تطبیق سطح انتزاع عملکردی پاسخهای آماده با سطح عدم قطعیت مرتبط با موقعیت پیشبینیشده است [۷۹].
در مورد فرود اضطراری در آب رودخانه هادسون، با افزایش عدم قطعیت، موقعیت نامحتملتر و کمتر قابل کنترل میشود [۸۰، ۱۰۵]. در هر مرحله، پاسخهای آماده از حالت مشخص و جزئی به حالت انتزاعی و کلی تغییر میکنند؛ رویهها از پروتکلهای دقیق و جزئیِ عملمحور به یک چارچوب پاسخگویی کلی و هدفگرا تبدیل میشوند [۸۰، ۱۰۶].
سازگاری یافته یا سازگار؟ با این حال، سادهلوحانه خواهد بود اگر وانمود کنیم که صرفاً تطبیق سطح انتزاع عملکردی پاسخهای آماده میتواند تضاد بالقوه بین پیشبینی و اتفاقی بودن را حل کند [۸۰]. یک سیستم پیچیده لزوماً تا حدی نسبت به محیط خود “ناسازگار” است [۸۰]. اجرای ظرفیتهای انطباقی آن برای تطبیق با تغییرات داخلی و خارجی، طیف رفتارهای بالقوه آن را افزایش میدهد [۸۰]. این امر موقتاً راهحلهایی را برای برآورده کردن نیازهای جدید (سازگاری) فراهم میکند، در حالی که ذخیره انطباق را افزایش میدهد و ظرفیتهای اکتشافی جدیدی را تولید میکند که در نهایت سیستم را در معرض موقعیتهای جدید و چالشهای جدید قرار خواهد داد [۸۰].
در نهایت، همه اینها به مصالحه کارایی/شکنندگی (optimality/brittleness trade-off) که رفتار هر سیستم انطباقی پیچیدهای را محدود میکند، بازمیگردد [۸۰]. چنین سیستمی نمیتواند همزمان کاملاً با محیط خود سازگار باشد (عملکرد بهینه) و توانایی مقابله با تغییرات مختلکننده در آن محیط (تابآوری) را داشته باشد [۸۰]. سازگاری یافته یا سازگار، یک انتخاب اجتنابناپذیر باید انجام شود [۸۰، ۱۱۸]. در سیستمهای ایمنتر، گرایش طبیعی این است که سطح تولید را افزایش دهند، که میتواند ریسک ذاتی را افزایش دهد (مثلاً هواپیماها یا مسافران بیشتر)، انعطافپذیری را کاهش دهد و اتصالات را محکمتر کند [۲۶۸].
تصمیمات قربانیکننده: در موقعیتهای بحرانی، هیچ مسیر عملیاتی بدون خطا وجود ندارد [۹۷]. کاپیتان سولی در مصاحبهای اظهار داشت: “انتظار داشتم که این پرواز مانند هیچ پرواز دیگری که در تمام دوران حرفهایم انجام دادهام، نباشد و احتمالاً در باند فرودگاه و بدون آسیب دیدن هواپیما به پایان نرسد” [۹۸]. این جمله نشاندهنده عدم قطعیت عظیمی است که به طور ناگهانی در چنین لحظاتی حاکم میشود، هم در مورد وضعیت فعلی و هم در مورد تکامل کوتاهمدت آن [۹۸]. جهان شناخته شده و پیشبینی شده به یکباره از دست رفت [۹۸]. اطلاعات در مورد وضعیت واقعی و تکامل بالقوه آن به قدری کم است که تصمیمات هرگز با توجه به گذشته، کاملاً “درست” نیستند [۹۸]. رفتار روزمره انسان به عنوان “عقلانیت محدود” (bounded rationality) توصیف شده است [۹۸]. در موقعیتهای بحرانی، این محدودیتها به مراتب بدتر میشوند [۹۸]. کمبود زمان، دانش و منابع بسیار زیاد میشود [۹۸]. تصمیمات “رضایتبخش” (satisficing) (به جای حداکثرکننده) به “تصمیمات قربانیکننده” (sacrificing decisions) تبدیل میشوند [۹۸].
یک مثال از تصمیم قربانیکننده، تصمیم برای فرود اضطراری در آب رودخانه هادسون بود [۹۹]. شبیهسازیهای پس از رویداد نشان داد که با توجه به سرعت، فاصله و ارتفاع هواپیما، در واقع انرژی کافی برای بازگشت به باندهای لاگاردیا وجود داشت [۹۹]. اما این چیزی است که ما پس از ساعتها پردازش داده و شبیهسازی میدانیم [۹۹]. خدمه هیچ راهی برای تعیین دقیق و قابل اعتماد اینکه آیا میتوانند به باند فرودگاه برسند یا خیر، در دسترس نداشتند [۹۹]. تنها مرجع آنها تجربه، مهارت پروازی و احساسشان از وضعیت بود [۹۹]. کاپیتان سولی گفت: “و مجازات انتخاب اشتباه، و تلاش برای رسیدن به باندی که نمیتوانستم به آن برسم، ممکن بود برای همه ما در هواپیما و همچنین مردم روی زمین فاجعهبار باشد” [۹۹]. بنابراین، یک مصالحه ناگزیر وجود داشت: یا هادسون، که قطعاً بد بود اما شاید فاجعهبار نبود، یا فرودگاههای اطراف، که ممکن بود به پایان خوشی با حداقل آسیب به هواپیما منجر شود، اما تقریباً به طور قطع در صورت شکست تلاش، فاجعهبار بود [۹۹]. این یک نمونه خوب از مدیریت ریسک از طریق “تصمیم قربانیکننده” است: به حداقل رساندن احتمال فاجعه با قربانی کردن عمدی جاهطلبانهترین و بالقوه خوشایندترین – اما غیرقابل تحملترین – شاخه از درخت گزینهها، برای ایجاد نوعی حداقل سطح آسیب، مرتبط با فرود اضطراری در آب [۹۹].
آموزش تابآوری سازمانی در موقعیتهای تشدیدشونده: در مواجهه با اتکای بیش از حد صنایع پرخطر به رویههای اضطراری تجویزی و ظرفیت شبیهسازی با دقت بالا، جستجو برای گامهای جدید در آموزش برای موقعیتهای غیرمنتظره و تشدیدشونده آغاز شده است [۱۴۷]. یک چارچوب نظری برای شایستگیهای انطباقی و انعطافپذیر ارائه شده است که به تابآوری سازمان در موقعیتهای تشدیدشونده میافزاید: “شایستگیهای عمومی در مدیریت موقعیتهای تشدیدشونده” [۱۴۸]. این واژه “عمومی” برای متمایز کردن این شایستگیها از شایستگیهای خاص دامنه و فنیتر انتخاب شده است که معمولاً در آموزشهای خاص دامنه، مانند استفاده از شبیهسازیهای با دقت بالا، تمرین میشوند [۱۴۸].
یک آزمایش با مهندسان ایمنی آتشنشانی سوئد انجام شد [۱۴۸، ۱۵۲]. شبیهسازیای طراحی شد که در آن پنج تا هفت شرکتکننده نقشهای مختلفی را بر روی پل یک کشتی مسافربری که در یک شب طوفانی در اقیانوس اطلس گرفتار شده بود، بر عهده گرفتند [۱۵۳]. سناریوهای شبیهسازی بهدقت از اصول طراحی سناریو برای آموزش شایستگیهای عمومی پیروی میکردند [۱۵۳، ۱۵۱]. این شبیهسازی پیچیده بود و توسط رایانه اجرا میشد [۱۵۴]. شرکتکنندگان قادر بودند با اقدامات خود بر توسعه وضعیت تأثیر بگذارند [۱۵۴]. مهمتر اینکه، آنها هیچ استراتژی از پیش تعریفشدهای برای مدیریت موقعیتهای آتی نداشتند [۱۵۴].
نتایج نشان داد که گروههای آزمایشی، در مقایسه با گروههای کنترل که فقط آموزش عملیات اضطراری معمول را دیده بودند، توانایی افزایش یافتهای در به کارگیری شایستگیهای عمومی از خود نشان دادند [۱۵۹، ۱۶۱، ۱۶۲]. برای مثال [۱۵۹]:
- هر دو گروه آزمایشی، یک فرآیند مدیریت اطلاعات هدفمحور را انتخاب کردند [۱۵۹].
- در حجم بالای اطلاعات ورودی، هر دو گروه آزمایشی از فرمولبندی اهداف صریح برای هدایت فرآیند تعیین اطلاعات مرتبط، استفاده کردند [۱۵۹].
- گروههای کنترل چنین استراتژیای را به کار نبردند، بلکه اطلاعات ورودی را بر اساس فوریت درکشده، نه اهمیت، دستهبندی کردند [۱۵۹].
- در هیچیک از گروههای کنترل، نقش خاصی برای مدیریت فرآیند اشتراکگذاری اطلاعات تعیین نشده بود [۱۵۹].
- فرآیند ارتباط و هماهنگی در هر دو گروه آزمایشی با تعیین نقشهای خاص برای شرکتکنندگان مشخص شد [۱۶۰].
- گروههای آزمایشی از اهداف صریح و فرمولبندی نقشها برای ایجاد یک فرآیند تصمیمگیری توزیعشده (distributed decision-making process) استفاده کردند [۱۶۱]. جلسات توجیهی در گروههای آزمایشی پیشگیرانه بودند و اهداف تصمیمات آتی را تعیین میکردند، در حالی که جلسات توجیهی در گروههای کنترل واکنشی بودند و بر تصمیمگیری بر اساس آنچه قبلاً اتفاق افتاده بود، تمرکز داشتند [۱۶۱]. این تغییر پیشگیرانه، اهمیت تعیینکنندهای برای تابآوری سازمانی در موقعیتهای تشدیدشونده داشت [۱۶۱].
این آزمایش نشان داد که طراحی محیط آموزشی که در آن افراد واقعاً با عدم قطعیت و غیرقابل پیشبینی بودن موقعیتهای تشدیدشونده (هر دامنهای که باشد) روبرو شوند، شایستگیهای “تابآور”ی را ایجاد میکند که توسط استراتژیهای آموزشی فعلی با هدف تمرین رفتار صحیح در سناریوهای شناختهشده، ایجاد نمیشوند [۱۶۶]. همچنین نشان داد که آموزش غیرخاص دامنه، درک عمیقتری از ماهیت موقعیتهای تشدیدشونده و دشواریهای مدیریت آنها را فراهم میکند [۱۶۷].
بخش دوم: تابآوری و توانایی پایش (مقابله با وضعیت بحرانی) (تقریباً ۴۵ دقیقه)
یکی از چهار سنگ بنای اصلی مهندسی تابآوری، توانایی پایش است [۶۱، ۶۹]. هر سازمان مرتبط با ایمنی، یک یا چند معیار برای قضاوت درباره قابل قبول بودن سطح ایمنی در سازمان خود دارد [۶۱]. مدیریت ایمنی به طور سنتی از مدل نظری کنترل کلاسیک پیروی کرده است [۱۷۲، ۶۳]. تغییرات در رویهها و سیاستهای ایمنی معمولاً رخ نمیدهد مگر اینکه تغییری در “خروجی ایمنی” فرآیند – از دست دادن جان، آسیب جدی، انفجار یا سقوط یا هر رویداد جدی دیگری – ایجاد شود [۱۷۲]. سپس مدیریت رویداد را با استفاده از “مدل” فرآیندهای خود بررسی میکند، تغییراتی ایجاد میکند (شاید یک سیاست ایمنی جدید یا یک مانع جدید ایجاد کند) و اجازه میدهد کسب و کار ادامه یابد [۱۷۲].
مهندسی تابآوری بر نیاز به رویکردی پیشگیرانه در مدیریت فرآیندهای اصلی، از جمله ایمنی، و پیشبینی (و ترجیحاً جلوگیری از) تغییرات عمده در ایمنی و سایر حوزههای عملکرد بحرانی تأکید میکند [۱۷۳]. صرفاً اتکا به نتایج کافی نخواهد بود [۱۷۳]. برای پیشگیرانه بودن، اطلاعات بیشتری مورد نیاز است [۱۷۳]. این بدان معناست که دادهها نه تنها از خروجیهای فرآیندها، بلکه از فعالیتهای میانی در طول مسیر نیز جمعآوری میشوند [۱۷۳]. این دادهها را “شاخص” مینامیم [۱۷۳]. هدف آنها ارائه اطلاعات در مورد آنچه در مراحل میانی فرآیندها رخ میدهد، قبل از اینکه نتایج به طور قابل توجهی تغییر کنند، است؛ تا مدیریت بتواند برای جلوگیری از نتایج نامطلوب، اقدامات لازم را انجام دهد [۱۷۳].
وسترام (Westrum) اشاره کرده است که استفاده از “سیگنالهای ضعیف” (faint signals) اغلب یک ویژگی حیاتی سازمانهای تابآور است [۱۷۴]. سیگنالهای ضعیف نشانههای اولیه مشکلاتی هستند که در یک پروژه شروع به رخ دادن میکنند یا نکاتی از مشکلات آتی در یک فرآیند [۱۷۴].
انتخاب و مبنای شاخصها: وریتال (Wreathall) پیشنهاد کرده است که “شاخصها معیارهای جایگزینی برای مواردی هستند که در مدل(های) زیربنایی ایمنی مهم شناخته شدهاند. بدین ترتیب، آنها نامطمئن هستند و اغلب تنها ارتباط دوری با معیارهای ایدهآل دارند که به ندرت در عمل در دسترس هستند” [۱۷۵]. در عمل، یافتن مدلهای صریح که مبنای رسمی برای شناسایی معیارها را فراهم کنند، نادر است [۱۷۵]. با این حال، دانش اغلب در مورد روابطی وجود دارد که برای ایمنی مهم هستند و میتوان از آنها برای ایجاد مدلهای کاری استفاده کرد [۱۷۵].
- در مطالعه خستگی (فصل ۶)، مجموعهای از روابط بین ایمنی، خستگی و مکانیسمهای زیربنایی آن بیان شد [۱۷۵]. این روابط برای ایجاد معیارهایی برای پایش خطرات ناشی از خستگی استفاده شد [۱۷۵].
- در مطالعه استراتژیهای شناختی در کنترل ترافیک هوایی (فصل ۸)، مدل عملکرد T2EAM بر اساس تحقیقات موجود مربوط به استراتژیهای شناختی در انواع مشابه وظایف، اگرچه اغلب در صنایع دیگر، توسعه یافت [۱۷۶]. این مدل عملکرد مبنایی برای توسعه روشهای اندازهگیری فراهم کرد [۱۷۶].
- به عنوان یک موضوع عملی، چندین مطالعه از روشهای موقت (ad hoc) برای انتخاب شاخصها استفاده کردهاند [۱۷۶]. همانطور که در فصل ۷ توضیح داده شد، عوامل حیاتی مرتبط با قطع برق که نشاندهنده پتانسیل مشکلزا بودن بودند، از طریق کارگاههای طوفان فکری با مدیران پروژه باتجربه و دیگرانی که اغلب در حمایت از پروژهها در زمان مشکلات درگیر بودند، شناسایی شدند [۱۷۶].
تجربه تا به امروز نشان میدهد که انواع مختلفی از معیارها وجود دارد [۱۷۸]:
- مثالهای فصل ۶، مربوط به مدل شاخص خطر خستگی (Fatigue Risk Index)، عمدتاً شامل معیارهایی هستند که مستقیماً با موارد عینی مرتبطند، مانند وظایفی که صبح زود شروع میشوند (قبل از ۰۶:۰۰)، دورههای کاری بیش از ۵ روز و تعداد پروازها [۱۷۸، ۱۹۶].
- در مدل T2EAM (فصل ۸)، معیارها نمرات مرتبط با سبکهای رفتاری مورد استفاده توسط کنترلکنندگان هستند که توسط کارشناسان مربوطه مشاهده شدهاند [۱۷۸، ۱۰۶].
- در فصل ۷، انواع مختلفی از معیارها استفاده میشوند؛ برخی نمرات عینی هستند مانند مقدار کار اضطراری (برنامهریزی نشده)، مدت زمان طولانی کار، جابجایی پرسنل و وجود شرایط خاص (آب و هوای شدید، وقوع تعطیلات اصلی و غیره) [۱۷۸].
- سایر موارد شامل قضاوتهای ذهنیتر مانند افت روحیه، و کاهش کیفیت (و همچنین کمیت) ارتباطات سایت با ستاد مانند گزارشهای وضعیت سطحی هستند [۱۷۸]. بنابراین، در این سه مطالعه نمونه، تقریباً کل طیف معیارهای ممکن به عنوان شاخص دیده میشود [۱۷۸].
شاخصهای پیشرو و تاخیری (Leading and Lagging Indicators): در بحث استفاده از شاخصها، تاکید زیادی بر این است که آیا شاخصهای خاصی پیشرو یا تاخیری هستند [۱۷۹]. مسئله اصلی این است که کدام شاخصها پیشرو یا تاخیری هستند، یک مسئله عملگرایانه است [۱۷۹].
- شاخصها زمانی پیشرو نامیده میشوند که اطلاعاتی را ارائه دهند که اقدامات کنترلی را میتوان به موقع انجام داد تا از تغییر غیرقابل قبول در یک یا چند خروجی اصلی (مانند ایمنی، مالی یا کیفیت) جلوگیری کرد [۱۷۹].
- شاخصها زمانی تاخیری نامیده میشوند که تغییرات در خروجیهای اصلی را که رخ دادهاند، منعکس کنند [۱۷۹]. برای مثال، تابلوی نشان داده شده در شکل ۵.۱ (در منابع) یک نمونه از شاخص تاخیری است [۱۷۹]. این نشاندهنده عملکرد گذشته در مدیریت ایمنی است [۱۷۹].
با این حال، زمانی که چندین مقیاس زمانی و سطح برای اقدامات کنترلی وجود دارد، مسئله کمی پیچیدهتر میشود [۱۸۰]. گاهی اوقات افزایش موقت کارکنان در یک بخش تولید برای مقابله ایمن و قابل اعتماد با افزایش ناگهانی تقاضا برای یک محصول ممکن است ظرف چند ساعت یا چند روز پس از نشانهای از تقاضای آتی تصمیمگیری شود [۱۸۰]. با این حال، ممکن است نیاز به تغییر کل استخدام در شرکت یا طراحی مجدد فرآیندها برای انطباق با دورههای طولانی تقاضاهای جدید وجود داشته باشد [۱۸۰]. یک شاخص تاخیری مرتبط با تغییر کارکنان کوتاهمدت (مثلاً تعداد کارگرانی که از آسیبهای مرتبط با خستگی رنج میبرند) میتواند به عنوان یک شاخص پیشرو برای نیاز به تغییرات سیستمی عمل کند [۱۸۰]. بنابراین اصطلاحات پیشرو و تاخیری هم به نوع و سطح (مثلاً محلی یا سیستمی) عمل کنترلی و هم به زمان اقدامات اعمال میشوند [۱۸۰].
سیستمهای مدیریت ریسک خستگی (Fatigue Risk Management Systems – FRMS): خستگی انسان امروزه به عنوان یکی از خطرات اصلی ایمنی در صنایع مختلف، به ویژه به دلیل توسعه عملیات ۲۴/۷، در نظر گرفته میشود [۱۸۲]. رویکرد سنتی برای جلوگیری از خستگی، از طریق مقررات محدودیت زمان پرواز و وظیفه (FTL) است [۱۸۲]. با این حال، علاوه بر سختی ذاتی مقررات از دیدگاه عملیاتی، این رویکرد اغلب نتوانسته ابعاد پیچیده خستگی را به طور کامل در نظر بگیرد [۱۸۲]. برای مقابله با این پیچیدگی، FRMS به تدریج در حال ظهور است [۱۸۲]. FRMS به جای تعیین محدودیتهای مطلق زمان وظیفه، هر عملیات را از نظر خطر خستگی ارزیابی میکند [۱۸۲]. FRMS را میتوان به عنوان راهی ملموس برای مهندسی تابآوری در نظر گرفت، زیرا سازمان را ملزم میکند تا با معرفی مجدد ایمنی مدیریتشده توسط انسان، علاوه بر ایمنی از طریق مقررات، عملکرد خود را تنظیم کند [۱۸۲، ۱۸۶].
چهار جزء اساسی یک سیستم مدیریت ایمنی (SMS) که توسط ICAO تعریف شده است [۱۹۱]، در ساختار FRMS نیز به کار گرفته شده است [۱۹۲، ۱۹۴]:
- سیاست و اهداف ایمنی: این جزء اساسی است، زیرا تمام زنجیرههای مسئولیت را در سازمان تعیین میکند، منابع لازم برای مدیریت FRMS را تخصیص میدهد و فرهنگ گزارشدهی عادلانه را تقویت میکند تا اطمینان حاصل شود که خدمه پرواز در گزارش هر موقعیتی که خستگی ممکن است نقش مهمی در آن ایفا کرده باشد، آزاد خواهند بود [۱۹۳].
- مدیریت ریسک خستگی: این جزء اصلی FRMS است [۱۹۴] و شامل مراحل زیر است [۱۹۵]:
- شناسایی عوامل خستگی: هر عاملی که پتانسیل ذاتی ایجاد خطر خستگی را دارد، به تنهایی یا در ترکیب با عوامل دیگر [۱۹۵]. دو دسته اصلی وجود دارد: عوامل خستگی مرتبط با ساعات کار (که بر خواب و ریتمهای شبانهروزی تأثیر میگذارند) و عوامل خستگی مرتبط با جنبههای متنی برنامه کاری (که بر بار کاری خدمه پرواز تأثیر میگذارند) [۱۹۵، ۱۹۶].
- ارزیابی ریسک خستگی: این مرحله احتمال رسیدن خدمه پرواز به سطح بیش از حد خستگی ناشی از ترکیب عوامل خستگی را در نظر میگیرد [۱۹۷]. مدلهای بیومدیکال خستگی میتوانند به طور مؤثر از ارزیابی ریسک خستگی حمایت کنند [۱۹۷]. این مدلها قادر به پیشبینی خطر خستگی مرتبط با الگوهای خاص ساعات کاری هستند [۱۹۷].
- ارزیابی ریسک ایمنی: این ارزیابی، احتمال وقوع یک رویداد ناخواسته (حادثه یا سانحه) ناشی از یک ریسک خستگی معین را در نظر میگیرد [۱۹۹]. این امر منجر به ایجاد یک ماتریس ریسک میشود که در آن خطرات اصلی شناسایی میشوند [۲۰۰].
- کاهش ریسک: هدف این مرحله، حذف یا کاهش ریسک به سطحی قابل قبول است (“as low as Reasonably Practicable” – ALARP) [۲۰۰]. استراتژی برتر، سطح حذف است که هدف آن حذف قرار گرفتن خدمه پرواز در معرض عوامل خستگی است (مثلاً در مرحله طراحی برنامه کاری) [۲۰۰]. اگر این قابل دستیابی نباشد، سطح کاهش در نظر گرفته میشود [۲۰۰]. و در نهایت، سطح آخر، زمانی که دو سطح قبلی به اندازه کافی برای حذف یا کاهش ریسک خستگی مؤثر نبودند، هدف این است که از تأثیرات منفی سطح بیش از حد خستگی بر ایمنی جلوگیری شود [۲۰۰].
- تضمین ایمنی: این جزء برای ارزیابی مستمر کارایی FRMS از طریق پایش شاخصهای مختلف طراحی شده است [۲۰۱]. دو دسته پایش پیشنهاد میشود: پایش سیستماتیک و پایش متمرکز [۲۰۱].
- پایش سیستماتیک: شامل جمعآوری و تحلیل دادههای ایمنی موجود، عمدتاً گزارشهای ایمنی هوایی (ASR) و پایش دادههای پرواز (FDM) است [۲۰۲]. ASRها گزارشهای کوتاهی هستند که توسط خلبان برای گزارش هر گونه رویداد ایمنی در طول پرواز نوشته میشوند و اجباری هستند [۲۰۲]. FDM یک فرآیند اجباری اروپایی برای هواپیماهای با وزن بیش از ۲۷ تن است که شامل جمعآوری، اندازهگیری و تحلیل دادههای پرواز دیجیتال میشود [۲۰۴]. مطالعات نشان دادهاند که ارتباط معنیداری بین وقوع برخی رویدادها و سطح خستگی خدمه پرواز وجود دارد [۲۰۵].
- پایش متمرکز: شامل دادههایی است که مستقیماً جنبههای مختلف تأثیر کار بر خواب، خستگی و تجربه شخصی خدمه پرواز را ارزیابی میکنند [۲۰۷]. این میتواند از طریق دو ابزار اصلی انجام شود: پیگیری در پرواز (جمعآوری دادههای خواب و خستگی) و نظرسنجیها [۲۰۷].
- ترویج ایمنی: دو هدف اصلی دارد: اطمینان از اینکه هر فرد در خطوط هوایی که در FRMS درگیر است، آموزش مناسب برای اجرا و مدیریت FRMS را دریافت کرده است؛ و اطمینان از اینکه هر فرد مرتبط در خطوط هوایی به طور دورهای از نتایج تولید شده توسط FRMS مطلع میشود [۲۱۲].
موردکاوی نگهداری نیروگاهها: “پینگینگ” (Pinging): در کارهای پیچیده و پرفشار مانند نگهداری نیروگاهها، حوادث کیفیت و ایمنی میتوانند رخ دهند و گاهی اوقات برای هر دو ارائهدهنده خدمات و مشتری بسیار پرهزینه باشند [۲۱۷]. بنابراین، انجام کار به طور مداوم و قابل پیشبینی با حوادث کم میتواند مهمترین عامل متمایز کننده در انتخاب ارائهدهنده خدمات باشد [۲۱۸]. اصول مهندسی تابآوری را میتوان برای طراحی یک استراتژی گسترده و پیشگیرانه برای شناسایی موقعیتهای بحرانی و ورود به اقدامات متفاوت قبل از وقوع موقعیتهای پرهزینه به کار برد [۲۱۸].
یکی از راههای بهبود “شناسایی” (noticing) موقعیتهای بحرانی، اجرای فرآیند “پینگینگ” بود [۹۲]. پینگینگ عبارت است از کاوش فعال برای تغییرات در پروفایل ریسک [۹۲]. از طریق کارگاههای آموزشی با مدیران پروژه باتجربه و کارکنان پشتیبانی عملیاتی، نشانههایی که نشان میدادند یک قطعی ممکن است به وضعیت خارج از کنترل یا تغییر در پروفایل ریسک نزدیک شود، فرضیهسازی شد [۹۲، ۲۲۸]. برخی از این عوامل خطر بالقوه و شاخصهای تغییر پروفایل ریسک عبارتند از [۹۲، ۲۲۹]:
- مسائل متعدد که توجه خدمه را جلب میکنند.
- توقف پیشرفت، تأثیرات برنامهریزی، تأخیرهای متعدد.
- تغییر خلق و خوی مدیر پروژه.
- پرسنل متخصص بیش از حد انتظار در سایت حضور دارند.
- ناگهان نیاز به افراد بیشتری پیدا میشود.
- جابجایی متعدد پرسنل.
- مقدار بالاتر از حد معمول کار اضطراری.
- حوادث متعدد ایمنی و کیفیت، حتی اگر جزئی باشند.
- افزایش خطاها.
- کارهای رایج که انجام نمیشوند یا دیر انجام میشوند (مانند دریافت مجوزها).
- وضعیت خاصی با پتانسیل تغییر خلق و خوی کارگران (کار در طول کریسمس) یا سطح ریسک (آب و هوا: طوفان، گرمای شدید یا سرما، برف، باد، یخ، طوفانهای سهمگین) در سایت.
- کاهش ارتباطات، مانند تماسهای بیپاسخ یا ایمیلها.
- طولانی شدن قطعی که در آن پتانسیل سطح خستگی بالاتر است.
- نظم و نظافت سایت کاهش یافته یا متوقف شده است.
این “اقلیمهای احتمالی خطا” (error likely ‘climates’) عبارتند از [۲۳۱، ۲۳۲]:
- رهبرانی که از رویکرد “بالا به پایین” یا سبک تهدیدآمیز استفاده میکردند.
- رهبرانی که به نگرانیهای دیگران در سایت گوش نمیدادند و سوال پرسیدن را تشویق نمیکردند.
- رهبرانی که درگیر کار نبودند.
- سایتی که نقشها/مسئولیتهای ساختار قطعی در آن نامشخص بود.
- رقابت شیفت روز و شب.
- تیم کار نمیکرد.
- مشتری که مستقیماً در محدوده کاری خدمات میدانی دخالت میکرد.
- رهبرانی که با رویهها و فرهنگهای فعلی (کارکنان قراردادی) آشنا نبودند.
- رهبرانی که برای کمک آماده نبودند.
شناسایی اینکه این اقلیمها ممکن است در کجا وجود داشته باشند و درک پیامدهای جدی بالقوه، اولین گام در کاهش یا حذف پتانسیل وجود این اقلیمها در طول قطعیها بود [۲۳۳]. اقدامات پیشنهادی شامل تماس با مدیر منطقه خدمات یا درخواست یک متخصص آموزشدیده در مدیریت ریسک، ابزارهای عملکرد انسانی و مقابله با موقعیتهای احتمالی خطا برای بازدید از سایت و کمک به وضعیت بود [۲۳۳].
بخش سوم: تابآوری و توانایی پیشبینی (مقابله با وضعیت بالقوه) (تقریباً ۴۵ دقیقه)
توانایی پیشبینی و تطبیق در سراسر بحثهای تابآوری و در این کتاب جریان دارد [۱۲۰، ۱۲۱]. در همه سطوح یک سیستم مهم است که اکنون به گونهای عمل کنیم که کنترل را در برابر موانعی که سیستم با آنها روبرو خواهد شد یا میتواند روبرو شود، حفظ کنیم [۱۲۱، ۲۷۰]. برای تابآور بودن، یک سیستم همیشه مراقب است که آیا ظرفیت انطباقی آن، با پیکربندی و عملکرد فعلی، برای پاسخگویی به خواستههایی که در آینده با آن روبرو خواهد شد، کافی است یا خیر [۷۶، ۱۲۱، ۲۷۰]. از دست دادن یا نادیده گرفتن نشانههایی که ظرفیت انطباقی در حال تخریب است، سیستم را در برابر فروپاشی یا شکستهای ناگهانی آسیبپذیر میکند [۲۷۰].
منابع، چندین الگوی اصلی در نحوه پیشبینی سیستمهای تابآور را شناسایی میکنند [۲۷۰، ۲۷۸]:
- سیستمهای تابآور قادرند تخریب ظرفیت انطباقی را تشخیص دهند. این بدان معناست که سیستمها میتوانند نشانههایی را ببینند که ظرفیتشان برای مقابله با اختلالات و چالشها در حال کاهش است [۲۷۱].
- سیستمهای تابآور قادرند خطر تمام شدن ذخایر یا بافرها را تشخیص دهند. این مفهوم به “going solid” اشاره دارد، یعنی زمانی که سیستمها تمام منابع در دسترس خود را متعهد کردهاند و بنابراین نمیتوانند به طور موثر به رویداد یا اختلال بعدی پاسخ دهند [۲۷۲]. حفظ ذخایر و “حاشیههای مانور” (margins of manoeuvre) بسیار مهم است [۲۷۳].
- سیستمهای تابآور قادرند تشخیص دهند که چه زمانی باید اولویتها را در بین مصالحههای هدف تغییر دهند. مطالعات سیستمهای انطباقی پیچیده نشان دادهاند که مصالحهها بنیادی و گریزناپذیر هستند – بهینهسازی-شکنندگی (optimality-brittleness)، کارایی-کامل بودن (efficiency-thoroughness)، حاد-مزمن (acute-chronic) [۸۰، ۱۲۷، ۲۷۴]. بنابراین، سیستمها در فضای تعریفشده توسط این مصالحهها وجود دارند [۲۷۴]. یک سیستم باید بداند که در این فضای مصالحه کجا قرار گرفته است، آیا این موقعیت برای زمینه مناسب است، و آیا میتواند موقعیت خود را در فضای مصالحه تغییر دهد تا به منطقه بهتری حرکت کند [۲۷۴].
- سیستمهای تابآور قادرند تغییرات دیدگاه ایجاد کنند و دیدگاههای مختلفی را که فراتر از موقعیت اسمی سیستم آنهاست، مقایسه کنند. این جنبه در قضاوت در مورد زمان ایجاد اختلال در فرآیندهای بسیار وابسته به هم که سازمانهای مختلف را در بر میگیرد، ضروری است [۲۷۵]. “مقایسه دیدگاه” (Perspective contrast) برای سنتز نحوه شکست سیستمهای انطباقی حیاتی است [۲۷۵].
- سیستمهای تابآور قادرند وابستگیهای متقابل را در سراسر نقشها، فعالیتها و سطوح مدیریت کنند. این جنبه از پیشبینی در مقیاس نهادهای مالی و نهادهای نظارتی به وضوح نشان داده شده است [۱۷۱، ۲۷۶]. بدون توانایی انجام این شکل از پیشبینی، سیستمها در معرض خطر الگوی اختلال انطباقی “کار در جهت اهداف متقابل” (working at cross-purposes) یا “تطبیق محلی اما بدسازگاری جهانی” (locally adaptive but globally maladaptive) قرار میگیرند [۲۷۶].
- سیستمهای تابآور قادرند نیاز به یادگیری روشهای جدید برای تطبیق را تشخیص دهند. این به ما یادآوری میکند که تابآوری در نهایت به چگونگی یادگیری سیستمها مربوط میشود [۲۷۷، ۴۰۰]. سخت است که عقبنشینی کنیم و در مورد چگونگی کار سیستم که خود بخشی از آن هستیم در یک محیط متغیر، به هم پیوسته و وابسته به هم تأمل کنیم، نقاط ضعف را شناسایی کنیم و شروع به توسعه روشهای جدید برای کار کنیم [۲۷۷]. در نهایت، تابآوری به این مربوط میشود که چگونه سیستمها یاد میگیرند ظرفیتهای انطباقی خود را تعدیل کنند تا تناسب خود را نسبت به محیطی از فشارهای متغیر و فرصتها به طور مداوم بهروز کنند [۲۷۷].
الگوهای اساسی شکست سیستمهای انطباقی: این فصل یک ورودی به استراتژیهای مدیریت تابآوری را در قالب سه الگوی اساسی از نحوه شکست سیستمهای انطباقی ارائه میدهد [۲۷۹، ۲۸۳]:
- برگرداندن از وضعیت جبرانی (Decompensation) – زمانی که سیستم ظرفیت خود را برای تطبیق با رویدادها/چالشها از دست میدهد و آنها به صورت زنجیرهای اتفاق میافتند [۲۷۹]. در این الگو، شکست زمانی رخ میدهد که چالشها سریعتر از آنکه بتوان پاسخها را تصمیمگیری و اجرا کرد، رشد کرده و به صورت زنجیرهای اتفاق میافتند [۲۸۴]. در فاز اول، بخشی از سیستم برای جبران یک اختلال در حال رشد، تطبیق مییابد [۲۸۵]. این کنترل جبرانی که در ابتدا تا حدی موفق است، حضور و توسعه اختلال زیربنایی را پنهان میکند [۲۸۵]. فاز دوم یک رویداد برگرداندن از وضعیت جبرانی رخ میدهد زیرا پاسخ خودکار نمیتواند اختلال را به طور کامل یا برای همیشه جبران کند [۲۸۵]. پس از تمام شدن ظرفیت مکانیسم پاسخ، پارامتر کنترلشده به طور ناگهانی فرو میریزد [۲۸۵]. اطلاعات حیاتی، علائم غیرعادی فرآیند به خودی خود نیستند، بلکه نیروی فزایندهای است که باید در برابر آنها مقاومت کرد، نسبت به قابلیتهای سیستمهای کنترل پایه [۲۸۶]. این بدان معناست که چقدر سخت سیستمهای کنترل برای حفظ کنترل کار میکنند و روند این کار چگونه است [۲۸۶].
- مثال از آتشنشانی شهری: در عملیات آتشنشانی، فرمانده حادثه (IC) به طور مداوم و صحیح پیشرفت را از نظر اینکه آتش در کنترل است یا خارج از کنترل، ارزیابی میکند [۲۹۷]. فرماندهان حادثه به طور خاص مراقبند تا از خطر عقب افتادن با مصرف تمام ظرفیت سیستم برای پاسخگویی به خواستههای فوری و همچنین خواستههای جدید جلوگیری کنند [۲۹۸]. “سیگنال همه دستها” (all-hands signal) به معنای تشخیص این است که وضعیت ناپایدار است زیرا نزدیک به حداکثر ظرفیت خود قرار گرفته است و بنابراین عملیات فعلی در برابر هر گونه خواسته اضافی که ممکن است رخ دهد، آسیبپذیر است [۲۹۸]. یک وظیفه حیاتی IC، تنظیم ظرفیت انطباقی با فراهم کردن “ذخایر تاکتیکی” (tactical reserves) است [۲۹۸].
- کار در جهت اهداف متقابل (Working at Cross-purposes) – زمانی که نقشها رفتاری را نشان میدهند که به صورت محلی سازگار است، اما به صورت جهانی بدسازگار است [۲۷۹]. این به عدم توانایی در هماهنگی گروههای مختلف در سطوح مختلف در تضاد اهداف اشاره دارد [۲۸۷]. در نتیجه ناهماهنگی، گروهها در جهت اهداف متقابل کار میکنند [۲۸۷]. هر گروه سخت کار میکند تا به اهداف محلی تعریف شده برای حوزه مسئولیت خود دست یابد، اما این فعالیتها دستیابی به مسئولیتهای نقشهای دیگر را برای گروههای دیگر دشوارتر میکند یا اهداف جهانی یا بلندمدت را که همه گروهها تا حدی آنها را میشناسند، تضعیف میکند [۲۸۷].
- کهنالگوی آن “تراژدی منابع مشترک” (tragedy of the commons) است [۲۸۸]. این مفهوم به دینامیک انطباقی پایهای اشاره دارد که در آن بازیگران، با عمل منطقی در کوتاهمدت برای کسب بازده در یک محیط رقابتی، منبع مشترکی را که در بلندمدت به آن وابسته هستند، از بین میبرند [۲۸۸].
- مثال از آتشنشانی شهری: آتشنشانی نمونهای از موقعیتهایی است که در آن وظایف و نقشها به شدت توزیع شده و وابسته به یکدیگر هستند و سیستمهای کاری را در معرض دشواری حفظ همگامسازی در عین فراهم کردن انعطافپذیری برای پاسخگویی به خواستههای همیشه در حال تغییر قرار میدهد [۲۹۹]. موارد متعددی گزارش شده است که در آن شرکتها خطوط شلنگ را باز کرده و آتش و گرما را به سمت دیگران سوق دادهاند [۲۹۹]. این موقعیتها معمولاً ناشی از تطبیق برنامه شرکتها به دلیل مشکلات یا فرصتها بود [۲۹۹]. اگر تغییر در فعالیت یک گروه توسط یک همگامسازی مجدد موفق دنبال نمیشد، شرایطی را برای یک ناهماهنگی ایجاد میکرد که در آن شرکتها (و مهمتر از آن، IC) به طور موقت موقعیت و اقدامات یکدیگر را از دست میدادند [۲۹۹]. این امر به ویژه زمانی که گروهها برای مقابله با شرایطی که با آن روبرو هستند، به گونهای سازگار میشوند که ناخواسته تهدیداتی را برای گروههای دیگر ایجاد یا تشدید میکنند، خطرناک است [۲۹۹].
- تضاد اهداف زمانی پیش میآید که بین دستیابی به سه هدف اساسی آتشنشانی شهری – نجات جان، محافظت از اموال و اطمینان از ایمنی پرسنل – مصالحه وجود داشته باشد [۳۰۰]. مثلاً، در شرایط منابع محدود، نیاز به نجات یک آتشنشان در معرض خطر، تضاد هدف دشواری را بین عملیات نجات و آتشنشانی ایجاد میکند [۳۰۰].
- گیر افتادن در رفتارهای قدیمی (Getting Stuck in Outdated Behaviours) – زمانی که سیستم بیش از حد به موفقیتهای گذشته تکیه میکند [۲۷۹]. این الگو نشاندهنده شکست در بازنگری مفروضات و برنامهها در مواجهه با شواهد متناقض یا تغییر شرایط است [۲۹۱].
- مثال از آتشنشانی شهری: در آتشنشانی شهری، که با عدم قطعیت بالا و نیاز به تصمیمگیری سریع مشخص میشود، بازنگری برنامهها یک فرآیند حیاتی است [۳۰۱]. ضروری است که تطبیق با برنامه زمانی انجام شود که عناصر موقعیت نشان میدهد دانش قبلی (که استراتژی و تاکتیکهای در حال اجرا بر آن بنا شدهاند) قدیمی شده است [۳۰۱]. توانایی تطبیق به شدت به توانایی ارزیابی صحیح وضعیت در طول عملیات بستگی دارد [۳۰۱]. پروندههای حوادث نشان میدهد که توانایی IC برای نظارت مؤثر بر عملیات و اصلاح برنامه در حال اجرا به شدت مختل میشود زمانی که این شخص اطلاعات محدود و درک محدودی از وضعیت موجود و سطح کنترل آتش دارد [۳۰۱].
اهمیت تضاد دیدگاهها (Perspective Contrasts): درک اینکه چه چیزی بدسازگار است، به دیدگاه بستگی دارد [۳۰۳].
- اولاً، تصمیمگیری انطباقی نشاندهنده عقلانیت محلی (اگرچه محدود) است [۳۰۴]. یک سیستم انطباقی انسانی از دانش و اطلاعات موجود در میدان دید/کانون توجه خود برای تطبیق رفتار خود (با توجه به محدوده خودمختاری/اختیارات خود) در جهت اهدافش استفاده میکند [۳۰۴].
- ثانیاً، تصمیمگیری انطباقی در یک وبِ همتطبیقی وجود دارد که در آن رفتار انطباقی توسط سایر سیستمها به صورت افقی یا عمودی (در سطوح مختلف) بر رفتار سیستم مورد نظر تأثیر میگذارد (آزاد میکند یا محدود میکند) [۳۰۴]. رفتاری که برای یک واحد یا سیستم انطباقی است، میتواند محدودیتهایی را ایجاد کند که منجر به رفتار بدسازگار در سایر سیستمها شود، یا میتواند ترکیب شود تا رفتارهای نوظهوری را ایجاد کند که نسبت به معیارهای تعریف شده توسط دیدگاهی متفاوت، بدسازگار هستند [۳۰۴].
کار در جهت اهداف متقابل زمانی اتفاق میافتد که سیستمهای وابسته به یکدیگر کارهایی را انجام میدهند که همگی به صورت محلی سازگار هستند (نسبت به نقش/اهداف تعیین شده/تحت فشار برای هر واحد)، اما به صورت جهانی بدسازگار هستند (نسبت به دیدگاهها و اهداف گستردهتر) [۳۰۵]. این میتواند به صورت افقی در بین واحدهای کاری در یک سطح رخ دهد [۳۰۵]. همچنین میتواند به صورت عمودی (بالا به پایین یا پایین به بالا) اتفاق بیفتد، جایی که انطباق محلی در نوک پیکان یک سیستم در صورت بررسی از دیدگاه منطقهای گستردهتر که اهداف سطح بالاتر یا کل سیستم را در بر میگیرد، بدسازگار است [۳۰۵].
بخش چهارم: تابآوری و توانایی یادگیری (مقابله با وضعیت واقعی) (تقریباً ۴۵ دقیقه)
آخرین توانایی از چهار قابلیت اصلی تابآوری – چهارمین سنگ بنا – توانایی یادگیری از گذشته است [۱۹۳]. این توانایی به همان اندازه توانایی پاسخگویی، پایش و پیشبینی اهمیت دارد [۱۹۳].
شرایط یادگیری: برای اینکه یادگیری اتفاق بیفتد، سه شرط باید برآورده شود [۱۹۶]:
- فرصتهای معقولی برای یادگیری وجود داشته باشد: یعنی موقعیتهایی که میتوان از آنها چیزی آموخت، با فرکانس کافی رخ دهند [۱۹۶].
- موقعیتها به اندازه کافی مشابه باشند: تا بتوان تعمیم داد؛ یعنی باید چیزی مشترک یا قابل مقایسه در موقعیتها وجود داشته باشد [۱۹۶].
- فرصت کافی برای تأیید درسهای آموخته شده وجود داشته باشد: این را میتوان نوعی ترکیب از دو شرط اول دانست، به این معنا که یک رویداد قابل مقایسه باید قبل از فراموش شدن درسها – و ترجیحاً مدتها قبل از نیاز به استفاده از درسها در یک رویداد واقعی – اتفاق بیفتد [۱۹۶].
از این استدلالها نتیجه میشود که یادگیری میتواند مؤثرتر باشد اگر بر اساس رویدادها یا شرایطی باشد که مکرراً اتفاق میافتند و – تقریباً به دلیل همین واقعیت – کمتر شدید و کمتر متفاوت هستند [۱۹۷]. در واقع، یادگیری از “آنچه درست پیش میرود” مؤثرتر از یادگیری از “آنچه اشتباه پیش میرود” است [۱۹۷]. دلیل این امر آن است که اولی بسیار بیشتر از دومی اتفاق میافتد [۱۹۷]. این موضع همچنین با اصل اساسی مهندسی تابآوری سازگار است که شکستها روی دیگر موفقیتها هستند و هر دو از تغییرپذیری عملکرد در سطوح فردی و سیستمی نشأت میگیرند [۱۹۷].
تأثیر یادگیری: چهار قابلیت اصلی تابآوری به یک اندازه ضروری و مهم هستند [۱۹۸]. اگر یادگیری را نقطه شروع قرار دهیم، به راحتی میتوان استدلال کرد که توانایی پاسخگویی بدون توانایی یادگیری ارزش کمی خواهد داشت [۱۹۸]. یک سیستم نمیتواند به طور مؤثر به رویدادهای غیرمنتظره پاسخ دهد مگر اینکه راههای جدیدی برای پاسخگویی بیاموزد [۱۹۸].
- ارتباط با پایش: انتخاب شاخصها برای پایش میتواند بر اساس مدلهای رسمی یا پیشینی باشد، اما همانطور که در فصل ۵ استدلال شد، “یافتن مدلهای صریح که مبنای رسمی برای شناسایی معیارها را فراهم کنند، نادر است” [۱۹۹]. عمدتاً از طریق یادگیری در عمل است که مبنای مناسب برای پایش – یعنی شاخصهایی که باید پایش شوند – میتواند ایجاد شود [۱۹۹].
- ارتباط با پیشبینی: یادگیری برای پیشبینی نیز ضروری است [۲۰۰]. همانطور که فصل ۹ اشاره میکند، یکی از الگوهای پیشبینی این است که “سیستمهای تابآور قادرند نیاز به یادگیری راههای جدید برای تطبیق را تشخیص دهند” [۲۰۰]. در رابطه با پیشبینی، یادگیری برای تولید یک مدل واقعی، یا حتی کافی، یا درک آنچه ممکن است در آینده اتفاق بیفتد، ضروری است [۲۰۰].
چه چیزی باید آموخته شود؟ یادگیری یک عملکرد مکانیکی نیست و نمیتواند به جمعآوری دادهها یا آمار محدود شود [۲۰۱]. برای هر استفاده از یادگیری، یادگیری “مورد صحیح” حیاتی است [۲۰۱]. در رابطه با ایمنی، اغلب اشاره میشود که کامل بودن در یادگیری مهم است [۲۰۱]. با توجه به اینکه یادگیری به طور سنتی بر اساس چیزهایی است که اشتباه پیش رفتهاند، یک توصیه این بوده است که به دنبال “داستانهای دوم” (second stories) زیر سطح بگردیم [۲۰۱، ۴۰۱]. برخلاف جستجوی سنتی برای “ریشههای علل” (root causes)، این به معنای بازگشت به عقب تا حد امکان نیست، بلکه به معنای در نظر گرفتن توضیحات جایگزین احتمالی است [۴۰۱]. توصیه دیگر با عبارت “آنچه به دنبالش هستید، همان چیزی است که پیدا میکنید” (What-You-Look-For-Is-What-You-Find – WYLFIWYF) [۲۰۱، ۴۰۱] بیان شده است. اصل WYLFIWYF به این معناست که توضیحات حوادث به شدت تحت تأثیر مفروضات مربوط به نحوه تعامل عوامل مختلف قرار میگیرند [۴۰۱].
شفافیت واقعی سیستم: فصل ۱۵ بر اهمیت آشکار عملکرد واقعی سیستم (جایی که رویدادها رخ دادهاند) تأکید میکند [۲۰۲، ۴۰۶]. این بدان معناست که جمعآوری شواهد در مورد چگونگی عملکرد سیستم، فراتر از جستجوی علل مستقیم، مهم است [۲۰۲، ۴۰۶]. در مواردی که اشتباهی رخ داده است (حوادث) یا ممکن است رخ دهد (ارزیابی ریسک)، این کار نسبتاً ساده است و اغلب به عنوان یک فرآیند نهادینه شده انجام میشود [۲۰۲].
موردکاوی سقوط هواپیمای الال و سیستم ERTMS: در ۴ اکتبر ۱۹۹۲، یک هواپیمای بویینگ ۷۴۷ باربری الال در یک بلوک آپارتمانی در آمستردام سقوط کرد و ۴ نفر در هواپیما و ۴۳ نفر روی زمین کشته شدند [۲۰۹]. در طول تحقیقات، علت مستقیم حادثه نقص طراحی در ستون موتور تشخیص داده شد [۲۰۹]. با این حال، پیامدهای این سقوط بسیار فراتر از علل مستقیم و درسهای فنی کوتاهمدت بود [۲۰۹]. این فاجعه تأثیرات گستردهای بر ارزیابی ایمنی هواپیماهای باربری کامل، ایجاد یک آژانس مستقل تحقیق در مورد حوادث چند حالته در هلند، درک عمومی از ریسک در رابطه با ایمنی خارجی و تغییر تمرکز به مقابله با پیامدهای فاجعه و نقش حاکمیت عمومی در تصمیمگیریهای سیاست بحران داشت [۲۱۰].
در مورد سیستم سیگنالینگ ERTMS (سیستم مدیریت ترافیک ریلی اروپا)، تحقیقات نشان داد که چندین “ویژگی نوظهور” (emergent properties) در پایان فاز طراحی و توسعه ظاهر شدند که نیاز به مداخلات طراحی اضافی و راهحلهای عملیاتی داشتند [۲۱۱]. این شامل پیچیدگی محیط نهادی، عدم وجود نقش برای یک “یکپارچهساز سیستم” (systems integrator)، و دستکم گرفتن توسعه فناوری ERTMS بود [۲۱۱]. این موارد نشاندهنده نیاز به شفافیت و درک عمیقتر از تعاملات سیستم و نه فقط مؤلفههای آن است [۲۱۱].
مکانیسمهای هماهنگی: فصل ۱۶ بر اهمیت مطالعه مکانیسمهای هماهنگی برای درک تابآوری سیستمهای اجتماعی-فنی تأکید میکند [۲۰۳، ۴۰۳]. این استدلال برای گسترش مطالعه فراتر از حوادث و شکستها است [۴۰۳]. چگونگی هماهنگی بخشهای مختلف یک سازمان (مانند سیستم مراقبتهای بهداشتی) در فعالیتهای خود و به ویژه چگونگی تطبیق پزشکان با رویدادهای غیرمنتظره با استفاده از مکانیسمهای هماهنگی نوظهور، به راحتی در مواردی قابل مشاهده است که هماهنگی موفقیتآمیز است و در نتیجه هیچ اشتباهی رخ نمیدهد [۴۰۳]. هماهنگی یک “عملکرد” است و نه یک “شکست”، اما عملکردی است که میتواند و باید برای مطابقت با شرایط کاری تغییر کند [۴۰۳].
در سیستمهای اجتماعی-فنی، عملکرد کلی مستلزم هماهنگی اقدامات و تصمیمات عوامل مختلف درگیر در وظیفه است [۲۱۹، ۴۳۶]. تابآوری در چنین سیستمهایی بیشتر به دینامیک تعاملات بین عوامل وابسته است تا توانایی هر فرد یا زیرمجموعه برای تطبیق [۲۲۰، ۴۳۸]. این دینامیک تعاملات است که به چنین سیستمی اجازه میدهد تا با رویدادهای غیرمنتظره، تغییرات نامنظم یا بحرانها با موفقیت (یا عدم موفقیت) مقابله کند [۲۲۰، ۴۳۸].
موردکاوی هماهنگی در بیمارستان: یک موردکاوی از یک بیمارستان نشان میدهد که چگونه عدم ارتباط بین دو بیمارستان در یک منطقه شهری و عدم استفاده از الگوریتمهای هماهنگی، منجر به ناهماهنگی در درمان یک بیمار آسمی شد و در نهایت به مرگ او انجامید [۲۲۶، ۲۲۷، ۲۲۸، ۲۲۹]. این مورد نشان میدهد که هرچند تصمیمات و اقدامات هر فرد به تنهایی منطقی به نظر میرسید، اما عدم یکپارچگی این تصمیمات و اقدامات در زمان و مکان و بین عوامل مختلف (پزشکان، پرستاران، پذیرش) منجر به شکست کلی شد [۲۲۹، ۴۴۹].
“نزدیکبینی” (Myopia) در هماهنگی: مطالعات نشان میدهند که کنترل توزیعشده میتواند منجر به نوعی “نزدیکبینی” شود [۲۳۳، ۴۵۳]. وقتی ناظر مرکزی وجود ندارد که نمایش کلی از عملیات را داشته باشد، گروهی از رباتها میتوانند در تلهای که مربوط به “حداقل محلی” (local minimum) است، بیفتند [۲۳۳، ۴۵۳]. در موردکاوی بیمارستان، هر عامل به نظر میرسد که بر درک فعلی خود از وضعیت بر اساس تعاملات محلی و زمان واقعی خود با بیمار اولویت میدهد و فرآیند استدلال را به جای ادامه دادن، دوباره شروع میکند و در تله “نزدیکبینی” میافتد [۲۳۳، ۴۵۳].
سیستمهای گزارشدهی حوادث (Incident Reporting Systems): این سیستمها اغلب به عنوان پیشنیازی برای مهندسی تابآوری مؤثر در نظر گرفته میشوند [۲۳۷، ۴۵۷]. اما گاهی اوقات در دستیابی به بیشتر مزایای مورد انتظار شکست میخورند [۲۳۷]. تحقیق فزایندهای وجود دارد که از گزارشدهی حوادث به دلیل عدم توانایی آن در ارائه یک نمایش دقیق از آسیب در مقایسه با سایر روشها، و همچنین این واقعیت که هنوز هم گزارشدهی حوادث به طور گستردهای کمتر از حد واقعی است، انتقاد میکند [۲۳۷، ۴۵۷]. مشکلات گزارشدهی حوادث، حداقل تا حدی، در ویژگیهای ساختاری حوزههای مربوطه یافت میشود، نه در اصل گزارشدهی حوادث یا اجرای آن [۲۳۷، ۴۵۷].
ASRS (سیستم گزارشدهی ایمنی هوانوردی) که توسط FAA و NASA در سال ۱۹۷۵ تأسیس شد، اغلب به عنوان بهترین روش در گزارشدهی حوادث شناخته میشود [۲۳۸، ۴۵۹]. موفقیت ASRS به چندین ویژگی ساختاری دامنه هوانوردی بازمیگردد [۲۴۴، ۲۴۵، ۲۴۶]:
- معیار عبور (Pass Criterion): در حوزه هوانوردی، تمایز واضحی بین یک حادثه و یک رویداد بیربط وجود دارد [۲۴۴، ۴۶۵].
- درجه استانداردسازی: عملیات هوانوردی به شدت استاندارد شدهاند [۲۴۶، ۴۶۷]. این بدان معناست که عوامل متنی اغلب میتوانند ضمنی در نظر گرفته شوند و برای بازسازی یک رویداد، فقط رویدادها و اقدامات اصلی لازم هستند [۲۴۶، ۴۶۷].
- قابلیت مشاهده (Visibility): آیا اپراتورها در موقعیت خوبی برای مشاهده رویدادهایی هستند که مایل به جمعآوری آنها هستیم؟ [۲۴۷، ۴۸۱]. قابلیت مشاهده تحت تأثیر عواملی مانند طراحی فرآیندهای سازمانی، موقعیت و نقش کارکنان خط مقدم، مدت و وسعت فرآیندها، و ماهیت محتوای واقعی کار قرار میگیرد [۲۴۷، ۴۸۲].
- درک ویژگیهای جامعه شما: در دنیای هوانوردی، نقشها و جوامع حرفهای به خوبی تعریف شدهاند [۲۴۵، ۴۶۶]. این بدان معناست که ASRS میتواند یک تیم کامل از کارشناسان را برای نمایندگی تمام دیدگاههای مختلف جمعآوری کند [۲۴۵].
- ارزیابی فرهنگ ایمنی: سطح فرهنگ ایمنی نیز بر ابعاد زیادی تأثیر میگذارد، از جمله حفاظت از گزارشدهندگان، میزان آموزش در مورد ایمنی (آگاهی از مسائل ایمنی)، توانایی درک علل حوادث [۲۵۰، ۴۸۶].
مقایسه با NHS (سیستم گزارشدهی و یادگیری ملی) در مراقبتهای بهداشتی: NRLS به عنوان یک سیستم ناشناس برای تشویق گزارشدهی و ارائه تصویری نمایندگی بیشتر از میزان آسیب در NHS راهاندازی شد [۲۴۲، ۴۶۹]. با این حال، NRLS موفقیتآمیز نبوده است [۲۴۳، ۴۷۰]. دلایل این امر عبارتند از [۲۴۳، ۲۴۴، ۲۴۵]:
- بخش عمدهای از موقعیتهایی که خطر ایجاد میکنند، گزارش نمیشوند زیرا توسط کارگران به عنوان حوادث قابل گزارش شناسایی نمیشوند [۲۴۳].
- NRLS گزارشدهی ناشناس را پذیرفت و شناسایی عوامل مؤثر را به یک طبقهبندی در سیستم گزارشدهی منتقل کرد تا توسط گزارشدهنده پر شود، نه توسط تحلیلگر [۲۴۴]. برای بسیاری از رویدادها در مراقبتهای بهداشتی، مسیر مربوط به بیمار ممکن است چندین شیفت یا حتی روزها و هفتهها طول بکشد و اغلب گزارشدهنده در موقعیتی نیست که بتواند عوامل مؤثر را بدون یک تحقیق کامل، که وظیفهای نامناسب برای گزارشدهنده است، به طور کافی توصیف کند [۲۴۴].
- تخصصی شدن حوزه مراقبتهای بهداشتی، حفظ یک بدنه از محققان برای تحلیل مرکزی همه گزارشها را دشوار میکند [۲۴۵].
- برخلاف دنیای هوانوردی، دنیای مراقبتهای بهداشتی بسیار کمتر یکنواخت و استاندارد شده است [۲۴۶].
پایش پیشگیرانه ریسک: این رویکرد، پایش مستقیم “نیروهای محرک” پشت رویدادهای نامطلوب را پیشنهاد میکند [۲۵۲، ۴۸۹]. در این رویکرد، به جای تمرکز بر رویدادها به عنوان محرک، بر عوامل ایجاد کننده ریسک تمرکز میشود [۲۵۳]. این بدان معناست که به جای تمرکز بر فرآیندهای سازمانی که منجر به شرایط نهفته میشوند، هدف یک سیستم پایش ریسک، پایش تغییرات در فعالیتها و فرآیندها یا به طور کلیتر، میزان توانایی یک سازمان و کارکنان در پیشبینی، شناسایی و تطبیق با تغییرات و اختلالات است [۲۵۳، ۴۹۱].
نقش فرهنگ در مهندسی تابآوری: مطالعهای با عنوان “آیا صنعت هوانوردی برای تابآوری آماده است؟ ترسیم مفروضات عوامل انسانی در سراسر بخش هوانوردی” (Is the Aviation Industry Ready for Resilience? Mapping Human Factors Assumptions across the Aviation Sector) [۲۵۷] نشان میدهد که تفاوتهایی در دیدگاههای ایمنی، سنتی و تابآور، در سراسر صنعت هوانوردی وجود دارد [۲۵۷]. این تفاوتها بر اساس فرهنگ ملی و شغل پاسخدهنده متغیر است [۲۵۷، ۲۶۳]. این مطالعه همچنین نشان داد که غیرمتخصصان در عوامل انسانی (HF)، ارگونومی یا ایمنی ممکن است ناآگاهانه و بدون تبعیض از ایدههای HF از مدلها یا الگوهای ایمنی مختلف (گاهی متناقض) استفاده کنند [۲۵۷، ۲۶۰].
این یافتهها به پژوهشگران مهندسی تابآوری و مدیران ایمنی کمک میکند تا دیدگاه دستاندرکارانی را که از ابزارها و مدلهای آنها استفاده میکنند، بهتر درک کنند [۲۵۸]. مفروضات و باورها الگوی ایمنی را شکل میدهند که به نوبه خود، مبنایی برای اقدام ایمنی از طریق مدلها، ابزارها و غیره ایجاد میکند [۲۶۰]. اینکه “آیا تابآوری برای صنعت هوانوردی آماده است؟” یک سوال کلیدی است [۲۷۳، ۵۲۸]. پاسخ تا حدی در خود سوال نهفته است: آیا تابآوری برای صنعت هوانوردی آماده است؟ [۵۲۸]
نکات کلیدی این بخش:
- پژوهشگران HF و رهبران ایمنی باید جامعه هدف خود را در نظر بگیرند، زیرا نتایج نظرسنجی تفاوتهایی را در دیدگاهها بر اساس فرهنگ ملی و شغل نشان داد [۲۵۸، ۵۲۹].
- کارشناسان هوانوردی در این مطالعه به “دیدگاه سنتی ایمنی” (traditional safety Perspective) وفادار نبودند – در واقع، آنها ممکن است به مسائل HF و ایمنی با یک دیدگاه منسجم، مانند متخصصان HF، فکر نکنند [۲۵۹، ۵۲۹]. این هم یک مشکل و هم یک فرصت برای مدافعان تابآوری است: متقاعد کردن مردم به منطقی بودن تابآوری ممکن است آسان باشد، اما آنها لزوماً آن را به طور منسجم یا انحصاری به کار نخواهند برد [۵۲۹].
- تغییرات در دیدگاهها که در این مطالعه شناسایی شد، همچنین به رفع این باور غلط کمک میکند که هوانوردی یک حوزه صرفاً فنی است که در آن استانداردسازی، تمام تغییرات در نحوه انجام کار را از بین برده است [۲۵۹، ۵۳۰]. سهم انسانی حیاتی است، زیرا همیشه جایی برای تفسیر وجود دارد، مهم نیست که چقدر استاندارد شده و تنظیم شود [۵۳۰].
نتیجهگیری (تقریباً ۱۰ دقیقه)
ما امروز سفری عمیق را در دنیای “مهندسی تابآوری” آغاز کردیم و دیدیم که ایمنی تنها به معنای جلوگیری از “آنچه اشتباه میرود” نیست، بلکه به معنای توانایی موفقیت و رشد در مواجهه با پیچیدگیها، تغییرات و عدم قطعیتهاست [۵۴، ۶۶]. مهندسی تابآوری به ما یادآوری میکند که شکستها و موفقیتها، دو روی یک سکه هستند و درک عملکرد عادی سیستمها، کلید درک چگونگی بروز خطاهاست [۲، ۵۴].
ما آموختیم که تابآوری بر چهار ستون اساسی بنا شده است [۶۹]:
- توانایی پاسخگویی (Dealing with the Actual): آمادگی برای عمل در لحظه، چه با پاسخهای از پیش تعیینشده و چه با راهحلهای بداهه، و حتی “آماده بودن برای ناآماده بودن” [۷۲، ۷۷].
- توانایی پایش (Dealing with the Critical): دانستن اینکه به دنبال چه سیگنالهایی، حتی سیگنالهای ضعیف، باشیم تا بتوانیم قبل از بحرانی شدن شرایط، اقدامات پیشگیرانه انجام دهیم [۶۱، ۱۷۴].
- توانایی پیشبینی (Dealing with the Potential): نگاه به آینده، پیشبینی تهدیدات و فرصتها، مدیریت مصالحهها و وابستگیهای متقابل، و تشخیص الگوهای بنیادین شکست سیستمهای انطباقی [۱۲۱، ۲۷۹].
- توانایی یادگیری (Dealing with the Factual): نه تنها از شکستها، بلکه از موفقیتها نیز بیاموزیم، شفافیت را در عملکرد سیستمها تقویت کنیم، و مکانیسمهای هماهنگی و گزارشدهی مؤثر را برای یادگیری مستمر ایجاد کنیم [۱۹۳، ۴۰۳، ۲۳۷].
این چهار توانایی، مجزا از هم نیستند؛ بلکه به یکدیگر وابسته بوده و یک سیستم تابآور نیازمند تقویت هر چهار بعد است [۷۱]. مدیریت تابآوری یک فرآیند مستمر است که نیاز به پایش، ارزیابی و تطبیق مداوم دارد [۵۳۱، ۵۶۳].
ما از دیدگاههای مختلفی عبور کردیم: از داستان معجزهآسای هادسون و تصمیمات قربانیکننده خلبان آن [۹، ۹۸]، تا مدیریت ریسک خستگی در صنعت هوانوردی [۱۸۲]، از “پینگینگ” در نگهداری نیروگاهها [۸۷] تا الگوهای شکست سیستمهای انطباقی [۲۷۹] و درسهایی از سقوطهای هوایی و سیستمهای سیگنالینگ ریلی [۱۵]، و در نهایت، به چالشهای هماهنگی در بیمارستانها و ضرورت یادگیری از سیستمهای گزارشدهی حوادث [۲۱۹، ۲۳۷]. در همه اینها، دیدیم که عامل انسانی، فرهنگ سازمانی و توانایی برای دیدن فراتر از آنچه “روشن” است، نقشی محوری در تابآوری ایفا میکنند [۱۸، ۲۵۷، ۴۹۵].
به یاد داشته باشید، “ما میتوانیم برای اطمینان از اینکه همه چیز به درستی پیش میرود، کاری انجام دهیم. ما میتوانیم منابعی را در دسترس قرار دهیم، از افراد حمایت کنیم و به سازمانها کمک کنیم تا در مواجهه با خواستههای متغیر، قویتر شوند. این فرصت در دستان ماست.”
برای ادامه این مسیر و تقویت تابآوری در محیطهای کاری خود، از شما میخواهم که یک تکلیف عملی را انجام دهید:
تکلیف برای مخاطبین: در هفته پیش رو، به یکی از “موقعیتهای عادی” در محیط کار خود که به نظر میرسد به درستی پیش میرود، توجه کنید. به جای جستجو برای خطاها، سعی کنید “سیگنالهای ضعیف” موفقیت را شناسایی کنید [۱۷۴]. سؤال کنید: “چه چیزی باعث میشود این کار به درستی انجام شود؟” “چگونه میتوانیم از این موفقیت کوچک یاد بگیریم و آن را تکرار یا تقویت کنیم؟” “چه منابع یا دانش پنهانی در این موفقیت نقش دارند؟” نتایج مشاهدات و درسهای آموخته خود را در تیم یا سازمان خود به اشتراک بگذارید. این اولین قدم شما در مهندسی تابآوری در عمل است.
از توجه شما سپاسگزارم. امیدوارم این بحث، دیدگاه جدیدی را برای شما گشوده باشد و الهامبخش اقدامات بعدی شما در جهت ساختن سیستمها و سازمانهای تابآورتر باشد.
بدون نظر