مهندسی تاب آوری:یک سخنرانی در 2025 دکتر سعید جوی زاده

“سلام به همه شما بزرگان، کارشناسان و علاقه‌مندان به دنیای پیچیده سیستم‌های مدرن. به این جمع صمیمی و پرشور خوش آمدید! زندگی ما، سازمان‌های ما و جوامع ما هر روز با پیچیدگی‌های فزاینده‌ای روبرو هستند که چالش‌های جدیدی را پیش روی ما قرار می‌دهند. بیایید لحظه‌ای تأمل کنیم:

  1. آیا تا به حال به این فکر کرده‌اید که چرا با وجود تمام تلاش‌هایمان برای جلوگیری از حوادث، باز هم شاهد رخدادهای ناخواسته هستیم؟
  2. آیا ایمنی فقط به معنای نبودِ شکست است، یا می‌توانیم آن را به شیوه‌ای توانمندتر تعریف کنیم؟
  3. و مهم‌تر از همه، اگر ایمنی را نه در جلوگیری از اشتباهات، بلکه در توانایی موفقیت در شرایط متغیر بدانیم، چه تفاوتی در رویکرد ما ایجاد خواهد شد؟

اینها سوالاتی هستند که “مهندسی تاب‌آوری” (Resilience Engineering) به دنبال پاسخ به آن‌هاست [۲، ۵۴]. رویکردهای سنتی به مدیریت ایمنی، عمدتاً بر «ریسک‌ها» و «شکست‌ها» تمرکز داشته‌اند، و آن‌ها را نتیجه‌ای از افت عملکرد عادی می‌دانستند [۲]. اما مهندسی تاب‌آوری، دیدگاهی متفاوت ارائه می‌دهد: این رویکرد، شکست‌ها و موفقیت‌ها را دو روی یک سکه می‌بیند – آن‌ها را پیامدهای متفاوتی از چگونگی کنار آمدن افراد و سازمان‌ها با یک محیط پیچیده، مبهم و تا حدی غیرقابل پیش‌بینی می‌داند [۲].

مهندسی تاب آوری (2)

تصور کنید یک ترازوی بزرگ دارید [۶۸]. در یک کفه، شکست‌ها و حوادث قرار دارند و در کفه دیگر، موفقیت‌ها و عملکردهای صحیح. رویکرد سنتی ایمنی سعی می‌کند با کاهش وزن کفه شکست‌ها، تعادل را به سمت ایمنی سوق دهد [۶۸]. اما مهندسی تاب‌آوری رویکرد دوم را ترجیح می‌دهد: با افزایش تعداد کارهایی که به درستی انجام می‌شوند، می‌توان ایمنی را افزایش داد [۶۸]. هدف نهایی، افزایش تعداد موفقیت‌هاست، که کاهش شکست‌ها را به دنبال خواهد داشت [۶۸].

عملکرد عادی در هر زمان نیازمند آن است که افراد و سازمان‌ها فعالیت‌های خود را با شرایط فعلی محیط کار تطبیق دهند [۲]. این تطبیق از طریق مصالحه بین کارایی و کامل بودن و اتخاذ “تصمیمات قربانی‌کننده” (Sacrificing Decisions) صورت می‌گیرد [۲]. از آنجا که اطلاعات، منابع و زمان همیشه محدود هستند، این تطبیقات تقریبی خواهند بود و در نتیجه، عملکرد متغیر است [۲]. در شرایط عادی، این موضوع اهمیت کمی دارد، اما گهگاه – و گاهی اوقات با نظمی آزاردهنده – تغییرپذیری عملکرد ممکن است به روش‌های غیرمنتظره‌ای ترکیب شده و به نتایج ناخواسته منجر شود [۲].

ایمنی از دیدگاه مهندسی تاب‌آوری، توانایی موفقیت در شرایط متغیر تعریف می‌شود [۵۴]. برای این کار، مطالعه “آنچه که درست پیش می‌رود” به همان اندازه مطالعه “آنچه که اشتباه پیش می‌رود” مهم است [۵۴]. مهندسی تاب‌آوری معتقد است که درک عملکرد عادی یک سیستم اجتماعی-فنی، مبنای ضروری و کافی برای درک چگونگی شکست آن است [۵۴]. همچنین، افزایش ایمنی با بهبود تعداد کارهایی که به درستی انجام می‌شوند، هم آسان‌تر و هم مؤثرتر از کاهش تعداد کارهایی است که اشتباه پیش می‌روند [۵۴].

تعریف تاب‌آوری را می‌توان با اشاره به چهار توانایی اساسی که برای یک سیستم تاب‌آور ضروری است، ملموس‌تر کرد [۵۴، ۶۹]:

  • توانایی پاسخگویی (Responding): دانستن اینکه چه کاری باید انجام شود [۶۹].
  • توانایی پایش (Monitoring): دانستن اینکه به دنبال چه چیزی بگردیم [۶۹].
  • توانایی پیش‌بینی (Anticipating): دانستن اینکه چه انتظاری داشته باشیم [۶۹].
  • توانایی یادگیری (Learning): دانستن اینکه چه اتفاقی افتاده است [۶۹].

مهندسی تاب‌آوری در عمل، به چگونگی ایجاد و مدیریت این چهار قابلیت می‌پردازد [۷۰]. هیچ سیستمی را نمی‌توان تاب‌آور نامید اگر یکی از این چهار قابلیت را نداشته باشد، و نبود یک قابلیت را نمی‌توان با افزایش کیفیت یا کمیت دیگری جبران کرد [۱۹۳]. این چهار توانایی به یکدیگر وابسته هستند و برای مهندسی تاب‌آوری ضروری است که این وابستگی را درک کنیم [۷۱]. در طول این سخنرانی، ما به تفصیل به هر یک از این چهار توانایی و کاربردهای عملی آن‌ها در صنایع مختلف خواهیم پرداخت.

مهندسی تاب آوری1

بخش اول: تاب‌آوری و توانایی پاسخگویی (مقابله با وضعیت فعلی) (تقریباً ۴۵ دقیقه)

در این بخش، بر توانایی یک سازمان یا سیستم برای «مقابله با وضعیت فعلی» تأکید می‌شود [۷۲]. این بدان معناست که چگونه سیستم می‌تواند به خواسته‌های شرایط فعلی – یک موقعیت مختل‌کننده – پاسخ دهد [۷۲]. در سطح عملیاتی، “پاسخگویی به وضعیت” شامل ارزیابی وضعیت، دانستن اینکه به چه چیزی پاسخ دهیم، یافتن یا تصمیم‌گیری برای انجام چه کاری، و زمان انجام آن است [۷۲]. آمادگی برای پاسخگویی عمدتاً بر دو استراتژی تکیه دارد:

  • اولین استراتژی، استراتژی پیشگیرانه است: پیش‌بینی موقعیت‌های مختل‌کننده بالقوه و از پیش تعریف کردن راه‌حل‌های آماده برای استفاده (مانند رویه‌های اضطراری، مهارت‌های واکنش خاص، برنامه‌های واکنش به بحران و غیره) [۷۲].
  • دومین استراتژی، استراتژی واکنشی است: تولید، ایجاد، اختراع یا استخراج راه‌حل‌های موقت و بداهه [۷۲].

این بخش در مورد “تاب‌آوری در زمان واقعی” است [۷۳]. در سطح مدیریت (طراحان، مدیران، مربیان)، مسائل مربوط به تاب‌آوری در زمان واقعی شامل چگونگی اطمینان از در دسترس بودن منابع (افراد، شایستگی، تجهیزات) یا ایجاد به موقع آن‌ها می‌شود [۷۳]. بنابراین، یک سوال کامل‌تر این است که چگونه می‌توان آمادگی برای پاسخگویی را (در حال حاضر) ایجاد و (در آینده) حفظ کرد [۷۳].

ارتباط بین تاب‌آوری و پیش‌بینی در نگاه اول، نقش پیش‌بینی هم آشکار و هم ساده است: وقتی رویدادها پیش‌بینی شده باشند، همه چیز بهتر پیش می‌رود [۷۴]. نمونه برجسته این موضوع، فرود موفقیت‌آمیز پرواز ۱۵۴۹ یو.اس. ایرویز بر روی رودخانه هادسون در سال ۲۰۰۹ است [۷۴]. این رویداد، که به «معجزه هادسون» معروف شد [۸۲]، نشان‌دهنده استراتژی “دفاع عمقی” (defence-in-depth) در برابر خطر برخورد پرنده بود که در سیستم هوانوردی مهندسی شده است [۷۴، ۸۱]. این دفاع شامل لایه‌های متعددی بود:

  • اولین خط دفاعی: کاهش حداقل فرکانس برخورد پرنده [۷۴، ۱۰۴].
  • دومین خط دفاعی: اطمینان از توانایی هواپیما و موتورهای آن برای تحمل برخورد با پرندگان بدون آسیب [۷۴، ۱۰۴].
  • آخرین خط دفاعی: توانایی سیستم خدمه-هواپیما برای فرود در زمین آماده‌نشده یا فرود اضطراری در آب با حداقل آسیب پس از از دست دادن کامل قدرت، و تخلیه ایمن مسافران [۷۴، ۱۰۴].

واضح است که پیش‌بینی سیستم هوانوردی برای از دست دادن کامل موتور، به بقا در رویداد رودخانه هادسون بسیار کمک کرد [۷۴]. طراحی هواپیما به خدمه امکان داد تا کنترل مسیر پرواز را حفظ کنند، رویه‌های از دست دادن دو موتور و فرود اضطراری در آب در دسترس بودند، و خدمه برای تخلیه اضطراری آموزش دیده بودند [۷۴].

با این حال، در حالی که از دیدگاه سیستم هوانوردی، از دست دادن دو موتور کاملاً پیش‌بینی شده بود، اما در مقیاس زندگی حرفه‌ای یک خلبان، رویدادی بسیار نادر بود و برای خدمه، کاملاً غیرمنتظره بود [۷۴، ۹۲]. این نشان می‌دهد که پیش‌بینی در یک سیستم بزرگ به طور یکنواخت توزیع نمی‌شود [۷۴]. سیستم جهانی ممکن است رویدادهایی را پیش‌بینی کند که برای مقیاس‌های محلی بسیار نادر هستند و حتی به آن‌ها فکر هم نمی‌شود، در حالی که اپراتورهای محلی موقعیت‌هایی را پیش‌بینی می‌کنند که برای مقیاس بزرگ‌تر بسیار جزئی هستند [۷۴]. این موضوع، “تعاملات بین‌مقیاسی” (cross-scale interactions) بین سطوح مختلف سازمان در یک سیستم را مطرح می‌کند [۷۴، ۱۳۹].

در مطالعه‌ای بر روی متخصصان بیهوشی [۷۵]:

  • آن‌ها قبل از هر عمل جراحی، دامنه‌ای خاص از “تغییرپذیری بالقوه” (potential variability) را پیش‌بینی می‌کنند [۷۵، ۱۳۲، ۱۳۳].
  • پاسخ‌ها و منابع لازم را آماده می‌کنند [۷۵، ۱۳۲].
  • تا زمانی که رویدادهای “غیرمنتظره” در مرزهای این منطقه باقی بمانند، احساس کنترل دارند [۷۵].
  • زمانی که یک رویداد خارج از این منطقه قرار می‌گیرد (اغلب به دلیل خرابی تجهیزات یا مشکلات همکاری با تیم جراحی)، اولین چالش تشخیص آن است [۷۵، ۱۴۰].
  • در بیشتر موارد، متخصصان بیهوشی با مشکلاتی روبرو شدند که یا باید وضعیت را شناسایی و درک می‌کردند یا تحت محدودیت‌های زمانی بسیار شدید، پاسخ‌های مناسب را اجرا می‌کردند [۷۵، ۱۴۲].

نویسندگان رویدادهای “غیرمنتظره” را بر اساس ماهیت غافلگیری مربوطه، به دو دسته “موقعیت‌های بالقوه” (envisaged before operation) و “موقعیت‌های غیرقابل تصور” (unthought-of situations) طبقه‌بندی می‌کنند [۷۵، ۱۲۷، ۱۲۸]. در ۹ مورد از ۱۳ موقعیت “غیرقابل تصور”، متخصصان بیهوشی برای کمک با همکاران خود تماس گرفتند [۷۵، ۱۴۳]. آن‌ها این تصمیمات برای فراخوانی منابع اضافی (به ویژه همکاران) را نشانه قابل مشاهده تغییر از موقعیت‌های کنترل‌شده به موقعیت‌های بحرانی می‌دانند [۷۵، ۱۴۴]. تاب‌آوری در توانایی اپراتور نه تنها در تشخیص، بلکه در پذیرش – و به معنای واقعی کلمه “تصمیم‌گیری” – این است که سیستم از مرزهای تغییرپذیری بالقوه فراتر رفته است [۷۵، ۱۴۴].

این موضوع همچنین به رابطه پیچیده‌تر بین تاب‌آوری و پیش‌بینی اشاره دارد: تاب‌آوری نه تنها با پیش‌بینی آنچه ممکن است اتفاق بیفتد، بلکه با پیش‌بینی “ظرفیت‌های مقابله” (coping capacities) نیز مرتبط است [۷۶]. این بدان معناست که سیستم باید همیشه مراقب باشد که “ظرفیت انطباقی” (adaptive capacity) آن، همانطور که در حال حاضر پیکربندی و عمل می‌کند، برای پاسخگویی به خواسته‌هایی که در آینده با آن روبرو خواهد شد، کافی است یا خیر [۷۶، ۱۲۱]. و از آنجا که ظرفیت انطباقی شامل پیش‌بینی نیز می‌شود، یک رابطه بازگشتی وجود دارد، یعنی تاب‌آوری همچنین به معنای پیش‌بینی ظرفیت‌های پیش‌بینی آینده است [۷۶]. این موضوع با تصمیم کاپیتان پرواز ۱۵۴۹ یو.اس. ایرویز برای عدم تلاش برای بازگشت به فرودگاه نشان داده می‌شود، زیرا چنین تصمیمی منجر به یک مسیر عملیاتی برگشت‌ناپذیر با از دست دادن کامل کنترل و عواقب فاجعه‌بار اجتناب‌ناپذیر در صورت اشتباه بودن می‌شد [۷۶].

آماده بودن برای ناآماده بودن: با این حال، شرایط تاب‌آوری را نمی‌توان به پیش‌بینی صرف محدود کرد [۷۷]. در حالی که رویدادها تنها در صورتی قابل کنترل هستند که تا حدی پیش‌بینی شده باشند، هرگز با جزئیات کامل پیش‌بینی نخواهند شد [۷۷، ۱۱۶]. از این رو، تاب‌آوری مستلزم ترکیبی از آمادگی و خلاقیت، و پیش‌بینی و اتفاقی بودن (serendipity) است [۷۷، ۱۱۶]. یا به عبارت دیگر، یک سیستم تاب‌آور باید هم آماده باشد و هم آماده باشد برای ناآماده بودن [۷۷]. در مورد هادسون، استراتژی‌های پیش‌بینی در سطح سیستم در هوانوردی می‌توانند به نتیجه‌ای متناقض منجر شوند: ایجاد اپراتورهای ناآماده [۷۷]. این موضوع “تناقض تاب‌آوری” (irony of resilience) را مطرح می‌کند: شایستگی‌های “زمان واقعی” که برای مقابله با رویدادهای غیرمنتظره یا شدید در “نوک پیکان” (sharp end) مورد نیاز است، دقیقاً همان‌هایی هستند که در تلاش مداوم برای پیش‌بینی همه رویدادها و از پیش تعیین کردن پاسخ‌های مربوطه در سطح سیستم، از دست می‌روند [۱۱۷].

این دو مسئله حداقل دو چالش را مطرح می‌کند [۷۸]:

  • اولین چالش، ارتباط بین آموزش و موقعیت‌های “غافلگیری بنیادی” (fundamental surprise) است. چگونه می‌توان افراد را برای چیزی که هرگز تصور نشده است، آموزش داد؟ در «درس‌هایی از هادسون»، استدلال می‌شود که این کار واقعاً ممکن است [۷۸]. با این حال، شرایط کارایی (از جمله شبیه‌سازی دقیق عاطفی و شناختی “غافلگیری واقعی”) توسط سیستم آموزش فعلی هوانوردی برآورده نمی‌شود [۷۸]. یکی از دلایل این امر می‌تواند الگوی غالب ایمنی هوانوردی باشد که فرض می‌کند عملیات پرواز را می‌توان به طور کامل توسط رویه‌ها مشخص کرد و در نتیجه خدمه باید به طور کامل به آن‌ها پایبند باشند [۷۸، ۲۴۴].
  • دومین چالش، ارتباط بین ویژگی‌های تاب‌آوری مهندسی‌شده در کل سیستم و ویژگی‌های تاب‌آوری اجزای محلی یا عوامل سیستم (مانند اپراتورهای خط مقدم) است. تاب‌آوری در سطح سیستم جهانی را می‌توان به عنوان یک ویژگی نوظهور از تعاملات رفتارهای عوامل منفرد در نظر گرفت، در حالی که در عین حال، تاب‌آوری در سطح رفتار فردی حداقل تا حدی نتیجه طراحی سیستم جهانی است [۷۹]. بنابراین، “تاب‌آوری در زمان واقعی” از طریق هر دو فرآیند “پایین به بالا” (bottom-up) و “بالا به پایین” (top-down) تولید می‌شود [۷۹]. وودز (Woods) به “تاب‌آوری رو به پایین و رو به بالا” (downward and upward resilience) اشاره می‌کند تا این فرآیندهای مرتبط و پیچیده را توصیف کند [۷۹، ۱۵۷، ۱۶۰]. یک راه برای غلبه بر این تناقض ظاهری، تطبیق سطح انتزاع عملکردی پاسخ‌های آماده با سطح عدم قطعیت مرتبط با موقعیت پیش‌بینی‌شده است [۷۹].

در مورد فرود اضطراری در آب رودخانه هادسون، با افزایش عدم قطعیت، موقعیت نامحتمل‌تر و کمتر قابل کنترل می‌شود [۸۰، ۱۰۵]. در هر مرحله، پاسخ‌های آماده از حالت مشخص و جزئی به حالت انتزاعی و کلی تغییر می‌کنند؛ رویه‌ها از پروتکل‌های دقیق و جزئیِ عمل‌محور به یک چارچوب پاسخگویی کلی و هدف‌گرا تبدیل می‌شوند [۸۰، ۱۰۶].

سازگاری یافته یا سازگار؟ با این حال، ساده‌لوحانه خواهد بود اگر وانمود کنیم که صرفاً تطبیق سطح انتزاع عملکردی پاسخ‌های آماده می‌تواند تضاد بالقوه بین پیش‌بینی و اتفاقی بودن را حل کند [۸۰]. یک سیستم پیچیده لزوماً تا حدی نسبت به محیط خود “ناسازگار” است [۸۰]. اجرای ظرفیت‌های انطباقی آن برای تطبیق با تغییرات داخلی و خارجی، طیف رفتارهای بالقوه آن را افزایش می‌دهد [۸۰]. این امر موقتاً راه‌حل‌هایی را برای برآورده کردن نیازهای جدید (سازگاری) فراهم می‌کند، در حالی که ذخیره انطباق را افزایش می‌دهد و ظرفیت‌های اکتشافی جدیدی را تولید می‌کند که در نهایت سیستم را در معرض موقعیت‌های جدید و چالش‌های جدید قرار خواهد داد [۸۰].

در نهایت، همه اینها به مصالحه کارایی/شکنندگی (optimality/brittleness trade-off) که رفتار هر سیستم انطباقی پیچیده‌ای را محدود می‌کند، بازمی‌گردد [۸۰]. چنین سیستمی نمی‌تواند همزمان کاملاً با محیط خود سازگار باشد (عملکرد بهینه) و توانایی مقابله با تغییرات مختل‌کننده در آن محیط (تاب‌آوری) را داشته باشد [۸۰]. سازگاری یافته یا سازگار، یک انتخاب اجتناب‌ناپذیر باید انجام شود [۸۰، ۱۱۸]. در سیستم‌های ایمن‌تر، گرایش طبیعی این است که سطح تولید را افزایش دهند، که می‌تواند ریسک ذاتی را افزایش دهد (مثلاً هواپیماها یا مسافران بیشتر)، انعطاف‌پذیری را کاهش دهد و اتصالات را محکم‌تر کند [۲۶۸].

تصمیمات قربانی‌کننده: در موقعیت‌های بحرانی، هیچ مسیر عملیاتی بدون خطا وجود ندارد [۹۷]. کاپیتان سولی در مصاحبه‌ای اظهار داشت: “انتظار داشتم که این پرواز مانند هیچ پرواز دیگری که در تمام دوران حرفه‌ایم انجام داده‌ام، نباشد و احتمالاً در باند فرودگاه و بدون آسیب دیدن هواپیما به پایان نرسد” [۹۸]. این جمله نشان‌دهنده عدم قطعیت عظیمی است که به طور ناگهانی در چنین لحظاتی حاکم می‌شود، هم در مورد وضعیت فعلی و هم در مورد تکامل کوتاه‌مدت آن [۹۸]. جهان شناخته شده و پیش‌بینی شده به یکباره از دست رفت [۹۸]. اطلاعات در مورد وضعیت واقعی و تکامل بالقوه آن به قدری کم است که تصمیمات هرگز با توجه به گذشته، کاملاً “درست” نیستند [۹۸]. رفتار روزمره انسان به عنوان “عقلانیت محدود” (bounded rationality) توصیف شده است [۹۸]. در موقعیت‌های بحرانی، این محدودیت‌ها به مراتب بدتر می‌شوند [۹۸]. کمبود زمان، دانش و منابع بسیار زیاد می‌شود [۹۸]. تصمیمات “رضایت‌بخش” (satisficing) (به جای حداکثرکننده) به “تصمیمات قربانی‌کننده” (sacrificing decisions) تبدیل می‌شوند [۹۸].

یک مثال از تصمیم قربانی‌کننده، تصمیم برای فرود اضطراری در آب رودخانه هادسون بود [۹۹]. شبیه‌سازی‌های پس از رویداد نشان داد که با توجه به سرعت، فاصله و ارتفاع هواپیما، در واقع انرژی کافی برای بازگشت به باندهای لاگاردیا وجود داشت [۹۹]. اما این چیزی است که ما پس از ساعت‌ها پردازش داده و شبیه‌سازی می‌دانیم [۹۹]. خدمه هیچ راهی برای تعیین دقیق و قابل اعتماد اینکه آیا می‌توانند به باند فرودگاه برسند یا خیر، در دسترس نداشتند [۹۹]. تنها مرجع آن‌ها تجربه، مهارت پروازی و احساسشان از وضعیت بود [۹۹]. کاپیتان سولی گفت: “و مجازات انتخاب اشتباه، و تلاش برای رسیدن به باندی که نمی‌توانستم به آن برسم، ممکن بود برای همه ما در هواپیما و همچنین مردم روی زمین فاجعه‌بار باشد” [۹۹]. بنابراین، یک مصالحه ناگزیر وجود داشت: یا هادسون، که قطعاً بد بود اما شاید فاجعه‌بار نبود، یا فرودگاه‌های اطراف، که ممکن بود به پایان خوشی با حداقل آسیب به هواپیما منجر شود، اما تقریباً به طور قطع در صورت شکست تلاش، فاجعه‌بار بود [۹۹]. این یک نمونه خوب از مدیریت ریسک از طریق “تصمیم قربانی‌کننده” است: به حداقل رساندن احتمال فاجعه با قربانی کردن عمدی جاه‌طلبانه‌ترین و بالقوه خوشایندترین – اما غیرقابل تحمل‌ترین – شاخه از درخت گزینه‌ها، برای ایجاد نوعی حداقل سطح آسیب، مرتبط با فرود اضطراری در آب [۹۹].

آموزش تاب‌آوری سازمانی در موقعیت‌های تشدیدشونده: در مواجهه با اتکای بیش از حد صنایع پرخطر به رویه‌های اضطراری تجویزی و ظرفیت شبیه‌سازی با دقت بالا، جستجو برای گام‌های جدید در آموزش برای موقعیت‌های غیرمنتظره و تشدیدشونده آغاز شده است [۱۴۷]. یک چارچوب نظری برای شایستگی‌های انطباقی و انعطاف‌پذیر ارائه شده است که به تاب‌آوری سازمان در موقعیت‌های تشدیدشونده می‌افزاید: “شایستگی‌های عمومی در مدیریت موقعیت‌های تشدیدشونده” [۱۴۸]. این واژه “عمومی” برای متمایز کردن این شایستگی‌ها از شایستگی‌های خاص دامنه و فنی‌تر انتخاب شده است که معمولاً در آموزش‌های خاص دامنه، مانند استفاده از شبیه‌سازی‌های با دقت بالا، تمرین می‌شوند [۱۴۸].

یک آزمایش با مهندسان ایمنی آتش‌نشانی سوئد انجام شد [۱۴۸، ۱۵۲]. شبیه‌سازی‌ای طراحی شد که در آن پنج تا هفت شرکت‌کننده نقش‌های مختلفی را بر روی پل یک کشتی مسافربری که در یک شب طوفانی در اقیانوس اطلس گرفتار شده بود، بر عهده گرفتند [۱۵۳]. سناریوهای شبیه‌سازی به‌دقت از اصول طراحی سناریو برای آموزش شایستگی‌های عمومی پیروی می‌کردند [۱۵۳، ۱۵۱]. این شبیه‌سازی پیچیده بود و توسط رایانه اجرا می‌شد [۱۵۴]. شرکت‌کنندگان قادر بودند با اقدامات خود بر توسعه وضعیت تأثیر بگذارند [۱۵۴]. مهم‌تر اینکه، آن‌ها هیچ استراتژی از پیش تعریف‌شده‌ای برای مدیریت موقعیت‌های آتی نداشتند [۱۵۴].

نتایج نشان داد که گروه‌های آزمایشی، در مقایسه با گروه‌های کنترل که فقط آموزش عملیات اضطراری معمول را دیده بودند، توانایی افزایش یافته‌ای در به کارگیری شایستگی‌های عمومی از خود نشان دادند [۱۵۹، ۱۶۱، ۱۶۲]. برای مثال [۱۵۹]:

  • هر دو گروه آزمایشی، یک فرآیند مدیریت اطلاعات هدف‌محور را انتخاب کردند [۱۵۹].
  • در حجم بالای اطلاعات ورودی، هر دو گروه آزمایشی از فرمول‌بندی اهداف صریح برای هدایت فرآیند تعیین اطلاعات مرتبط، استفاده کردند [۱۵۹].
  • گروه‌های کنترل چنین استراتژی‌ای را به کار نبردند، بلکه اطلاعات ورودی را بر اساس فوریت درک‌شده، نه اهمیت، دسته‌بندی کردند [۱۵۹].
  • در هیچ‌یک از گروه‌های کنترل، نقش خاصی برای مدیریت فرآیند اشتراک‌گذاری اطلاعات تعیین نشده بود [۱۵۹].
  • فرآیند ارتباط و هماهنگی در هر دو گروه آزمایشی با تعیین نقش‌های خاص برای شرکت‌کنندگان مشخص شد [۱۶۰].
  • گروه‌های آزمایشی از اهداف صریح و فرمول‌بندی نقش‌ها برای ایجاد یک فرآیند تصمیم‌گیری توزیع‌شده (distributed decision-making process) استفاده کردند [۱۶۱]. جلسات توجیهی در گروه‌های آزمایشی پیشگیرانه بودند و اهداف تصمیمات آتی را تعیین می‌کردند، در حالی که جلسات توجیهی در گروه‌های کنترل واکنشی بودند و بر تصمیم‌گیری بر اساس آنچه قبلاً اتفاق افتاده بود، تمرکز داشتند [۱۶۱]. این تغییر پیشگیرانه، اهمیت تعیین‌کننده‌ای برای تاب‌آوری سازمانی در موقعیت‌های تشدیدشونده داشت [۱۶۱].

این آزمایش نشان داد که طراحی محیط آموزشی که در آن افراد واقعاً با عدم قطعیت و غیرقابل پیش‌بینی بودن موقعیت‌های تشدیدشونده (هر دامنه‌ای که باشد) روبرو شوند، شایستگی‌های “تاب‌آور”ی را ایجاد می‌کند که توسط استراتژی‌های آموزشی فعلی با هدف تمرین رفتار صحیح در سناریوهای شناخته‌شده، ایجاد نمی‌شوند [۱۶۶]. همچنین نشان داد که آموزش غیرخاص دامنه، درک عمیق‌تری از ماهیت موقعیت‌های تشدیدشونده و دشواری‌های مدیریت آن‌ها را فراهم می‌کند [۱۶۷].

مهندسی تاب آ.ری 2

بخش دوم: تاب‌آوری و توانایی پایش (مقابله با وضعیت بحرانی) (تقریباً ۴۵ دقیقه)

یکی از چهار سنگ بنای اصلی مهندسی تاب‌آوری، توانایی پایش است [۶۱، ۶۹]. هر سازمان مرتبط با ایمنی، یک یا چند معیار برای قضاوت درباره قابل قبول بودن سطح ایمنی در سازمان خود دارد [۶۱]. مدیریت ایمنی به طور سنتی از مدل نظری کنترل کلاسیک پیروی کرده است [۱۷۲، ۶۳]. تغییرات در رویه‌ها و سیاست‌های ایمنی معمولاً رخ نمی‌دهد مگر اینکه تغییری در “خروجی ایمنی” فرآیند – از دست دادن جان، آسیب جدی، انفجار یا سقوط یا هر رویداد جدی دیگری – ایجاد شود [۱۷۲]. سپس مدیریت رویداد را با استفاده از “مدل” فرآیندهای خود بررسی می‌کند، تغییراتی ایجاد می‌کند (شاید یک سیاست ایمنی جدید یا یک مانع جدید ایجاد کند) و اجازه می‌دهد کسب و کار ادامه یابد [۱۷۲].

مهندسی تاب‌آوری بر نیاز به رویکردی پیشگیرانه در مدیریت فرآیندهای اصلی، از جمله ایمنی، و پیش‌بینی (و ترجیحاً جلوگیری از) تغییرات عمده در ایمنی و سایر حوزه‌های عملکرد بحرانی تأکید می‌کند [۱۷۳]. صرفاً اتکا به نتایج کافی نخواهد بود [۱۷۳]. برای پیشگیرانه بودن، اطلاعات بیشتری مورد نیاز است [۱۷۳]. این بدان معناست که داده‌ها نه تنها از خروجی‌های فرآیندها، بلکه از فعالیت‌های میانی در طول مسیر نیز جمع‌آوری می‌شوند [۱۷۳]. این داده‌ها را “شاخص” می‌نامیم [۱۷۳]. هدف آن‌ها ارائه اطلاعات در مورد آنچه در مراحل میانی فرآیندها رخ می‌دهد، قبل از اینکه نتایج به طور قابل توجهی تغییر کنند، است؛ تا مدیریت بتواند برای جلوگیری از نتایج نامطلوب، اقدامات لازم را انجام دهد [۱۷۳].

وسترام (Westrum) اشاره کرده است که استفاده از “سیگنال‌های ضعیف” (faint signals) اغلب یک ویژگی حیاتی سازمان‌های تاب‌آور است [۱۷۴]. سیگنال‌های ضعیف نشانه‌های اولیه مشکلاتی هستند که در یک پروژه شروع به رخ دادن می‌کنند یا نکاتی از مشکلات آتی در یک فرآیند [۱۷۴].

انتخاب و مبنای شاخص‌ها: وریتال (Wreathall) پیشنهاد کرده است که “شاخص‌ها معیارهای جایگزینی برای مواردی هستند که در مدل(های) زیربنایی ایمنی مهم شناخته شده‌اند. بدین ترتیب، آن‌ها نامطمئن هستند و اغلب تنها ارتباط دوری با معیارهای ایده‌آل دارند که به ندرت در عمل در دسترس هستند” [۱۷۵]. در عمل، یافتن مدل‌های صریح که مبنای رسمی برای شناسایی معیارها را فراهم کنند، نادر است [۱۷۵]. با این حال، دانش اغلب در مورد روابطی وجود دارد که برای ایمنی مهم هستند و می‌توان از آن‌ها برای ایجاد مدل‌های کاری استفاده کرد [۱۷۵].

  • در مطالعه خستگی (فصل ۶)، مجموعه‌ای از روابط بین ایمنی، خستگی و مکانیسم‌های زیربنایی آن بیان شد [۱۷۵]. این روابط برای ایجاد معیارهایی برای پایش خطرات ناشی از خستگی استفاده شد [۱۷۵].
  • در مطالعه استراتژی‌های شناختی در کنترل ترافیک هوایی (فصل ۸)، مدل عملکرد T2EAM بر اساس تحقیقات موجود مربوط به استراتژی‌های شناختی در انواع مشابه وظایف، اگرچه اغلب در صنایع دیگر، توسعه یافت [۱۷۶]. این مدل عملکرد مبنایی برای توسعه روش‌های اندازه‌گیری فراهم کرد [۱۷۶].
  • به عنوان یک موضوع عملی، چندین مطالعه از روش‌های موقت (ad hoc) برای انتخاب شاخص‌ها استفاده کرده‌اند [۱۷۶]. همانطور که در فصل ۷ توضیح داده شد، عوامل حیاتی مرتبط با قطع برق که نشان‌دهنده پتانسیل مشکل‌زا بودن بودند، از طریق کارگاه‌های طوفان فکری با مدیران پروژه باتجربه و دیگرانی که اغلب در حمایت از پروژه‌ها در زمان مشکلات درگیر بودند، شناسایی شدند [۱۷۶].

تجربه تا به امروز نشان می‌دهد که انواع مختلفی از معیارها وجود دارد [۱۷۸]:

  • مثال‌های فصل ۶، مربوط به مدل شاخص خطر خستگی (Fatigue Risk Index)، عمدتاً شامل معیارهایی هستند که مستقیماً با موارد عینی مرتبطند، مانند وظایفی که صبح زود شروع می‌شوند (قبل از ۰۶:۰۰)، دوره‌های کاری بیش از ۵ روز و تعداد پروازها [۱۷۸، ۱۹۶].
  • در مدل T2EAM (فصل ۸)، معیارها نمرات مرتبط با سبک‌های رفتاری مورد استفاده توسط کنترل‌کنندگان هستند که توسط کارشناسان مربوطه مشاهده شده‌اند [۱۷۸، ۱۰۶].
  • در فصل ۷، انواع مختلفی از معیارها استفاده می‌شوند؛ برخی نمرات عینی هستند مانند مقدار کار اضطراری (برنامه‌ریزی نشده)، مدت زمان طولانی کار، جابجایی پرسنل و وجود شرایط خاص (آب و هوای شدید، وقوع تعطیلات اصلی و غیره) [۱۷۸].
  • سایر موارد شامل قضاوت‌های ذهنی‌تر مانند افت روحیه، و کاهش کیفیت (و همچنین کمیت) ارتباطات سایت با ستاد مانند گزارش‌های وضعیت سطحی هستند [۱۷۸]. بنابراین، در این سه مطالعه نمونه، تقریباً کل طیف معیارهای ممکن به عنوان شاخص دیده می‌شود [۱۷۸].

شاخص‌های پیشرو و تاخیری (Leading and Lagging Indicators): در بحث استفاده از شاخص‌ها، تاکید زیادی بر این است که آیا شاخص‌های خاصی پیشرو یا تاخیری هستند [۱۷۹]. مسئله اصلی این است که کدام شاخص‌ها پیشرو یا تاخیری هستند، یک مسئله عمل‌گرایانه است [۱۷۹].

  • شاخص‌ها زمانی پیشرو نامیده می‌شوند که اطلاعاتی را ارائه دهند که اقدامات کنترلی را می‌توان به موقع انجام داد تا از تغییر غیرقابل قبول در یک یا چند خروجی اصلی (مانند ایمنی، مالی یا کیفیت) جلوگیری کرد [۱۷۹].
  • شاخص‌ها زمانی تاخیری نامیده می‌شوند که تغییرات در خروجی‌های اصلی را که رخ داده‌اند، منعکس کنند [۱۷۹]. برای مثال، تابلوی نشان داده شده در شکل ۵.۱ (در منابع) یک نمونه از شاخص تاخیری است [۱۷۹]. این نشان‌دهنده عملکرد گذشته در مدیریت ایمنی است [۱۷۹].

با این حال، زمانی که چندین مقیاس زمانی و سطح برای اقدامات کنترلی وجود دارد، مسئله کمی پیچیده‌تر می‌شود [۱۸۰]. گاهی اوقات افزایش موقت کارکنان در یک بخش تولید برای مقابله ایمن و قابل اعتماد با افزایش ناگهانی تقاضا برای یک محصول ممکن است ظرف چند ساعت یا چند روز پس از نشانه‌ای از تقاضای آتی تصمیم‌گیری شود [۱۸۰]. با این حال، ممکن است نیاز به تغییر کل استخدام در شرکت یا طراحی مجدد فرآیندها برای انطباق با دوره‌های طولانی تقاضاهای جدید وجود داشته باشد [۱۸۰]. یک شاخص تاخیری مرتبط با تغییر کارکنان کوتاه‌مدت (مثلاً تعداد کارگرانی که از آسیب‌های مرتبط با خستگی رنج می‌برند) می‌تواند به عنوان یک شاخص پیشرو برای نیاز به تغییرات سیستمی عمل کند [۱۸۰]. بنابراین اصطلاحات پیشرو و تاخیری هم به نوع و سطح (مثلاً محلی یا سیستمی) عمل کنترلی و هم به زمان اقدامات اعمال می‌شوند [۱۸۰].

سیستم‌های مدیریت ریسک خستگی (Fatigue Risk Management Systems – FRMS): خستگی انسان امروزه به عنوان یکی از خطرات اصلی ایمنی در صنایع مختلف، به ویژه به دلیل توسعه عملیات ۲۴/۷، در نظر گرفته می‌شود [۱۸۲]. رویکرد سنتی برای جلوگیری از خستگی، از طریق مقررات محدودیت زمان پرواز و وظیفه (FTL) است [۱۸۲]. با این حال، علاوه بر سختی ذاتی مقررات از دیدگاه عملیاتی، این رویکرد اغلب نتوانسته ابعاد پیچیده خستگی را به طور کامل در نظر بگیرد [۱۸۲]. برای مقابله با این پیچیدگی، FRMS به تدریج در حال ظهور است [۱۸۲]. FRMS به جای تعیین محدودیت‌های مطلق زمان وظیفه، هر عملیات را از نظر خطر خستگی ارزیابی می‌کند [۱۸۲]. FRMS را می‌توان به عنوان راهی ملموس برای مهندسی تاب‌آوری در نظر گرفت، زیرا سازمان را ملزم می‌کند تا با معرفی مجدد ایمنی مدیریت‌شده توسط انسان، علاوه بر ایمنی از طریق مقررات، عملکرد خود را تنظیم کند [۱۸۲، ۱۸۶].

چهار جزء اساسی یک سیستم مدیریت ایمنی (SMS) که توسط ICAO تعریف شده است [۱۹۱]، در ساختار FRMS نیز به کار گرفته شده است [۱۹۲، ۱۹۴]:

  • سیاست و اهداف ایمنی: این جزء اساسی است، زیرا تمام زنجیره‌های مسئولیت را در سازمان تعیین می‌کند، منابع لازم برای مدیریت FRMS را تخصیص می‌دهد و فرهنگ گزارش‌دهی عادلانه را تقویت می‌کند تا اطمینان حاصل شود که خدمه پرواز در گزارش هر موقعیتی که خستگی ممکن است نقش مهمی در آن ایفا کرده باشد، آزاد خواهند بود [۱۹۳].
  • مدیریت ریسک خستگی: این جزء اصلی FRMS است [۱۹۴] و شامل مراحل زیر است [۱۹۵]:
    • شناسایی عوامل خستگی: هر عاملی که پتانسیل ذاتی ایجاد خطر خستگی را دارد، به تنهایی یا در ترکیب با عوامل دیگر [۱۹۵]. دو دسته اصلی وجود دارد: عوامل خستگی مرتبط با ساعات کار (که بر خواب و ریتم‌های شبانه‌روزی تأثیر می‌گذارند) و عوامل خستگی مرتبط با جنبه‌های متنی برنامه کاری (که بر بار کاری خدمه پرواز تأثیر می‌گذارند) [۱۹۵، ۱۹۶].
    • ارزیابی ریسک خستگی: این مرحله احتمال رسیدن خدمه پرواز به سطح بیش از حد خستگی ناشی از ترکیب عوامل خستگی را در نظر می‌گیرد [۱۹۷]. مدل‌های بیومدیکال خستگی می‌توانند به طور مؤثر از ارزیابی ریسک خستگی حمایت کنند [۱۹۷]. این مدل‌ها قادر به پیش‌بینی خطر خستگی مرتبط با الگوهای خاص ساعات کاری هستند [۱۹۷].
    • ارزیابی ریسک ایمنی: این ارزیابی، احتمال وقوع یک رویداد ناخواسته (حادثه یا سانحه) ناشی از یک ریسک خستگی معین را در نظر می‌گیرد [۱۹۹]. این امر منجر به ایجاد یک ماتریس ریسک می‌شود که در آن خطرات اصلی شناسایی می‌شوند [۲۰۰].
    • کاهش ریسک: هدف این مرحله، حذف یا کاهش ریسک به سطحی قابل قبول است (“as low as Reasonably Practicable” – ALARP) [۲۰۰]. استراتژی برتر، سطح حذف است که هدف آن حذف قرار گرفتن خدمه پرواز در معرض عوامل خستگی است (مثلاً در مرحله طراحی برنامه کاری) [۲۰۰]. اگر این قابل دستیابی نباشد، سطح کاهش در نظر گرفته می‌شود [۲۰۰]. و در نهایت، سطح آخر، زمانی که دو سطح قبلی به اندازه کافی برای حذف یا کاهش ریسک خستگی مؤثر نبودند، هدف این است که از تأثیرات منفی سطح بیش از حد خستگی بر ایمنی جلوگیری شود [۲۰۰].
  • تضمین ایمنی: این جزء برای ارزیابی مستمر کارایی FRMS از طریق پایش شاخص‌های مختلف طراحی شده است [۲۰۱]. دو دسته پایش پیشنهاد می‌شود: پایش سیستماتیک و پایش متمرکز [۲۰۱].
    • پایش سیستماتیک: شامل جمع‌آوری و تحلیل داده‌های ایمنی موجود، عمدتاً گزارش‌های ایمنی هوایی (ASR) و پایش داده‌های پرواز (FDM) است [۲۰۲]. ASRها گزارش‌های کوتاهی هستند که توسط خلبان برای گزارش هر گونه رویداد ایمنی در طول پرواز نوشته می‌شوند و اجباری هستند [۲۰۲]. FDM یک فرآیند اجباری اروپایی برای هواپیماهای با وزن بیش از ۲۷ تن است که شامل جمع‌آوری، اندازه‌گیری و تحلیل داده‌های پرواز دیجیتال می‌شود [۲۰۴]. مطالعات نشان داده‌اند که ارتباط معنی‌داری بین وقوع برخی رویدادها و سطح خستگی خدمه پرواز وجود دارد [۲۰۵].
    • پایش متمرکز: شامل داده‌هایی است که مستقیماً جنبه‌های مختلف تأثیر کار بر خواب، خستگی و تجربه شخصی خدمه پرواز را ارزیابی می‌کنند [۲۰۷]. این می‌تواند از طریق دو ابزار اصلی انجام شود: پیگیری در پرواز (جمع‌آوری داده‌های خواب و خستگی) و نظرسنجی‌ها [۲۰۷].
  • ترویج ایمنی: دو هدف اصلی دارد: اطمینان از اینکه هر فرد در خطوط هوایی که در FRMS درگیر است، آموزش مناسب برای اجرا و مدیریت FRMS را دریافت کرده است؛ و اطمینان از اینکه هر فرد مرتبط در خطوط هوایی به طور دوره‌ای از نتایج تولید شده توسط FRMS مطلع می‌شود [۲۱۲].

موردکاوی نگهداری نیروگاه‌ها: “پینگینگ” (Pinging): در کارهای پیچیده و پرفشار مانند نگهداری نیروگاه‌ها، حوادث کیفیت و ایمنی می‌توانند رخ دهند و گاهی اوقات برای هر دو ارائه‌دهنده خدمات و مشتری بسیار پرهزینه باشند [۲۱۷]. بنابراین، انجام کار به طور مداوم و قابل پیش‌بینی با حوادث کم می‌تواند مهم‌ترین عامل متمایز کننده در انتخاب ارائه‌دهنده خدمات باشد [۲۱۸]. اصول مهندسی تاب‌آوری را می‌توان برای طراحی یک استراتژی گسترده و پیشگیرانه برای شناسایی موقعیت‌های بحرانی و ورود به اقدامات متفاوت قبل از وقوع موقعیت‌های پرهزینه به کار برد [۲۱۸].

یکی از راه‌های بهبود “شناسایی” (noticing) موقعیت‌های بحرانی، اجرای فرآیند “پینگینگ” بود [۹۲]. پینگینگ عبارت است از کاوش فعال برای تغییرات در پروفایل ریسک [۹۲]. از طریق کارگاه‌های آموزشی با مدیران پروژه باتجربه و کارکنان پشتیبانی عملیاتی، نشانه‌هایی که نشان می‌دادند یک قطعی ممکن است به وضعیت خارج از کنترل یا تغییر در پروفایل ریسک نزدیک شود، فرضیه‌سازی شد [۹۲، ۲۲۸]. برخی از این عوامل خطر بالقوه و شاخص‌های تغییر پروفایل ریسک عبارتند از [۹۲، ۲۲۹]:

  • مسائل متعدد که توجه خدمه را جلب می‌کنند.
  • توقف پیشرفت، تأثیرات برنامه‌ریزی، تأخیرهای متعدد.
  • تغییر خلق و خوی مدیر پروژه.
  • پرسنل متخصص بیش از حد انتظار در سایت حضور دارند.
  • ناگهان نیاز به افراد بیشتری پیدا می‌شود.
  • جابجایی متعدد پرسنل.
  • مقدار بالاتر از حد معمول کار اضطراری.
  • حوادث متعدد ایمنی و کیفیت، حتی اگر جزئی باشند.
  • افزایش خطاها.
  • کارهای رایج که انجام نمی‌شوند یا دیر انجام می‌شوند (مانند دریافت مجوزها).
  • وضعیت خاصی با پتانسیل تغییر خلق و خوی کارگران (کار در طول کریسمس) یا سطح ریسک (آب و هوا: طوفان، گرمای شدید یا سرما، برف، باد، یخ، طوفان‌های سهمگین) در سایت.
  • کاهش ارتباطات، مانند تماس‌های بی‌پاسخ یا ایمیل‌ها.
  • طولانی شدن قطعی که در آن پتانسیل سطح خستگی بالاتر است.
  • نظم و نظافت سایت کاهش یافته یا متوقف شده است.

این “اقلیم‌های احتمالی خطا” (error likely ‘climates’) عبارتند از [۲۳۱، ۲۳۲]:

  • رهبرانی که از رویکرد “بالا به پایین” یا سبک تهدیدآمیز استفاده می‌کردند.
  • رهبرانی که به نگرانی‌های دیگران در سایت گوش نمی‌دادند و سوال پرسیدن را تشویق نمی‌کردند.
  • رهبرانی که درگیر کار نبودند.
  • سایتی که نقش‌ها/مسئولیت‌های ساختار قطعی در آن نامشخص بود.
  • رقابت شیفت روز و شب.
  • تیم کار نمی‌کرد.
  • مشتری که مستقیماً در محدوده کاری خدمات میدانی دخالت می‌کرد.
  • رهبرانی که با رویه‌ها و فرهنگ‌های فعلی (کارکنان قراردادی) آشنا نبودند.
  • رهبرانی که برای کمک آماده نبودند.

شناسایی اینکه این اقلیم‌ها ممکن است در کجا وجود داشته باشند و درک پیامدهای جدی بالقوه، اولین گام در کاهش یا حذف پتانسیل وجود این اقلیم‌ها در طول قطعی‌ها بود [۲۳۳]. اقدامات پیشنهادی شامل تماس با مدیر منطقه خدمات یا درخواست یک متخصص آموزش‌دیده در مدیریت ریسک، ابزارهای عملکرد انسانی و مقابله با موقعیت‌های احتمالی خطا برای بازدید از سایت و کمک به وضعیت بود [۲۳۳].

مهندسی تاب آ.ری 2

بخش سوم: تاب‌آوری و توانایی پیش‌بینی (مقابله با وضعیت بالقوه) (تقریباً ۴۵ دقیقه)

توانایی پیش‌بینی و تطبیق در سراسر بحث‌های تاب‌آوری و در این کتاب جریان دارد [۱۲۰، ۱۲۱]. در همه سطوح یک سیستم مهم است که اکنون به گونه‌ای عمل کنیم که کنترل را در برابر موانعی که سیستم با آن‌ها روبرو خواهد شد یا می‌تواند روبرو شود، حفظ کنیم [۱۲۱، ۲۷۰]. برای تاب‌آور بودن، یک سیستم همیشه مراقب است که آیا ظرفیت انطباقی آن، با پیکربندی و عملکرد فعلی، برای پاسخگویی به خواسته‌هایی که در آینده با آن روبرو خواهد شد، کافی است یا خیر [۷۶، ۱۲۱، ۲۷۰]. از دست دادن یا نادیده گرفتن نشانه‌هایی که ظرفیت انطباقی در حال تخریب است، سیستم را در برابر فروپاشی یا شکست‌های ناگهانی آسیب‌پذیر می‌کند [۲۷۰].

منابع، چندین الگوی اصلی در نحوه پیش‌بینی سیستم‌های تاب‌آور را شناسایی می‌کنند [۲۷۰، ۲۷۸]:

  • سیستم‌های تاب‌آور قادرند تخریب ظرفیت انطباقی را تشخیص دهند. این بدان معناست که سیستم‌ها می‌توانند نشانه‌هایی را ببینند که ظرفیتشان برای مقابله با اختلالات و چالش‌ها در حال کاهش است [۲۷۱].
  • سیستم‌های تاب‌آور قادرند خطر تمام شدن ذخایر یا بافرها را تشخیص دهند. این مفهوم به “going solid” اشاره دارد، یعنی زمانی که سیستم‌ها تمام منابع در دسترس خود را متعهد کرده‌اند و بنابراین نمی‌توانند به طور موثر به رویداد یا اختلال بعدی پاسخ دهند [۲۷۲]. حفظ ذخایر و “حاشیه‌های مانور” (margins of manoeuvre) بسیار مهم است [۲۷۳].
  • سیستم‌های تاب‌آور قادرند تشخیص دهند که چه زمانی باید اولویت‌ها را در بین مصالحه‌های هدف تغییر دهند. مطالعات سیستم‌های انطباقی پیچیده نشان داده‌اند که مصالحه‌ها بنیادی و گریزناپذیر هستند – بهینه‌سازی-شکنندگی (optimality-brittleness)، کارایی-کامل بودن (efficiency-thoroughness)، حاد-مزمن (acute-chronic) [۸۰، ۱۲۷، ۲۷۴]. بنابراین، سیستم‌ها در فضای تعریف‌شده توسط این مصالحه‌ها وجود دارند [۲۷۴]. یک سیستم باید بداند که در این فضای مصالحه کجا قرار گرفته است، آیا این موقعیت برای زمینه مناسب است، و آیا می‌تواند موقعیت خود را در فضای مصالحه تغییر دهد تا به منطقه بهتری حرکت کند [۲۷۴].
  • سیستم‌های تاب‌آور قادرند تغییرات دیدگاه ایجاد کنند و دیدگاه‌های مختلفی را که فراتر از موقعیت اسمی سیستم آن‌هاست، مقایسه کنند. این جنبه در قضاوت در مورد زمان ایجاد اختلال در فرآیندهای بسیار وابسته به هم که سازمان‌های مختلف را در بر می‌گیرد، ضروری است [۲۷۵]. “مقایسه دیدگاه” (Perspective contrast) برای سنتز نحوه شکست سیستم‌های انطباقی حیاتی است [۲۷۵].
  • سیستم‌های تاب‌آور قادرند وابستگی‌های متقابل را در سراسر نقش‌ها، فعالیت‌ها و سطوح مدیریت کنند. این جنبه از پیش‌بینی در مقیاس نهادهای مالی و نهادهای نظارتی به وضوح نشان داده شده است [۱۷۱، ۲۷۶]. بدون توانایی انجام این شکل از پیش‌بینی، سیستم‌ها در معرض خطر الگوی اختلال انطباقی “کار در جهت اهداف متقابل” (working at cross-purposes) یا “تطبیق محلی اما بدسازگاری جهانی” (locally adaptive but globally maladaptive) قرار می‌گیرند [۲۷۶].
  • سیستم‌های تاب‌آور قادرند نیاز به یادگیری روش‌های جدید برای تطبیق را تشخیص دهند. این به ما یادآوری می‌کند که تاب‌آوری در نهایت به چگونگی یادگیری سیستم‌ها مربوط می‌شود [۲۷۷، ۴۰۰]. سخت است که عقب‌نشینی کنیم و در مورد چگونگی کار سیستم که خود بخشی از آن هستیم در یک محیط متغیر، به هم پیوسته و وابسته به هم تأمل کنیم، نقاط ضعف را شناسایی کنیم و شروع به توسعه روش‌های جدید برای کار کنیم [۲۷۷]. در نهایت، تاب‌آوری به این مربوط می‌شود که چگونه سیستم‌ها یاد می‌گیرند ظرفیت‌های انطباقی خود را تعدیل کنند تا تناسب خود را نسبت به محیطی از فشارهای متغیر و فرصت‌ها به طور مداوم به‌روز کنند [۲۷۷].

الگوهای اساسی شکست سیستم‌های انطباقی: این فصل یک ورودی به استراتژی‌های مدیریت تاب‌آوری را در قالب سه الگوی اساسی از نحوه شکست سیستم‌های انطباقی ارائه می‌دهد [۲۷۹، ۲۸۳]:

  1. برگرداندن از وضعیت جبرانی (Decompensation) – زمانی که سیستم ظرفیت خود را برای تطبیق با رویدادها/چالش‌ها از دست می‌دهد و آن‌ها به صورت زنجیره‌ای اتفاق می‌افتند [۲۷۹]. در این الگو، شکست زمانی رخ می‌دهد که چالش‌ها سریع‌تر از آنکه بتوان پاسخ‌ها را تصمیم‌گیری و اجرا کرد، رشد کرده و به صورت زنجیره‌ای اتفاق می‌افتند [۲۸۴]. در فاز اول، بخشی از سیستم برای جبران یک اختلال در حال رشد، تطبیق می‌یابد [۲۸۵]. این کنترل جبرانی که در ابتدا تا حدی موفق است، حضور و توسعه اختلال زیربنایی را پنهان می‌کند [۲۸۵]. فاز دوم یک رویداد برگرداندن از وضعیت جبرانی رخ می‌دهد زیرا پاسخ خودکار نمی‌تواند اختلال را به طور کامل یا برای همیشه جبران کند [۲۸۵]. پس از تمام شدن ظرفیت مکانیسم پاسخ، پارامتر کنترل‌شده به طور ناگهانی فرو می‌ریزد [۲۸۵]. اطلاعات حیاتی، علائم غیرعادی فرآیند به خودی خود نیستند، بلکه نیروی فزاینده‌ای است که باید در برابر آن‌ها مقاومت کرد، نسبت به قابلیت‌های سیستم‌های کنترل پایه [۲۸۶]. این بدان معناست که چقدر سخت سیستم‌های کنترل برای حفظ کنترل کار می‌کنند و روند این کار چگونه است [۲۸۶].
    • مثال از آتش‌نشانی شهری: در عملیات آتش‌نشانی، فرمانده حادثه (IC) به طور مداوم و صحیح پیشرفت را از نظر اینکه آتش در کنترل است یا خارج از کنترل، ارزیابی می‌کند [۲۹۷]. فرماندهان حادثه به طور خاص مراقبند تا از خطر عقب افتادن با مصرف تمام ظرفیت سیستم برای پاسخگویی به خواسته‌های فوری و همچنین خواسته‌های جدید جلوگیری کنند [۲۹۸]. “سیگنال همه دست‌ها” (all-hands signal) به معنای تشخیص این است که وضعیت ناپایدار است زیرا نزدیک به حداکثر ظرفیت خود قرار گرفته است و بنابراین عملیات فعلی در برابر هر گونه خواسته اضافی که ممکن است رخ دهد، آسیب‌پذیر است [۲۹۸]. یک وظیفه حیاتی IC، تنظیم ظرفیت انطباقی با فراهم کردن “ذخایر تاکتیکی” (tactical reserves) است [۲۹۸].
  2. کار در جهت اهداف متقابل (Working at Cross-purposes) – زمانی که نقش‌ها رفتاری را نشان می‌دهند که به صورت محلی سازگار است، اما به صورت جهانی بدسازگار است [۲۷۹]. این به عدم توانایی در هماهنگی گروه‌های مختلف در سطوح مختلف در تضاد اهداف اشاره دارد [۲۸۷]. در نتیجه ناهماهنگی، گروه‌ها در جهت اهداف متقابل کار می‌کنند [۲۸۷]. هر گروه سخت کار می‌کند تا به اهداف محلی تعریف شده برای حوزه مسئولیت خود دست یابد، اما این فعالیت‌ها دستیابی به مسئولیت‌های نقش‌های دیگر را برای گروه‌های دیگر دشوارتر می‌کند یا اهداف جهانی یا بلندمدت را که همه گروه‌ها تا حدی آن‌ها را می‌شناسند، تضعیف می‌کند [۲۸۷].
    • کهن‌الگوی آن “تراژدی منابع مشترک” (tragedy of the commons) است [۲۸۸]. این مفهوم به دینامیک انطباقی پایه‌ای اشاره دارد که در آن بازیگران، با عمل منطقی در کوتاه‌مدت برای کسب بازده در یک محیط رقابتی، منبع مشترکی را که در بلندمدت به آن وابسته هستند، از بین می‌برند [۲۸۸].
    • مثال از آتش‌نشانی شهری: آتش‌نشانی نمونه‌ای از موقعیت‌هایی است که در آن وظایف و نقش‌ها به شدت توزیع شده و وابسته به یکدیگر هستند و سیستم‌های کاری را در معرض دشواری حفظ همگام‌سازی در عین فراهم کردن انعطاف‌پذیری برای پاسخگویی به خواسته‌های همیشه در حال تغییر قرار می‌دهد [۲۹۹]. موارد متعددی گزارش شده است که در آن شرکت‌ها خطوط شلنگ را باز کرده و آتش و گرما را به سمت دیگران سوق داده‌اند [۲۹۹]. این موقعیت‌ها معمولاً ناشی از تطبیق برنامه شرکت‌ها به دلیل مشکلات یا فرصت‌ها بود [۲۹۹]. اگر تغییر در فعالیت یک گروه توسط یک همگام‌سازی مجدد موفق دنبال نمی‌شد، شرایطی را برای یک ناهماهنگی ایجاد می‌کرد که در آن شرکت‌ها (و مهم‌تر از آن، IC) به طور موقت موقعیت و اقدامات یکدیگر را از دست می‌دادند [۲۹۹]. این امر به ویژه زمانی که گروه‌ها برای مقابله با شرایطی که با آن روبرو هستند، به گونه‌ای سازگار می‌شوند که ناخواسته تهدیداتی را برای گروه‌های دیگر ایجاد یا تشدید می‌کنند، خطرناک است [۲۹۹].
    • تضاد اهداف زمانی پیش می‌آید که بین دستیابی به سه هدف اساسی آتش‌نشانی شهری – نجات جان، محافظت از اموال و اطمینان از ایمنی پرسنل – مصالحه وجود داشته باشد [۳۰۰]. مثلاً، در شرایط منابع محدود، نیاز به نجات یک آتش‌نشان در معرض خطر، تضاد هدف دشواری را بین عملیات نجات و آتش‌نشانی ایجاد می‌کند [۳۰۰].
  3. گیر افتادن در رفتارهای قدیمی (Getting Stuck in Outdated Behaviours) – زمانی که سیستم بیش از حد به موفقیت‌های گذشته تکیه می‌کند [۲۷۹]. این الگو نشان‌دهنده شکست در بازنگری مفروضات و برنامه‌ها در مواجهه با شواهد متناقض یا تغییر شرایط است [۲۹۱].
    • مثال از آتش‌نشانی شهری: در آتش‌نشانی شهری، که با عدم قطعیت بالا و نیاز به تصمیم‌گیری سریع مشخص می‌شود، بازنگری برنامه‌ها یک فرآیند حیاتی است [۳۰۱]. ضروری است که تطبیق با برنامه زمانی انجام شود که عناصر موقعیت نشان می‌دهد دانش قبلی (که استراتژی و تاکتیک‌های در حال اجرا بر آن بنا شده‌اند) قدیمی شده است [۳۰۱]. توانایی تطبیق به شدت به توانایی ارزیابی صحیح وضعیت در طول عملیات بستگی دارد [۳۰۱]. پرونده‌های حوادث نشان می‌دهد که توانایی IC برای نظارت مؤثر بر عملیات و اصلاح برنامه در حال اجرا به شدت مختل می‌شود زمانی که این شخص اطلاعات محدود و درک محدودی از وضعیت موجود و سطح کنترل آتش دارد [۳۰۱].

اهمیت تضاد دیدگاه‌ها (Perspective Contrasts): درک اینکه چه چیزی بدسازگار است، به دیدگاه بستگی دارد [۳۰۳].

  • اولاً، تصمیم‌گیری انطباقی نشان‌دهنده عقلانیت محلی (اگرچه محدود) است [۳۰۴]. یک سیستم انطباقی انسانی از دانش و اطلاعات موجود در میدان دید/کانون توجه خود برای تطبیق رفتار خود (با توجه به محدوده خودمختاری/اختیارات خود) در جهت اهدافش استفاده می‌کند [۳۰۴].
  • ثانیاً، تصمیم‌گیری انطباقی در یک وبِ هم‌تطبیقی وجود دارد که در آن رفتار انطباقی توسط سایر سیستم‌ها به صورت افقی یا عمودی (در سطوح مختلف) بر رفتار سیستم مورد نظر تأثیر می‌گذارد (آزاد می‌کند یا محدود می‌کند) [۳۰۴]. رفتاری که برای یک واحد یا سیستم انطباقی است، می‌تواند محدودیت‌هایی را ایجاد کند که منجر به رفتار بدسازگار در سایر سیستم‌ها شود، یا می‌تواند ترکیب شود تا رفتارهای نوظهوری را ایجاد کند که نسبت به معیارهای تعریف شده توسط دیدگاهی متفاوت، بدسازگار هستند [۳۰۴].

کار در جهت اهداف متقابل زمانی اتفاق می‌افتد که سیستم‌های وابسته به یکدیگر کارهایی را انجام می‌دهند که همگی به صورت محلی سازگار هستند (نسبت به نقش/اهداف تعیین شده/تحت فشار برای هر واحد)، اما به صورت جهانی بدسازگار هستند (نسبت به دیدگاه‌ها و اهداف گسترده‌تر) [۳۰۵]. این می‌تواند به صورت افقی در بین واحدهای کاری در یک سطح رخ دهد [۳۰۵]. همچنین می‌تواند به صورت عمودی (بالا به پایین یا پایین به بالا) اتفاق بیفتد، جایی که انطباق محلی در نوک پیکان یک سیستم در صورت بررسی از دیدگاه منطقه‌ای گسترده‌تر که اهداف سطح بالاتر یا کل سیستم را در بر می‌گیرد، بدسازگار است [۳۰۵].

مهندسی تاب آ.ری 2

بخش چهارم: تاب‌آوری و توانایی یادگیری (مقابله با وضعیت واقعی) (تقریباً ۴۵ دقیقه)

آخرین توانایی از چهار قابلیت اصلی تاب‌آوری – چهارمین سنگ بنا – توانایی یادگیری از گذشته است [۱۹۳]. این توانایی به همان اندازه توانایی پاسخگویی، پایش و پیش‌بینی اهمیت دارد [۱۹۳].

شرایط یادگیری: برای اینکه یادگیری اتفاق بیفتد، سه شرط باید برآورده شود [۱۹۶]:

  1. فرصت‌های معقولی برای یادگیری وجود داشته باشد: یعنی موقعیت‌هایی که می‌توان از آن‌ها چیزی آموخت، با فرکانس کافی رخ دهند [۱۹۶].
  2. موقعیت‌ها به اندازه کافی مشابه باشند: تا بتوان تعمیم داد؛ یعنی باید چیزی مشترک یا قابل مقایسه در موقعیت‌ها وجود داشته باشد [۱۹۶].
  3. فرصت کافی برای تأیید درس‌های آموخته شده وجود داشته باشد: این را می‌توان نوعی ترکیب از دو شرط اول دانست، به این معنا که یک رویداد قابل مقایسه باید قبل از فراموش شدن درس‌ها – و ترجیحاً مدت‌ها قبل از نیاز به استفاده از درس‌ها در یک رویداد واقعی – اتفاق بیفتد [۱۹۶].

از این استدلال‌ها نتیجه می‌شود که یادگیری می‌تواند مؤثرتر باشد اگر بر اساس رویدادها یا شرایطی باشد که مکرراً اتفاق می‌افتند و – تقریباً به دلیل همین واقعیت – کمتر شدید و کمتر متفاوت هستند [۱۹۷]. در واقع، یادگیری از “آنچه درست پیش می‌رود” مؤثرتر از یادگیری از “آنچه اشتباه پیش می‌رود” است [۱۹۷]. دلیل این امر آن است که اولی بسیار بیشتر از دومی اتفاق می‌افتد [۱۹۷]. این موضع همچنین با اصل اساسی مهندسی تاب‌آوری سازگار است که شکست‌ها روی دیگر موفقیت‌ها هستند و هر دو از تغییرپذیری عملکرد در سطوح فردی و سیستمی نشأت می‌گیرند [۱۹۷].

تأثیر یادگیری: چهار قابلیت اصلی تاب‌آوری به یک اندازه ضروری و مهم هستند [۱۹۸]. اگر یادگیری را نقطه شروع قرار دهیم، به راحتی می‌توان استدلال کرد که توانایی پاسخگویی بدون توانایی یادگیری ارزش کمی خواهد داشت [۱۹۸]. یک سیستم نمی‌تواند به طور مؤثر به رویدادهای غیرمنتظره پاسخ دهد مگر اینکه راه‌های جدیدی برای پاسخگویی بیاموزد [۱۹۸].

  • ارتباط با پایش: انتخاب شاخص‌ها برای پایش می‌تواند بر اساس مدل‌های رسمی یا پیشینی باشد، اما همانطور که در فصل ۵ استدلال شد، “یافتن مدل‌های صریح که مبنای رسمی برای شناسایی معیارها را فراهم کنند، نادر است” [۱۹۹]. عمدتاً از طریق یادگیری در عمل است که مبنای مناسب برای پایش – یعنی شاخص‌هایی که باید پایش شوند – می‌تواند ایجاد شود [۱۹۹].
  • ارتباط با پیش‌بینی: یادگیری برای پیش‌بینی نیز ضروری است [۲۰۰]. همانطور که فصل ۹ اشاره می‌کند، یکی از الگوهای پیش‌بینی این است که “سیستم‌های تاب‌آور قادرند نیاز به یادگیری راه‌های جدید برای تطبیق را تشخیص دهند” [۲۰۰]. در رابطه با پیش‌بینی، یادگیری برای تولید یک مدل واقعی، یا حتی کافی، یا درک آنچه ممکن است در آینده اتفاق بیفتد، ضروری است [۲۰۰].

چه چیزی باید آموخته شود؟ یادگیری یک عملکرد مکانیکی نیست و نمی‌تواند به جمع‌آوری داده‌ها یا آمار محدود شود [۲۰۱]. برای هر استفاده از یادگیری، یادگیری “مورد صحیح” حیاتی است [۲۰۱]. در رابطه با ایمنی، اغلب اشاره می‌شود که کامل بودن در یادگیری مهم است [۲۰۱]. با توجه به اینکه یادگیری به طور سنتی بر اساس چیزهایی است که اشتباه پیش رفته‌اند، یک توصیه این بوده است که به دنبال “داستان‌های دوم” (second stories) زیر سطح بگردیم [۲۰۱، ۴۰۱]. برخلاف جستجوی سنتی برای “ریشه‌های علل” (root causes)، این به معنای بازگشت به عقب تا حد امکان نیست، بلکه به معنای در نظر گرفتن توضیحات جایگزین احتمالی است [۴۰۱]. توصیه دیگر با عبارت “آنچه به دنبالش هستید، همان چیزی است که پیدا می‌کنید” (What-You-Look-For-Is-What-You-Find – WYLFIWYF) [۲۰۱، ۴۰۱] بیان شده است. اصل WYLFIWYF به این معناست که توضیحات حوادث به شدت تحت تأثیر مفروضات مربوط به نحوه تعامل عوامل مختلف قرار می‌گیرند [۴۰۱].

شفافیت واقعی سیستم: فصل ۱۵ بر اهمیت آشکار عملکرد واقعی سیستم (جایی که رویدادها رخ داده‌اند) تأکید می‌کند [۲۰۲، ۴۰۶]. این بدان معناست که جمع‌آوری شواهد در مورد چگونگی عملکرد سیستم، فراتر از جستجوی علل مستقیم، مهم است [۲۰۲، ۴۰۶]. در مواردی که اشتباهی رخ داده است (حوادث) یا ممکن است رخ دهد (ارزیابی ریسک)، این کار نسبتاً ساده است و اغلب به عنوان یک فرآیند نهادینه شده انجام می‌شود [۲۰۲].

موردکاوی سقوط هواپیمای ال‌ال و سیستم ERTMS: در ۴ اکتبر ۱۹۹۲، یک هواپیمای بویینگ ۷۴۷ باربری ال‌ال در یک بلوک آپارتمانی در آمستردام سقوط کرد و ۴ نفر در هواپیما و ۴۳ نفر روی زمین کشته شدند [۲۰۹]. در طول تحقیقات، علت مستقیم حادثه نقص طراحی در ستون موتور تشخیص داده شد [۲۰۹]. با این حال، پیامدهای این سقوط بسیار فراتر از علل مستقیم و درس‌های فنی کوتاه‌مدت بود [۲۰۹]. این فاجعه تأثیرات گسترده‌ای بر ارزیابی ایمنی هواپیماهای باربری کامل، ایجاد یک آژانس مستقل تحقیق در مورد حوادث چند حالته در هلند، درک عمومی از ریسک در رابطه با ایمنی خارجی و تغییر تمرکز به مقابله با پیامدهای فاجعه و نقش حاکمیت عمومی در تصمیم‌گیری‌های سیاست بحران داشت [۲۱۰].

در مورد سیستم سیگنالینگ ERTMS (سیستم مدیریت ترافیک ریلی اروپا)، تحقیقات نشان داد که چندین “ویژگی نوظهور” (emergent properties) در پایان فاز طراحی و توسعه ظاهر شدند که نیاز به مداخلات طراحی اضافی و راه‌حل‌های عملیاتی داشتند [۲۱۱]. این شامل پیچیدگی محیط نهادی، عدم وجود نقش برای یک “یکپارچه‌ساز سیستم” (systems integrator)، و دست‌کم گرفتن توسعه فناوری ERTMS بود [۲۱۱]. این موارد نشان‌دهنده نیاز به شفافیت و درک عمیق‌تر از تعاملات سیستم و نه فقط مؤلفه‌های آن است [۲۱۱].

مکانیسم‌های هماهنگی: فصل ۱۶ بر اهمیت مطالعه مکانیسم‌های هماهنگی برای درک تاب‌آوری سیستم‌های اجتماعی-فنی تأکید می‌کند [۲۰۳، ۴۰۳]. این استدلال برای گسترش مطالعه فراتر از حوادث و شکست‌ها است [۴۰۳]. چگونگی هماهنگی بخش‌های مختلف یک سازمان (مانند سیستم مراقبت‌های بهداشتی) در فعالیت‌های خود و به ویژه چگونگی تطبیق پزشکان با رویدادهای غیرمنتظره با استفاده از مکانیسم‌های هماهنگی نوظهور، به راحتی در مواردی قابل مشاهده است که هماهنگی موفقیت‌آمیز است و در نتیجه هیچ اشتباهی رخ نمی‌دهد [۴۰۳]. هماهنگی یک “عملکرد” است و نه یک “شکست”، اما عملکردی است که می‌تواند و باید برای مطابقت با شرایط کاری تغییر کند [۴۰۳].

در سیستم‌های اجتماعی-فنی، عملکرد کلی مستلزم هماهنگی اقدامات و تصمیمات عوامل مختلف درگیر در وظیفه است [۲۱۹، ۴۳۶]. تاب‌آوری در چنین سیستم‌هایی بیشتر به دینامیک تعاملات بین عوامل وابسته است تا توانایی هر فرد یا زیرمجموعه برای تطبیق [۲۲۰، ۴۳۸]. این دینامیک تعاملات است که به چنین سیستمی اجازه می‌دهد تا با رویدادهای غیرمنتظره، تغییرات نامنظم یا بحران‌ها با موفقیت (یا عدم موفقیت) مقابله کند [۲۲۰، ۴۳۸].

موردکاوی هماهنگی در بیمارستان: یک موردکاوی از یک بیمارستان نشان می‌دهد که چگونه عدم ارتباط بین دو بیمارستان در یک منطقه شهری و عدم استفاده از الگوریتم‌های هماهنگی، منجر به ناهماهنگی در درمان یک بیمار آسمی شد و در نهایت به مرگ او انجامید [۲۲۶، ۲۲۷، ۲۲۸، ۲۲۹]. این مورد نشان می‌دهد که هرچند تصمیمات و اقدامات هر فرد به تنهایی منطقی به نظر می‌رسید، اما عدم یکپارچگی این تصمیمات و اقدامات در زمان و مکان و بین عوامل مختلف (پزشکان، پرستاران، پذیرش) منجر به شکست کلی شد [۲۲۹، ۴۴۹].

“نزدیک‌بینی” (Myopia) در هماهنگی: مطالعات نشان می‌دهند که کنترل توزیع‌شده می‌تواند منجر به نوعی “نزدیک‌بینی” شود [۲۳۳، ۴۵۳]. وقتی ناظر مرکزی وجود ندارد که نمایش کلی از عملیات را داشته باشد، گروهی از ربات‌ها می‌توانند در تله‌ای که مربوط به “حداقل محلی” (local minimum) است، بیفتند [۲۳۳، ۴۵۳]. در موردکاوی بیمارستان، هر عامل به نظر می‌رسد که بر درک فعلی خود از وضعیت بر اساس تعاملات محلی و زمان واقعی خود با بیمار اولویت می‌دهد و فرآیند استدلال را به جای ادامه دادن، دوباره شروع می‌کند و در تله “نزدیک‌بینی” می‌افتد [۲۳۳، ۴۵۳].

سیستم‌های گزارش‌دهی حوادث (Incident Reporting Systems): این سیستم‌ها اغلب به عنوان پیش‌نیازی برای مهندسی تاب‌آوری مؤثر در نظر گرفته می‌شوند [۲۳۷، ۴۵۷]. اما گاهی اوقات در دستیابی به بیشتر مزایای مورد انتظار شکست می‌خورند [۲۳۷]. تحقیق فزاینده‌ای وجود دارد که از گزارش‌دهی حوادث به دلیل عدم توانایی آن در ارائه یک نمایش دقیق از آسیب در مقایسه با سایر روش‌ها، و همچنین این واقعیت که هنوز هم گزارش‌دهی حوادث به طور گسترده‌ای کمتر از حد واقعی است، انتقاد می‌کند [۲۳۷، ۴۵۷]. مشکلات گزارش‌دهی حوادث، حداقل تا حدی، در ویژگی‌های ساختاری حوزه‌های مربوطه یافت می‌شود، نه در اصل گزارش‌دهی حوادث یا اجرای آن [۲۳۷، ۴۵۷].

ASRS (سیستم گزارش‌دهی ایمنی هوانوردی) که توسط FAA و NASA در سال ۱۹۷۵ تأسیس شد، اغلب به عنوان بهترین روش در گزارش‌دهی حوادث شناخته می‌شود [۲۳۸، ۴۵۹]. موفقیت ASRS به چندین ویژگی ساختاری دامنه هوانوردی بازمی‌گردد [۲۴۴، ۲۴۵، ۲۴۶]:

  • معیار عبور (Pass Criterion): در حوزه هوانوردی، تمایز واضحی بین یک حادثه و یک رویداد بی‌ربط وجود دارد [۲۴۴، ۴۶۵].
  • درجه استانداردسازی: عملیات هوانوردی به شدت استاندارد شده‌اند [۲۴۶، ۴۶۷]. این بدان معناست که عوامل متنی اغلب می‌توانند ضمنی در نظر گرفته شوند و برای بازسازی یک رویداد، فقط رویدادها و اقدامات اصلی لازم هستند [۲۴۶، ۴۶۷].
  • قابلیت مشاهده (Visibility): آیا اپراتورها در موقعیت خوبی برای مشاهده رویدادهایی هستند که مایل به جمع‌آوری آن‌ها هستیم؟ [۲۴۷، ۴۸۱]. قابلیت مشاهده تحت تأثیر عواملی مانند طراحی فرآیندهای سازمانی، موقعیت و نقش کارکنان خط مقدم، مدت و وسعت فرآیندها، و ماهیت محتوای واقعی کار قرار می‌گیرد [۲۴۷، ۴۸۲].
  • درک ویژگی‌های جامعه شما: در دنیای هوانوردی، نقش‌ها و جوامع حرفه‌ای به خوبی تعریف شده‌اند [۲۴۵، ۴۶۶]. این بدان معناست که ASRS می‌تواند یک تیم کامل از کارشناسان را برای نمایندگی تمام دیدگاه‌های مختلف جمع‌آوری کند [۲۴۵].
  • ارزیابی فرهنگ ایمنی: سطح فرهنگ ایمنی نیز بر ابعاد زیادی تأثیر می‌گذارد، از جمله حفاظت از گزارش‌دهندگان، میزان آموزش در مورد ایمنی (آگاهی از مسائل ایمنی)، توانایی درک علل حوادث [۲۵۰، ۴۸۶].

مقایسه با NHS (سیستم گزارش‌دهی و یادگیری ملی) در مراقبت‌های بهداشتی: NRLS به عنوان یک سیستم ناشناس برای تشویق گزارش‌دهی و ارائه تصویری نمایندگی بیشتر از میزان آسیب در NHS راه‌اندازی شد [۲۴۲، ۴۶۹]. با این حال، NRLS موفقیت‌آمیز نبوده است [۲۴۳، ۴۷۰]. دلایل این امر عبارتند از [۲۴۳، ۲۴۴، ۲۴۵]:

  • بخش عمده‌ای از موقعیت‌هایی که خطر ایجاد می‌کنند، گزارش نمی‌شوند زیرا توسط کارگران به عنوان حوادث قابل گزارش شناسایی نمی‌شوند [۲۴۳].
  • NRLS گزارش‌دهی ناشناس را پذیرفت و شناسایی عوامل مؤثر را به یک طبقه‌بندی در سیستم گزارش‌دهی منتقل کرد تا توسط گزارش‌دهنده پر شود، نه توسط تحلیلگر [۲۴۴]. برای بسیاری از رویدادها در مراقبت‌های بهداشتی، مسیر مربوط به بیمار ممکن است چندین شیفت یا حتی روزها و هفته‌ها طول بکشد و اغلب گزارش‌دهنده در موقعیتی نیست که بتواند عوامل مؤثر را بدون یک تحقیق کامل، که وظیفه‌ای نامناسب برای گزارش‌دهنده است، به طور کافی توصیف کند [۲۴۴].
  • تخصصی شدن حوزه مراقبت‌های بهداشتی، حفظ یک بدنه از محققان برای تحلیل مرکزی همه گزارش‌ها را دشوار می‌کند [۲۴۵].
  • برخلاف دنیای هوانوردی، دنیای مراقبت‌های بهداشتی بسیار کمتر یکنواخت و استاندارد شده است [۲۴۶].

پایش پیشگیرانه ریسک: این رویکرد، پایش مستقیم “نیروهای محرک” پشت رویدادهای نامطلوب را پیشنهاد می‌کند [۲۵۲، ۴۸۹]. در این رویکرد، به جای تمرکز بر رویدادها به عنوان محرک، بر عوامل ایجاد کننده ریسک تمرکز می‌شود [۲۵۳]. این بدان معناست که به جای تمرکز بر فرآیندهای سازمانی که منجر به شرایط نهفته می‌شوند، هدف یک سیستم پایش ریسک، پایش تغییرات در فعالیت‌ها و فرآیندها یا به طور کلی‌تر، میزان توانایی یک سازمان و کارکنان در پیش‌بینی، شناسایی و تطبیق با تغییرات و اختلالات است [۲۵۳، ۴۹۱].

نقش فرهنگ در مهندسی تاب‌آوری: مطالعه‌ای با عنوان “آیا صنعت هوانوردی برای تاب‌آوری آماده است؟ ترسیم مفروضات عوامل انسانی در سراسر بخش هوانوردی” (Is the Aviation Industry Ready for Resilience? Mapping Human Factors Assumptions across the Aviation Sector) [۲۵۷] نشان می‌دهد که تفاوت‌هایی در دیدگاه‌های ایمنی، سنتی و تاب‌آور، در سراسر صنعت هوانوردی وجود دارد [۲۵۷]. این تفاوت‌ها بر اساس فرهنگ ملی و شغل پاسخ‌دهنده متغیر است [۲۵۷، ۲۶۳]. این مطالعه همچنین نشان داد که غیرمتخصصان در عوامل انسانی (HF)، ارگونومی یا ایمنی ممکن است ناآگاهانه و بدون تبعیض از ایده‌های HF از مدل‌ها یا الگوهای ایمنی مختلف (گاهی متناقض) استفاده کنند [۲۵۷، ۲۶۰].

این یافته‌ها به پژوهشگران مهندسی تاب‌آوری و مدیران ایمنی کمک می‌کند تا دیدگاه دست‌اندرکارانی را که از ابزارها و مدل‌های آن‌ها استفاده می‌کنند، بهتر درک کنند [۲۵۸]. مفروضات و باورها الگوی ایمنی را شکل می‌دهند که به نوبه خود، مبنایی برای اقدام ایمنی از طریق مدل‌ها، ابزارها و غیره ایجاد می‌کند [۲۶۰]. اینکه “آیا تاب‌آوری برای صنعت هوانوردی آماده است؟” یک سوال کلیدی است [۲۷۳، ۵۲۸]. پاسخ تا حدی در خود سوال نهفته است: آیا تاب‌آوری برای صنعت هوانوردی آماده است؟ [۵۲۸]

نکات کلیدی این بخش:

  • پژوهشگران HF و رهبران ایمنی باید جامعه هدف خود را در نظر بگیرند، زیرا نتایج نظرسنجی تفاوت‌هایی را در دیدگاه‌ها بر اساس فرهنگ ملی و شغل نشان داد [۲۵۸، ۵۲۹].
  • کارشناسان هوانوردی در این مطالعه به “دیدگاه سنتی ایمنی” (traditional safety Perspective) وفادار نبودند – در واقع، آن‌ها ممکن است به مسائل HF و ایمنی با یک دیدگاه منسجم، مانند متخصصان HF، فکر نکنند [۲۵۹، ۵۲۹]. این هم یک مشکل و هم یک فرصت برای مدافعان تاب‌آوری است: متقاعد کردن مردم به منطقی بودن تاب‌آوری ممکن است آسان باشد، اما آن‌ها لزوماً آن را به طور منسجم یا انحصاری به کار نخواهند برد [۵۲۹].
  • تغییرات در دیدگاه‌ها که در این مطالعه شناسایی شد، همچنین به رفع این باور غلط کمک می‌کند که هوانوردی یک حوزه صرفاً فنی است که در آن استانداردسازی، تمام تغییرات در نحوه انجام کار را از بین برده است [۲۵۹، ۵۳۰]. سهم انسانی حیاتی است، زیرا همیشه جایی برای تفسیر وجود دارد، مهم نیست که چقدر استاندارد شده و تنظیم شود [۵۳۰].

مهندسی تاب آ.ری 2

نتیجه‌گیری (تقریباً ۱۰ دقیقه)

ما امروز سفری عمیق را در دنیای “مهندسی تاب‌آوری” آغاز کردیم و دیدیم که ایمنی تنها به معنای جلوگیری از “آنچه اشتباه می‌رود” نیست، بلکه به معنای توانایی موفقیت و رشد در مواجهه با پیچیدگی‌ها، تغییرات و عدم قطعیت‌هاست [۵۴، ۶۶]. مهندسی تاب‌آوری به ما یادآوری می‌کند که شکست‌ها و موفقیت‌ها، دو روی یک سکه هستند و درک عملکرد عادی سیستم‌ها، کلید درک چگونگی بروز خطاهاست [۲، ۵۴].

ما آموختیم که تاب‌آوری بر چهار ستون اساسی بنا شده است [۶۹]:

  • توانایی پاسخگویی (Dealing with the Actual): آمادگی برای عمل در لحظه، چه با پاسخ‌های از پیش تعیین‌شده و چه با راه‌حل‌های بداهه، و حتی “آماده بودن برای ناآماده بودن” [۷۲، ۷۷].
  • توانایی پایش (Dealing with the Critical): دانستن اینکه به دنبال چه سیگنال‌هایی، حتی سیگنال‌های ضعیف، باشیم تا بتوانیم قبل از بحرانی شدن شرایط، اقدامات پیشگیرانه انجام دهیم [۶۱، ۱۷۴].
  • توانایی پیش‌بینی (Dealing with the Potential): نگاه به آینده، پیش‌بینی تهدیدات و فرصت‌ها، مدیریت مصالحه‌ها و وابستگی‌های متقابل، و تشخیص الگوهای بنیادین شکست سیستم‌های انطباقی [۱۲۱، ۲۷۹].
  • توانایی یادگیری (Dealing with the Factual): نه تنها از شکست‌ها، بلکه از موفقیت‌ها نیز بیاموزیم، شفافیت را در عملکرد سیستم‌ها تقویت کنیم، و مکانیسم‌های هماهنگی و گزارش‌دهی مؤثر را برای یادگیری مستمر ایجاد کنیم [۱۹۳، ۴۰۳، ۲۳۷].

این چهار توانایی، مجزا از هم نیستند؛ بلکه به یکدیگر وابسته بوده و یک سیستم تاب‌آور نیازمند تقویت هر چهار بعد است [۷۱]. مدیریت تاب‌آوری یک فرآیند مستمر است که نیاز به پایش، ارزیابی و تطبیق مداوم دارد [۵۳۱، ۵۶۳].

ما از دیدگاه‌های مختلفی عبور کردیم: از داستان معجزه‌آسای هادسون و تصمیمات قربانی‌کننده خلبان آن [۹، ۹۸]، تا مدیریت ریسک خستگی در صنعت هوانوردی [۱۸۲]، از “پینگینگ” در نگهداری نیروگاه‌ها [۸۷] تا الگوهای شکست سیستم‌های انطباقی [۲۷۹] و درس‌هایی از سقوط‌های هوایی و سیستم‌های سیگنالینگ ریلی [۱۵]، و در نهایت، به چالش‌های هماهنگی در بیمارستان‌ها و ضرورت یادگیری از سیستم‌های گزارش‌دهی حوادث [۲۱۹، ۲۳۷]. در همه اینها، دیدیم که عامل انسانی، فرهنگ سازمانی و توانایی برای دیدن فراتر از آنچه “روشن” است، نقشی محوری در تاب‌آوری ایفا می‌کنند [۱۸، ۲۵۷، ۴۹۵].

به یاد داشته باشید، “ما می‌توانیم برای اطمینان از اینکه همه چیز به درستی پیش می‌رود، کاری انجام دهیم. ما می‌توانیم منابعی را در دسترس قرار دهیم، از افراد حمایت کنیم و به سازمان‌ها کمک کنیم تا در مواجهه با خواسته‌های متغیر، قوی‌تر شوند. این فرصت در دستان ماست.”

برای ادامه این مسیر و تقویت تاب‌آوری در محیط‌های کاری خود، از شما می‌خواهم که یک تکلیف عملی را انجام دهید:

تکلیف برای مخاطبین: در هفته پیش رو، به یکی از “موقعیت‌های عادی” در محیط کار خود که به نظر می‌رسد به درستی پیش می‌رود، توجه کنید. به جای جستجو برای خطاها، سعی کنید “سیگنال‌های ضعیف” موفقیت را شناسایی کنید [۱۷۴]. سؤال کنید: “چه چیزی باعث می‌شود این کار به درستی انجام شود؟” “چگونه می‌توانیم از این موفقیت کوچک یاد بگیریم و آن را تکرار یا تقویت کنیم؟” “چه منابع یا دانش پنهانی در این موفقیت نقش دارند؟” نتایج مشاهدات و درس‌های آموخته خود را در تیم یا سازمان خود به اشتراک بگذارید. این اولین قدم شما در مهندسی تاب‌آوری در عمل است.

از توجه شما سپاسگزارم. امیدوارم این بحث، دیدگاه جدیدی را برای شما گشوده باشد و الهام‌بخش اقدامات بعدی شما در جهت ساختن سیستم‌ها و سازمان‌های تاب‌آورتر باشد.


بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *