اشتراک گذاری

روایت رایچت از روز‌های پر چالشی که داشت

گزارش رایچت از روز‌های پر چالشی که داشت
قادر صادقی

قادر صادقی

اصل مطلب

گزارش واحد فنی در چند ماه گذشته نشان می‌داد که افزایش تعداد کاربران رایچت باعث ترافیک سنگین و بروز اختلال‌هایی در خدمت‌رسانی شده بود. به همین علت، تصمیم بر این شد تا پیش از ارائه نسخه جدید، بروزرسانی زیرساخت‌ها و سرورهای رایچت در اولین اولویت قرار گیرد.
اما بروز برخی اتفاق‌‌ها نه‌تنها باعث تاخیر در روند تکمیل این فرآیند شد، بلکه خدمت‌رسانی رایچت را نیز دچار مشکل کرد. اکنون می‌خواهیم مروری بر این روزها داشته باشیم که با وجود سختی‌های بسیار در سایه مهر و دلگرمی شما سپری شد. در این مطلب با پاسخ به برخی سوال‌های شما در مورد اقدامات صورت گرفته، صحبت می‌کنیم.

چرا سرویس‌‌‌دهی رایچت در دو ماه گذشته همراه با اختلال بود؟ 

اجازه دهید برای پاسخ به این سوال، کمی عقربه‌های ساعت را به عقب‌تر بر‌گردانیم. روزهایی که رایچت به جهت ارائه سرویس پایدار در وضعیت بروزرسانی و بهبود زیرساخت‌ها قرار داشت.

23 دسامبر، 3 دی

در این روز، رایچت یک تهدید سایبری را پشت سر گذاشته بود. پس از این اتفاق، دیکریپشن چت‌ها یکی از مهم‌ترین کارهایی بود که باید انجام می‌گرفت، چون تمامی چت‌ها به جهت جلوگیری از آسیب دیتا اینکریپت شده بودند. بازیابی این حجم از اطلاعات در حین بروزرسانی و بهبود زیرساخت‌ها کار بسیار زمان‌بر و سختی بود.

31 ژانویه، 12 بهمن

در حالی که بازیابی دیتا مراحل پایانی خود را سپری می‌کرد. در ساعت 11:00 صبح 31 ژانویه گزارش جدیدی از واحد فنی دریافت شد که نشان می‌داد مشکلی در دیتابیس رایچت رخ داده است.
در ساعت 11:22 باب دیاچنگو محقق امنیت سایبری نیز در یک توییت، گزارشی از دسترسی غیرمجاز به دیتای رایچت را منتشر کرد.

چرا توییت اطلاع‌رسانی با تاخیر منتشر شد؟ 

پس از این اتفاق، بررسی‌ها و اقدام‌های اولیه کمی زمان‌بر بود. شما می‌توانید جزئیات اقدامات صورت گرفته در این فاصله زمانی را در بخش تایم‌لاین واحد فنی مشاهده کنید.
توییت اطلاع‌رسانی با تاخیر در ساعت 4:47 منتشر شد. در این توییت، ضمن اطلاع‌رسانی از کاربران خواسته شده بود تا گزارش‌ها‌ی بعدی رایچت را برای دریافت اطلاعات کامل‌تر دنبال کنند.

تخفیف گروهی کسب و کارهای اینترنتی
بیشتر بخوانید

چرا اطلاع‌رسانی پس از یک ماه صورت گرفت؟ 

تهدید سایبری 23 دسامبر و توییت‌های منتشر شده در رابطه با اینکریپت دیتا به علت شباهت‌های موضوعی با توییت اطلاع‌رسانی جدید باعث ایجاد یک سوء‌تفاهم شد.
برخی از کاربران تصور کردند که دسترسی غیر مجاز در 31 ژانویه همان اتفاقیست که در 23 دسامبر رخ داده و ما با پنهان کاری، گزارش ناقصی را ارائه کرده‌ایم. در حالی که هیچ ارتباطی بین این دو اتفاق وجود نداشت.
ما همیشه شفاف و مسئولانه پاسخگو بوده‌ایم، چون رایچت با همراهی و حمایت شما ساخته شده است. به همین دلیل، توییت دوم در ساعت 5:28 در راستای توضیح این موضوع منتشر شد.

چرا ایمیل تغییر رمز عبور ارسال شد؟

ایجاد رمزهای عبور قوی و منحصر به فرد یکی از مهم‌ترین توصیه‌هایی است که متخصصان امنیت سایبری به طور مداوم به آن اشاره می‌کنند. در حالی که اغلبِ این توصیه‌ها نادیده گرفته می‌شوند.
با وجودی که دیتا در رایچت به شکل رمزگذاری شده نگهداری می‌شود، اما حفظ امنیت و حریم خصوصی کاربران برای ما از اهمیت زیادی برخوردار است. به همین منظور، یکی از درخواست‌های اولیه از کاربران در تهدید سایبری 23 دسامبر و دسترسی غیر مجاز به دیتای رایچت در 31 ژانویه نیز تغییر رمز عبور بود. این اطلاعیه از طریق ایمیل به کاربران ارسال گردید.

در ساعت 18:26 اطلاعیه ارسال ایمیل تغییر رمز عبور همراه با یک هشدار امنیتی توییت شد. در این توییت ضمن شرح کامل این موضوع توضیح داده شد که هیچ لینکی مبنی بر تغییر رمز عبور در ایمیل وجود ندارد. همچنین از کاربران خواسته شد تا در صورت دریافت ایمیل مشکوک، آدرس ایمیل را به رایچت گزارش دهند.

بیانیه‌ی رایچت

گام بعدی، انتشار بیانیه رایچت با مضمون شفافیت و پاسخگویی مسئولانه به کاربران و مشتریان بود. در این بیانیه ضمن عذرخواهی از همه مشتریان و کاربران رایچت شرح داده شد که هرگونه اطلاعات در مورد امنیت دیتای کاربران و مشتریان همانند گذشته به اشتراک گذاشته شود.

اهمیت لحن گفتار در پشتیبانی مشتری (کانال‌های ارتباطی محتوایی: ایمیل، چت آنلاین و...)
بیشتر بخوانید

گزارش‌های واحد فنی پس از شناسایی دسترسی غیر مجاز

گزارش اولیه واحد فنی

  • در تمامی سرورهای رایچت قوانین محدودیت دسترسی اعمال شد.
  • سرورهای کلاستر پایگاه ‌داده به جهت آنالیز از دسترس خارج شدند.
  • سرور‌های پشتیبان پایگاه داده از لحاظ رخنه امنیتی بررسی گردید.
  • تمامی سرویس‌های رایچت به سرور‌های پشتیبان وصل شد.
  • محدودیت‌ها تحت نظارت مانیتورینگ به جهت بررسی هر گونه اعمال مشکوک به تدریج برداشته شدند.
  • پس از تجزیه و تحلیل جزئیات (12 ساعت تحقیق و بررسی) کلاستر پایگاه داده ایمن و دیتابیس بازیابی شد.

تایم‌لاین واحد فنی

  • 11:00 موضوع شناسایی شد.
  • 11:05 محدودیت‌ها اعمال شد.
  • 11:30 بررسی سرور پایگاه داده پشتیبان انجام شد.
  • 12:00 سرویس‌ها به سرورهای پشتیبان وصل شدند.
  • 13:00 دسترسی‌های خارجی به خدمات رایچت محدود شد.
  • 15:00 به تدریج دسترسی‌های خارجی به سرویس‌های رایچت قطع شد.
  • 23:00 بررسی امنیت کلاستر به پایان رسید.
  • 05:00 پایگاه‌ داده در کلاستر بازیابی شد.
  • 09:00 رایچت دوباره در کلاستر پایگاه داده فعال شد.

چه مشکلاتی باعث بروز این اتفاق شد؟

پس از بررسی‌های واحد فنی و صحبت با باب دیاچنگو، دو مورد مشخص گردید:

  • پیکربندی‌های نادرست در فایروال‌ها انجام شده بود.
  • سرورهای پایگاه داده دارای IP پابلیک بودند.

چه اقداماتی در بازه زمانی 1 فوریه تا 15 فوریه انجام گرفت؟

  • بررسی مجدد تنظیمات تمام فایروال‌ها در تمامی سرورهای رایچت
  • بررسی مجدد تنظیمات فایروال در کلاستر پایگاه داده
  • انتقال سرورهای پایگاه داده به یک شبکه خصوصی مجازی
  • ارزیابی اطمینان از احراز هویت کلیدی روی مجموعه رپلیکاها (replica) به جهت جلوگیری از اتصال اعضا به اینستنس‌های احراز هویت نشده مونگو (mongo)
  • بررسی و بروزرسانی پالیسی‌ها و جلوگیری از استفاده رمز عبور به عنوان متن ساده در کانکشن استرینگ‌ها (کامندلاین)
  • ارزیابی اطمینان از ذخیره تمامی اعتبارنامه‌ها (credentials) به عنوان متغیرهای محیطی در سیستم‌عامل
  • راه‌اندازی سیستم اعتبار سنجی به جهت دسترسی ایمن به سرورها
تخفیف ویژه تابستانی استارتاپ‌های ایرانی
بیشتر بخوانید

چرا رایچت چند روز از دسترس خارج شد؟

پس از بررسی‌های واحد فنی یک تاخیر تصادفی در شبکه‌ی شارد اصلی و ثانویه (مستقر در دو دیتاسنتر مختلف) مشاهده شد. تشخیص این مورد به خاطر تصادفی بودن اختلال‌ها در شبکه‌ی دیتاسنترها کار را سخت‌تر می‌کرد، تا اینکه از طریق اسکریپت مجزای مانیتورینگ و لاگ‌های بین سرویس اصلی و سرویس جایگزین شناسایی شد.
در روش‌های تکنیکال، خطاهای تصادفی مونگو دیده شد که این خطاها بسیار کلی بودند. اسکریپت، متریک‌های اختصاصی و مشخصی را ایجاد می‌کرد که در Prometheus و Grafana ذخیره شده بودند.
همچنین، تست سرعت نشان داد که سرعت بین سرویس‌ها و اینیستنس مونگو در حدود 4 گیگابیت بر ثانیه و مابین سرویس اصلی و ثانویه ۵ گیگابیت بر ثانیه است. این تست به علت گزارش لحظه‌ای نمی‌توانست پیش نمایش کاملی را از وضعیت شبکه را ارائه دهد.

روند بررسی باگ‌های گزارش شده

  • لینک ابزارک اختصاصی: برطرف شد.
  • تنظیم تعداد پیام‌های هوشمند: برطرف شد.
  • ابزارک نشان داده شود/نشود: برطرف شد.
  • خروجی آرشیو مکالمه‌ها: در حال بررسی است.
  • اختلال در اتصال به تلگرام: برطرف شد.
  • اختلال در بارگذاری برخی مکالمه‌ها: برطرف شد.
  • اپ اندروید: بررسی تا آخر هفته ادامه دارد.

اقداماتی که در دستور کار قرار گرفته است

  • افزایش دسترسی به تمامی خدمات رایچت در دیتاسنترهای مختلف
  • ریکاوری پلن و کار روی یک طرح بهبودی در برابر تهدیدهای سایبری
  • افزودن پلن باگ بانتی برای بررسی‌های امنیتی سیستم توسط متخصصان و هکرهای کلاه سفید

در این مطلب با شرح جزئیات از روزهای گذشته سعی کردیم تا شما را در جریان کارهای انجام شده قرار دهیم. ما در رایچت با تمام دل و جان تلاش می‌کنیم تا با ارائه یک سرویس پایدار همراه با بروزرسانی‌های مستمر، اطمینان خاطر و رضایت شما را فراهم کنیم. انتقادها و پیشنهادهای شما نیز در این راه به ما کمک می‌کند تا سریع‌تر به این هدف برسیم.

دیدگاهتان را بنویسید

ممکن است شما نیز به این محتوا علاقه مند باشید

۱۴ روز استفاده رایگان از امکانات رایچت

همین الان امتحان کن

اشتراک گذاری محتوا

اشتراک گذاری در print
اشتراک گذاری در email
اشتراک گذاری در twitter
اشتراک گذاری در linkedin
اشتراک گذاری در skype
اشتراک گذاری در telegram
اشتراک گذاری در whatsapp