티스토리 뷰

반응형
728x170

‘10.15 먹통’ 잊었나 - 카카오톡 잦은 장애 원인 ‘관리 미흡’

소개

카카오톡은 많은 한국인들이 사용하는 국민 메신저로, 그 중요성은 이루 말할 수 없습니다. 그러나 최근 들어 잦은 서비스 장애로 인해 많은 이용자들이 불편을 겪고 있습니다. 2022년 10월 15일 대규모 서비스 장애 이후, 카카오는 여러 번의 장애를 겪었고, 이에 대해 정부는 원인을 조사하고 시정 조치를 요구했습니다. 이번 포스트에서는 카카오톡의 잦은 서비스 장애 원인과 그에 따른 대응 조치에 대해 자세히 살펴보겠습니다.

 

카카오톡 장애 현황

카카오톡은 2022년 10월 15일 장시간 서비스 장애로 큰 논란을 일으켰습니다. 그러나 2024년 5월에도 3차례의 서비스 장애가 발생했습니다. 13일, 20일, 21일 각각의 장애는 이용자들에게 큰 불편을 초래했습니다. 과학기술정보통신부(과기정통부)는 이러한 장애에 대해 원인을 조사하고 시정 조치를 요구했습니다. 이번 포스트에서는 각 장애의 원인과 그에 따른 대응에 대해 자세히 알아보겠습니다.

  • 2022년 10월 15일 대규모 장애
  • 2024년 5월 13일, 20일, 21일 잦은 장애
  • 과기정통부의 조사와 시정 조치

첫 번째 장애: 5월 13일

첫 번째 장애는 5월 13일 오후 1시 44분부터 1시 50분까지 6분간 발생했습니다. 당시 카카오톡 이용자의 약 80%가 메시지 발신 지연과 실패로 불편을 겪었습니다. 이 장애는 데이터센터 서버의 파일 업데이트 작업 중 기존 파일을 삭제하는 과정에서 오류가 발생한 것이 원인이었습니다. 카카오는 장애 발생 직후 서비스 이중화와 여유 서버를 가동하여 서비스를 복구했습니다.

  • 장애 발생 시간: 5월 13일 오후 1시 44분부터 1시 50분까지
  • 이용자 영향: 약 80%의 메시지 발신 지연 및 실패
  • 원인: 데이터센터 서버 파일 업데이트 중 오류
  • 대응: 서비스 이중화 및 여유 서버 가동

 

두 번째 장애: 5월 20일

두 번째 장애는 5월 20일 오후 2시 52분부터 2시 58분까지 6분간 발생했습니다. 이 장애는 네트워크 부하 분산을 위한 내부 시스템 기능개선 작업 중 발생했습니다. 당시 카카오톡 이용자의 약 80%가 메시지 수발신 실패를 겪었습니다. 카카오는 해당 장애 발생 직후 서비스 이중화를 가동하여 문제를 해결했습니다. 과기정통부는 이 장애가 사전 테스트 환경과 실제 운영 환경의 차이로 인해 발생했다고 지적했습니다.

  • 장애 발생 시간: 5월 20일 오후 2시 52분부터 2시 58분까지
  • 이용자 영향: 약 80%의 메시지 수발신 실패
  • 원인: 네트워크 부하 분산을 위한 내부 시스템 기능개선 작업 중 발생
  • 대응: 서비스 이중화 가동

세 번째 장애: 5월 21일

세 번째 장애는 5월 21일 오전 8시 30분부터 9시 24분까지 54분간 발생했습니다. 이 장애는 두 번째 장애를 일으킨 서버의 오류를 미해결한 상태에서 다른 서버에 자바 프로그램 업데이트 작업을 진행하면서 발생했습니다. 당시 카카오톡 이용자의 약 8%가 영향을 받았으며, PC용 카카오톡 로그인 실패 및 모바일용 카카오톡 메시지 수발신 지연이 있었습니다. 카카오는 자동화 도구를 이용한 복구 시도와 서비스 이중화를 통해 문제를 해결했습니다.

  • 장애 발생 시간: 5월 21일 오전 8시 30분부터 9시 24분까지
  • 이용자 영향: 약 8%의 PC용 카카오톡 로그인 실패 및 모바일 메시지 지연
  • 원인: 서버 오류 미해결 상태에서 자바 프로그램 업데이트
  • 대응: 자동화 도구 이용 복구 시도 및 서비스 이중화

 

정부의 시정 조치

과기정통부는 5월 28일부터 30일까지 통신재난관리심의위원회를 진행하여 카카오톡의 연속된 서비스 장애 원인과 대응 현황을 점검했습니다. 이를 통해 카카오에 대해 주요 작업 전 사전테스트 체계 강화, 작업관리 통제 강화, 통신 재난 관련 매뉴얼 및 지침 보완, 모니터링 시스템 고도화를 통한 장애 탐지 강화, 장애 원인분석과 사후관리 체계화, 장애 사실 이용자 고지 개선 등의 시정 조치를 요구했습니다.

  • 주요 작업 전 사전테스트 체계 강화
  • 작업관리 통제 강화
  • 통신 재난 관련 매뉴얼 및 지침 보완
  • 모니터링 시스템 고도화
  • 장애 원인분석 및 사후관리 체계화
  • 장애 사실 이용자 고지 개선

미래 전망과 해결책

카카오는 이번 시정 요구에 따라 1개월 이내 개선 조치계획을 수립하고, 3개월 이내에 시정 결과를 제출해야 합니다. 이종호 과기정통부 장관은 디지털 서비스 장애가 국민 일상과 사회·경제에 큰 영향을 미치므로, 카카오가 재난·장애 관리를 위한 조직문화 개선과 책임 있는 대책 마련을 촉구했습니다. 카카오가 안정적이고 신뢰할 수 있는 서비스를 제공하기 위해 적극적인 개선과 지속적인 관리가 필요합니다.

  • 개선 조치계획 수립: 1개월 이내
  • 시정 결과 제출: 3개월 이내
  • 재난·장애 관리 조직문화 개선
  • 책임 있는 대책 마련
  • 안정적이고 신뢰할 수 있는 서비스 제공

 

마무리

카카오톡의 잦은 서비스 장애는 많은 이용자들에게 큰 불편을 초래하고 있습니다. 정부의 시정 조치 요구와 카카오의 개선 노력이 지속적으로 이루어져야 합니다. 국민의 관심과 신뢰를 받는 카카오가 앞으로도 안정적이고 신뢰할 수 있는 서비스를 제공하기 위해 더욱 철저한 관리와 대응이 필요합니다. 이러한 노력이 이루어질 때, 국민 메신저로서의 카카오톡은 더 큰 신뢰를 받을 수 있을 것입니다.

반응형
그리드형