Method and system for managing server failure

서버 장애 관리 방법 및 그 시스템


PURPOSE: A method for managing a server failure and a system thereof are provided to automatically sense a failure state of a user server, efficiently report the failure state to a server manager, and estimate a future change in the server state. CONSTITUTION: A CMS(Connection Management System)(110) is installed at a user server(100) for managing system inner resources and error events and checking abnormality of the data. A CAS(Connection Accept Server)(210) receives the data transmitted from the CMS(110) for converting the data into normal data. A DPS(Data Passing Server)(220) stores the data output from the CAS(210) at a database(230). An NDS(Network Diagnostic Server)(240) checks abnormality of a network for inputting the abnormality into the database, and outputs information related to the abnormality in the case of a predetermined emergency. A DAS(Data Analyzing Server)(250) processes and outputs all kinds of data to analyze the data stored at the database(230). An ACS(Automatic error Calling Server)(260) transmits information related to the predetermined emergency to wire/wireless telephones and an e-mail of a predetermined server manager.
본 발명은 사용자 서버에서 시스템 감시 모듈이 서버 상황을 감시하고 장애 발생시 장애요소를 분석하여 경고, 위험, 긴급상황별로 분류한다. 경고 및 위험 장애는 이메일, 일반전화, 휴대폰 등으로 서버관리자에게 자동으로 통보되고, 장애건은 방치시에 서버가 다운되는 등의 심각한 상황이 발생하기 때문에 자동으로 응급조치가 수행된다. 또한 사용자 서버의 상태를 나타내는 구성요소를 데이터베이스화하여 시계열 분석을 행함으로서 현재의 서버시스템 상황을 파악할 수 있고 앞으로 유의해야할 사항과 미리 조치해야할 사항을 진단 컨설팅할 수 있는 기능을 제공한다.




