Tuesday, November 07, 2006

OpenNMS: "báo cháy" cho hệ thống mạng

OpenNMS là một công cụ quản lý hệ thống mạng nguồn mở với định hướng sử dụng ở mức độ enterprise. OpenNMS cung cấp khả năng dò tìm các dịch vụ, thu thập thông tin để báo cáo, phát sinh cảnh báo từ các cảnh báo thu thập thập được, nâng cấp mức độ của cảnh báo (escalation) . Có không ít phần mềm nguồn mở nổi tiếng trong lĩnh vực giám sát hoạt động mạng và dịch vụ (network/service monitoring) như Nagios, Zenoss, Zabbix, mỗi phần mềm đều có những ưu điểm nổi bật riêng. Các phần mềm giám sát thường dựa trên cơ chế agent/server hoặc passive polling. Với cơ chế đầu khả năng giám sát toàn diện hơn nhờ có agent, có thể giám sát được tài nguyên trên từng máy. Với cơ chế sau, việc giám sát được thực hiện thông qua dữ liệu thu thập được với tư cách một client bình thường (tài nguyên có thể được giám sát qua SNMP nhưng không đầy đủ), cách này dễ dàng hơn do không phải cài đặt agent trên các máy muốn giám sát. OpenNMS thuộc loại sau.

OpenNMS có thể được sử dụng như một thiết bị "báo cháy" cho hệ thống mạng. Mặc dù được viết bằng Java, việc cài đặt và cấu hình OpenNMS khá đơn giản và dễ dàng (dễ hơn nhiều so với Nagios). Sau khi cài đặt, OpenNMS có thể tự động dò trên các subnet định trước để xác định tất cả các máy với tất cả các dịch vụ đang mở port, người quản trị chỉ cần chọn máy/dịch vụ để giám sát từ danh sách này. OpenNMS cung cấp sẵn các định nghĩa cho sự kiện như "node down/node up" khi kiểm tra bằng ping, "lost service/gain service" khi kiểm tra bằng cách mở kết nối đến cổng của dịch vụ. Các sự kiện này có thể được dùng để phát sinh cảnh báo (email/SMS/pager) đến những người quản trị tương ứng. Tính năng nâng cấp mức độ của sự kiện có thể dùng để cảnh báo đến cấp quản lý cao hơn nếu máy/dịch vụ bị ngừng quá lâu. Nhược điểm của OpenNMS khi dùng ping để kiểm tra tình trạng chạy/ngừng của máy là dễ bị sai nếu tải mạng cao, hơn nữa nếu một gateway/router bị ngừng thì tất cả các máy đứng sau gateway/router ấy đều bị báo ngừng (sẽ được khắc phục trong phiên bản kế).

Với một hệ thống "báo cháy" hiệu quả, hệ thống mạng đã được chuyển sang giám sát chủ động, quản trị mạng có thể được thông báo ngay bằng SMS khi có sự cố thay vì chỉ biết khi người dùng báo. Tất nhiên, hệ thống đó phải được tối ưu để loại bỏ các báo động giả, nếu không máy điện thoại của bạn có nguy cơ "cháy" vì tin nhắn :).

No comments: