监控


故障恢复
您可以设置故障恢复以自动处理服务器崩溃。当服务器发生崩溃时,它会关闭自己,然后自动重新启动,不需要管理员的干预。致命错误(如操作系统异常或内部应急等)会终止每个 Domino 进程,并释放所有相关的资源。启动脚本会检测到该情况,并重新启动服务器。如果使用了多个服务器分区,而故障发生在其中一个分区上,则只有该分区会终止并重新启动。

Domino 将崩溃信息记录在数据目录中。当服务器重新启动时,Domino 会检查它是否是在崩溃后重新启动。如果是,则将一封电子邮件自动发送给“将失败通知发送给”域中的个人或群组。该电子邮件中包含崩溃时间、服务器名称和 FAULT_RECOVERY.ATT 文件(如果存在),该文件中包括可选清除脚本中的其他故障信息。

故障恢复系统会在可以读取 Domino 目录之前初始化。在此初始化过程中,故障恢复设置是从 NOTES.INI 文件中读取的,稍后该过程会从 Domino 目录中读取此信息,并将其保存回 NOTES.INI 文件。重新启动 Domino 服务器后,对 Domino 目录或 NOTES.INI 文件所作的任何更改都将生效。要禁用对 Domino 目录的读取以及随后对 NOTES.INI 文件的更新,请使用 NOTES.INI 文件的 FaultRecoveryFromIni=1 设置。

操作系统和故障恢复

由于故障恢复在出现异常之后运行,因此它不能依赖 Domino 的内部功能。相反,故障恢复会大量使用操作系统的功能。

UNIX 系统主要使用消息队列。因此,有一点很重要,即要对该操作系统进行配置,使其有足够的消息队列资源。如果使用多个 Domino 服务器分区,每个分区都需要有一套完整的资源。有关配置消息队列参数的其他详细信息,请参考操作系统的文档。

Windows NT 和 Windows 2000 系统则不需要做任何系统资源更改。

另请参阅