Domino/UNIX服务器死机及挂起的数据收集步骤
数据收集前的准备工作:如果近期有频繁出现服务器死机或者服务挂起现象,建议首先做下面三步准备工作.
1. 修改Notes.ini文件。建议在Domino服务器的notes.ini文件中增加以下参数:
DEBUG_CAPTURE_TIMEOUT=1
DEBUG_SHOW_TIMEOUT=1
DEBUG_THREADID=1
DEBUG_OUTFILE=debug.txt
注: 建议在问题解决后,删除前三个参数.
2. 添加一个新的New Server Statistic Collection的记录来记录服务器的统计信息。
A. 在Domino Administrator中,点 配置 ---> Statistics & Events ---> Server Statistic Collection, 点New Server Statistic Collection,如下图所示:
B. 参照下图做相应设置:
C. 保存退出。
D. 在服务器停止运行状态下,修改notes.ini文件中,查找名为 ServerTasks 的行,并在行最后加入 ",collect"
点击查看大图
E. 重启Domino服务器
3. 安装memcheck (此工具在Domino 5.0.8以前的版本需要单独安装,5.0.9版本之后,服务器安装后就已经自动包含,所以可以忽略此步骤)
A. 首先从Lotus技术支持人员处,获得特定平台上的特定版本使用的Memcheck。
B. 必须把获得的memcheck文件(文件名有可能是memcheck508等)重命名为memcheck,不带有任何平台及版本信息,例如
> mv memcheck5.07 memcheck
C. 拷贝此文件到Domino的程序目录下,例如对于Domino/Solaris, 程序目录是 /opt/lotus/notes/latest/sunspa
D. 改变文件的Ownership,例如:> chown root:bin memcheck
E. 修改文件的权限,例如: > chmod 755 memcheck
F. 切换至操作系统的notes用户,在Domino数据目录下运行命令:> nsd ,如果出现下面类似信息,则说明memcheck安装已经成功。如果没有成功,请根据出错信息,检查相应设置。
Debugger Version: Standard
MEMCHECK Version: MEMCHECK Version (X.X) for Lotus Notes Release 5.0.2b (<date of run>)
当出现服务器挂起(hang)问题时,收集下面数据:
1.以”notes”用户在DOMINO数据目录下运行”nsd”,产生log文件。文件格式类似于:
nsd_all_AIX_lotus_11_01@20_43.log
2.从Notes客户端访问服务器,记录错误信息。
3.在客户端运行“NPING”工具访问Domino服务器,记录响应时间,收集数据。
注 : nping的应用程序需要另行安装, 请访问下面的网址:
http://www-1.ibm.com/support/docview.wss?rs=203&q=NotesConnect&uid
=swg24004434&loc=en_US&cs=utf-8&lang=en
4.在客户端“PING”服务器地址,记录响应时间,收集数据。
5.在控制台运行”sh task debug”,”sh user debug”,”sh port tcpip”,”sh stat ”等命令查看服务器运行状态,收集相关数据。
6.在服务器上运行”netstat -a”,“vmstat 2”30秒后结束,“iostat 2”30秒后结束,收集所有三条命令产生的数据。
7.在距第一次收集 nsd 文件5-10分钟后,以”notes”用户在DOMINO数据目录下再次运行nsd命令,产生log文件。
8. 在Domino数据目录下查找是否有名为“core.xxxxx.xxx_xxxx_xx_xx@xx_xx.Z”格式的文件,如果有,将其收集起来。
9. 在Domino数据目录或者程序目录下搜索,是否有名为SEMDEBUG.TXT的文件,如果有将其收集起来,并将原文件删除。
10. 重启服务器.
11. 在以上步骤完成后,将上面九步收集的所有数据,外加debug.txt;statrep.nsf;log.nsf;一起发送给Lotus技术支持人员。
当出现服务器死机(crash)问题时,收集以下数据:
1. 以”notes”用户在DOMINO数据目录下运行”nsd”,产生log文件.文件格式类似于:
nsd_all_AIX_lotus_11_01@20_43.log
2. 在客户端“PING”服务器地址,记录响应时间,收集数据。
3. 在距第一次收集 nsd 文件5-10分钟后,以”notes”用户在DOMINO数据目录下再次运行nsd命令,产生log文件。
4. 在Domino数据目录下查找是否有名为“core.xxxxx.xxx_xxxx_xx_xx@xx_xx.Z”格式的文件,如果有,将其收集起来。
5. 在Domino数据目录或者程序目录下搜索,是否有名为SEMDEBUG.TXT的文件,如果有将其收集起来,并将原文件删除。
6. 重启服务器.
7. 在以上步骤完成后,将上面六步收集的所有数据,外加debug.txt;statrep.nsf;log.nsf;一起发送给Lotus技术支持人员。
- 没有相关文章
- 没有评论