EXCHANGE故障排除步骤简述
一、缩小问题范围
1.有多少用户受到影响
2.是否所有受影响的用户使用相同的方法访问exchange
3.用户想要做什么
4.其他用户执行相同的任务是否正常
5.所有用户在一个数据库吗
6.都在同一个站点吗
7.什么时间发生和故障发生的频率
二、使用基本的排障工具
1.无论出现什么问题首先要查看 事件查看器
2.使用TEST命令
{ 例如:1.获取测试命令: help test-*
所有test开头的命令
2.get-servercomponentstate 获取服务器组件状态 3.test-servicehealth 查看服务运行状态,此命令会根据CAS或者MAILBOX服务器自动 进行相应服务筛选。 4.test-mapiconnectivity 测试客户端连接到优先服务器时所使用的两个关键协议:MAPI\LDAP。并且会间接确认MAPI服务器、exchange存储、目录服务访问DSaccess是否正在工作。 5.test-replicationhealth 检查复制服务运行状态并提示发现的错误。 6.Get-MailboxDatabaseCopyStatus 验证复制服务后(第5个命令),可以使用Get-MailboxDatabaseCopyStatus检查数据库本身的复制状态。
get-mailboxdatabasecopystatus | fl name,status,contentindexstate
contentindexstate即索引状态,确保保持healthy状态。
7.邮件流测试 test-mailflow 测试邮件的提交、传输、发送。验证服务器是否可以成功的向自身发送邮件。后面可以跟targetmailboxserver \targetdatabase \targetemailaddress参数。如果部署了DAG直接使用targetdatabase参数 }
三、解决邮箱服务器问题
1.数据库复制运行状况是否正常
2.服务器性能是否出现受限
3.电子邮件传递是否正常
4.确保所有服务正常运行
5.在日志中是否存在msexchangedatbase、msexchnangedatabase实例、msexchangesubmission有关的任何错误。
6.是否有活动目录问题
7.使用TEST-MAPICONNECTIVITY命令测试
此命令不经测试exchange存储服务,还会测试AD访问、RPCoverhttp访问。
8.是否被隔离(毒药邮箱)
毒药邮箱的概念:默认情况下,邮箱服务器将标记任何导致store.exe服务中的线程崩溃或连接到五个或更多"挂起"线程的邮箱。 如果邮箱在两小时内被标记三次,则Exchange Server 2013将阻止对该邮箱的访问最多六个小时或直到管理员解除阻止,以先到者为准。 如果用户报告她无法连接到邮箱,但其他用户没有遇到任何问题,请检查服务器上是否有隔离的邮箱。
使用到的命令:get-mailboxstatistics | fl isquarantined
如果 isquarantined参数为$true则为被隔离状态。
9.TEST-REPLICATIONHEALTH
检查复制服务运行状态并提示发现的问题
四、解决邮件传输问题
1.解决邮件传输问题的重点
1.1 是否可以发送所有电子邮件或者仅限于一部分用户
1.2是否收到退信,是否有代码
1.3是否在统一组织中
1.4 邮件传递距离
1.5发件人和收件人之间的消息路径
2.考虑以下问题是否存在
2.1 DNS失败 无法找到A记录
2.2 站点链接错误 发件人和收件人之间不存在站点链接
2.3 传输限制 邮箱是否已满
2.4 传输规则
2.5 邮件滞留在消息队列
2.6 服务器出现反压情况 (反压的概念参考博客文章)
3.TEST-MAILFLOW 4.队列查看器、 5.邮件追踪 5.1 自主邮件跟踪报告 OWA-选项-送达报告 (只能跟踪自己的邮件) 5.2 EXCHANGE管理中心邮件跟踪 EAC-邮件流-送达报告 (最总所有用户邮件) 5.3 GET-MESSAGETRACKINGLOG