Cloudstack 问题记录
安装CloudStack时,会创建3个库cloud、cloud_usage、cloudbridge。但分析后发现只有cloud库是我们需要的。
CloudStack中常用库表:
1、vm_instance 虚拟机实例表
2、nics 网卡表
3、volumes 硬盘表
4、vm_template 模板表
5、configuration 参数配置;
二、可以同样的在数据库中查找这个VM ;存不存在这个模板;
mysql> SELECT * FROM host WHERE name like '%s-1-VM%'\G //主机信息中的系统虚机信息
mysql> SELECT * FROM vm_instance WHERE name like '%s-1-VM%'\G //虚拟机实例中的系统虚机信息,
看来这两个状态;(state 数据库表结构状态)
了解这两个虚拟机的朋友都知道,这是个很强大的虚拟机,删除之后能够重建,一般这两个虚拟机出现了故障,也是通过删除,重建解决的,既然UI界面上面无法删除,那就在数据库中修改相应字段,将其状态置为Destroyed即可。
(根据状态可以更换成其他的 running ;不过不轻易操作、因为系统VM 是表现当前的状态、所以一定要排查的到问题的所在才能解决的)
UPDATE vm_instance SET state='Destroyed' WHERE name='s-1-VM';
UPDATE vm_instance SET state='Destroyed' WHERE name='v-2-VM';
某kvm host主机挂掉后重新上线,云系统找不到cloudstack-agent,
打开数据库vm_instance表检查各虚拟机的运行状态(state字段)是否跟实际有出入(比如明明应是Stopped的,说它Running),
把错误的地方修改保存后重启cloudstack-management。
cloudstack 安装
常见问题
日志:(使用看在cloudstack启用的时候出现异常)
tail -f/var/log/cloudstack/management/catalina.out
日志:
cd /var/log/cloudstack/management
setupManagement.log
management-server.log
catalina.out
3、如果是报的权限问题:
chown cloud /var/log/cloudstack/ -R
5、如果登陆无法访问管理服务器pid进程问题
[root@manage ~]#rm /var/run/cloudstack-management.pid
再次重启测试登录;
6、查看java进程;
ps -ef |grep java
系统VM 是用于管理cloudstack自带的专用虚拟机;用来管理二级存储和远程终端;
修改主机名
/etc/hosts
/etc/sysconfig/network
1、登陆问题
或是数据库导入时候有误;(初始化数据)
cloudstack-setup-databases cloud:root@localhost --deploy-as=root:密码 -i (内网IP)
2、不能添加主存储或二级存储
查看 /etc/sysconfig/nfs 配置文件开放的端口
8、查看虚拟路由表 kvm连接本地地址;
nat对应 公网和内网转换的IP
iptables -t nat -nL
# iptables -t nat -nL
ssh 连接linux (系统虚拟机)
在kvm的宿主机上连接这个ip地址
ssh-i /root/.ssh/id_rsa.cloud -p 3922 root@169.254.2.132 (本地链接地址)
执行/usr/local/cloud/systemvm/ssvm-check.sh
会有提示java 未运行;
然后执行;
root@v-2190-VM:/usr/local/cloud/systemvm# sh run.sh
**********
Error occurred during initialization of VM
Could not reserve enough space for objectheap
Could not create the Java virtual machine.
查看什么问题、、这个提示的就是空间不足;
我这个机器的问题是java启动不了,原因为机器的内存不足,手动更改内存;
export _JAVA_OPTIONS="-Xmx256M"
或者 export _JAVA_OPTIONS="-Xms256M -Xmx256M"
然后执行/usr/local/cloud/systemvm/run.sh
出现无法写入路由表:
Resource [DataCenter:1] is unreachable:Unable to apply save password entry on router
多有可能是虚拟路由表的问题;
通过连接地址进入虚拟路由表;查看内存进程;
或者是一些日志占用较大 (文件查看)
du-sh * | sort -n (文件大小排序)
或者]# ls -lhs
连接跟踪(CONNTRACK),顾名思义,就是跟踪并且记录连接状态;
Conntrackd提供了一个用户控件守护进程用来追踪iptables连接状态信息。守护进程在几个防火墙间同步网络连接的状态信息。因此conntrackd是实现高可用防火墙不可缺少的组件。
全局设置:
secstorage.allowed.internal.sites 改为10.10.10.0/24(实际存储网段)
management.network.cidr 改为10.10.10.0/24 (实际管理网段)
其它要关注的一些全局参数:
expunge 删除实例弥留时间相关参数
ha.tag 高可用标签
ha.workers 高可用守护线程数
overprovisioning 系统资源超配相关参数
(如果超配不起作用,看看数据库cluster_detail和vm_template_details表)
snapshot 快照相关参数
kvm.snapshot.enabled 使用kvm作为宿主机这个参数必须设置为true
allocated.capacity 资源分配阀值相关参数,超过阀值将无法创建和运行虚拟机。
network.throttling.rate 网络带宽,默认值是200Mbps
vm.network.throttling.rate 网络带宽,默认值是200Mbps
expunge.delay=30
expunge.interval=30
secstorage.allowed.internal.sites=0.0.0.0/0
//模板下载web所在的网段
system.vm.use.local.storage=true
//启用本地存储
host=172.16.0.20
// 主机地址
management.network.cidr=172.16.0.0/24
模板地址下载的网段
全局设置的虚拟机管理程序;
对于虚拟机平台都有最大 来宾数的限制;
host无法正常加入系统,反复断开
cloudstack-agent日志报错如下:
Connected to 10.10.10.15:8250
Proccess agent startup answer, agent id = 0
Set agent id 0
Startup Response Received: agent id = 0
Connected to the server
Lost connection to the server. Dealing withthe remaining commands...
注意看manage的日志中的host id 和cloudstack-agent日志中的agent id,是不是对应不上,是的话删除这个host重新添加。
如果删不掉,关闭manage和agent,清除数据库中host_details和host表与这个host对应的数据(如果提示其它表有关联数据也一起删除),重启manage和agent。