好久没有写blog了。。。突然写一次因为我真的很想分享一下/吐嘈一下
问题描述:
起因是过年我就想吧nas清一下灰,结果关机重启后掉了一块盘,幸好好是缓存盘无伤大雅,但是紧接着我邮箱里就收到了另一封报警(PS:我以前真认为我邮件报警没设置好,毕竟它550多天就没响过,一天来两封真有点受不了)
报警原文:
Failed to start kubernetes cluster for Applications: [EFAULT] Unable to configure node: Cannot connect to host 127.0.0.1:6443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1123)')]
排查经过:
先是参考了Sagit的文章TrueNAS SCALE 常见错误排错(持续更新)。然后执行systemctl status k3s在下方有报错,顺着报错发现是ca证书自签名错误,想着根据k3s官网说的命令
# 停止 K3s systemctl stop k3s # 轮换证书 k3s certificate rotate # 启动 K3s systemctl start k3s
但是报错说没有这个文件/目录,所以就去找*.crt在哪找了半天没找到。最后想起来了truenas的应用有个池的位置选择会创建一个数据集。
顺着/mnt/你的池/ix-applications/server/tls会找到你的证书文件,然后就可以开始解决问题了
step1 先备份这个文件,然后
rm -f dynamic-cert.json
step2 先查看
kubectl --insecure-skip-tls-verify -n kube-system get secrets k3s-serving
然后如果有文件就执行
kubectl --insecure-skip-tls-verify -n kube-system remove secrets k3s-serving
step3 最后重启k3s让证书重新创建
systemctl restart k3s
PS:正常不会等太久,如果太久就是有问题
重启完cni会有问题需要重启服务器
最后问题算是解决了