[已解决]关于truenas因为系统bug导致的k3s崩溃问题

2024-02-12 00:12   35   0  

好久没有写blog了。。。突然写一次因为我真的很想分享一下/吐嘈一下

问题描述:

起因是过年我就想吧nas清一下灰,结果关机重启后掉了一块盘,幸好好是缓存盘无伤大雅,但是紧接着我邮箱里就收到了另一封报警(PS:我以前真认为我邮件报警没设置好,毕竟它550多天就没响过,一天来两封真有点受不了)

报警原文:

Failed to start kubernetes cluster for Applications: [EFAULT] Unable to configure node: Cannot connect to host 127.0.0.1:6443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1123)')]

排查经过:

先是参考了Sagit的文章TrueNAS SCALE 常见错误排错(持续更新)。然后执行systemctl status k3s在下方有报错,顺着报错发现是ca证书自签名错误,想着根据k3s官网说的命令

# 停止 K3s
systemctl stop k3s

# 轮换证书
k3s certificate rotate

# 启动 K3s
systemctl start k3s

但是报错说没有这个文件/目录,所以就去找*.crt在哪找了半天没找到。最后想起来了truenas的应用有个池的位置选择会创建一个数据集。

顺着/mnt/你的池/ix-applications/server/tls会找到你的证书文件,然后就可以开始解决问题了

step1     先备份这个文件,然后

rm -f dynamic-cert.json

step2     先查看

kubectl --insecure-skip-tls-verify -n kube-system get secrets k3s-serving

然后如果有文件就执行

kubectl --insecure-skip-tls-verify -n kube-system remove secrets k3s-serving

step3     最后重启k3s让证书重新创建

systemctl restart k3s

PS:正常不会等太久,如果太久就是有问题

重启完cni会有问题需要重启服务器

最后问题算是解决了

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。