当前位置:新闻中心行业动态 → 正文

Kubernetes部署失败的常见原因

责任编辑:editor004 作者:Hrishikesh Barua |来源:企业网D1Net  2017-03-07 11:32:43 本文摘自:INFOQ

最近一系列的文章重点介绍了Kubernetes部署失败的10种常见原因。这些原因涵盖了从缺少输入和错误输入,到超出资源限制。在大多数情况下,kubectl describe命令可以帮助确定背后的原因。

Kubernetes部署的无效输入包括指定不存在的容器镜像,或者指定没有访问权限的容器镜像。因为默认注册表是Dockerhub,所以如果使用了其它注册表(如Amazon ECR或Quay.io),则需要指定注册表URL。私有注册表在访问镜像时需要相关证书。 当要拉取的标签名称无效时,镜像拉取也可能遇到错误。比如在latest标签不存在但镜像存在时,镜像拉取就会失败(如果没有特别指定,“latest”就是默认标签)。此外网络问题也可能会导致错误。这类情况下的错误消息彼此间十分相似,因此需要更深入的检查以确定确切的原因。

Kubernetes中的部署失败常常导致特定的Pod无法启动。可以使用“kubectl describe pod ”命令输出描述失败原因的事件日志。kubectl命令采用“pod”,“replicaset”,和“deployment”参数。这些命令与“kubectl logs ”组合是调试部署失败的关键。

如果把Kubernetes中的默认策略设置为不总是从注册表中拉取,则即使提交了更新后的改动并推送镜像,这些改动也可能不可见。在产品中推荐的解决方法是为每个镜像分配唯一标签,并在拉取请求中使用这些标签。此外在部署配置中指定不存在的持久卷(persistent volumes)也可能导致部署失败。

另外两种无效输入是缺少程序运行时ConfigMap或Secrets,以及无效的Spec对象。 ConfigMap是一组键值对的映射,该组键值对属于应用程序所需的配置数据。ConfigMap可以被指定为CLI参数,环境变量,或已安装卷中的文件。如果缺少了这些信息,那么Pod创建会停止,并且状态被设置为“RunContainerError”。Secrets是一种用于存储敏感数据(如证书)的机制。Secrets缺失将导致类似的问题。ConfigMap和Secrets都可以安装为卷,如果安装失败,则容器创建停止,事件日志的状态停留在“ContainerCreating”。

另一种部署失败的原因是无效的Kubernetes Spec对象,这些无效对象是由YAML中的缩进错误或拼写错误所导致。通过基于CLI的YAML验证和使用--dry-run参数,我们可以很容易地避免此类错误,如下所示:

kubectl create -f test-application.deploy.yaml --dry-run --validate=true

但该方法需要运行Kubernetes集群。移除对集群依赖的工作正在进行当中,同时也会提供对客户端验证的支持。YAML验证可以被添加到源控制系统中,成为预提交钩子(pre-commit hook)的一部分。

另一类失败的Kubernetes部署是因为超出资源限制。Pod和容器都有指定的CPU和内存限制。超出这些限制将导致无法创建Pod。调试该问题需要花一点精力。命令“kubectl describe deployment ”可以帮助我们获取ReplicaSet的名称,此ReplicaSet正是Kubernetes所尝试去创建的。键入“kubectrl describe replicaset ”,并把上一步中获取的副本集(replica set)名称传递给它,就可以像在其它情况下一样,打印出事件日志,并显示错误消息。

部署失败也可能是因为超出资源配额。当团队间共享节点数固定的集群时,这种资源配额机制可以用来限制每个命名空间的资源消耗。资源包括Pod,服务和部署,以及计算资源的总量。 同样,在这种情况下,“kubectl describe”命令能够帮助我们挖掘出实际的错误消息。

当节点未充分使用资源时或者由于资源不足而无法运行Pod时,集群自动调整程序(cluster autoscaler)会自动调整Kubernetes集群大小。如果该自动调整程序未被启用,那么超出资源配额的部署将会失败,并且Pod停留在“Pending”状态。 事件日志将显示出实际短缺的资源(由于该资源短缺而导致部署失败)。

应用程序行为的意外更改可能以不同的方式引起部署失败。应用程序崩溃常常会导致启动错误,该错误的错误消息是“CrashLoopBackOff”。应用程序日志可以帮助解决此问题。此外,如果配置错误或者响应超时,Liveness/Readiness探测可能会停止工作,该探测被Kubernetes用来检测服务的健康情况。例如,URL健康检查可能在应用程序中已发生变更,或者由于数据库变动,URL健康检查可能无法正常工作。某些URL可能需要一段时间才能响应Readiness检查,这可能会超时并导致部署失败。

文章的作者已开源一个脚本,当创建失败时,该脚本可以在日志里打印出有用的相关信息。

查看英文原文:Common Reasons for Failed Kubernetes Deployments

关键字:Kubernetes部署

本文摘自:INFOQ

x Kubernetes部署失败的常见原因 扫一扫
分享本文到朋友圈
当前位置:新闻中心行业动态 → 正文

Kubernetes部署失败的常见原因

责任编辑:editor004 作者:Hrishikesh Barua |来源:企业网D1Net  2017-03-07 11:32:43 本文摘自:INFOQ

最近一系列的文章重点介绍了Kubernetes部署失败的10种常见原因。这些原因涵盖了从缺少输入和错误输入,到超出资源限制。在大多数情况下,kubectl describe命令可以帮助确定背后的原因。

Kubernetes部署的无效输入包括指定不存在的容器镜像,或者指定没有访问权限的容器镜像。因为默认注册表是Dockerhub,所以如果使用了其它注册表(如Amazon ECR或Quay.io),则需要指定注册表URL。私有注册表在访问镜像时需要相关证书。 当要拉取的标签名称无效时,镜像拉取也可能遇到错误。比如在latest标签不存在但镜像存在时,镜像拉取就会失败(如果没有特别指定,“latest”就是默认标签)。此外网络问题也可能会导致错误。这类情况下的错误消息彼此间十分相似,因此需要更深入的检查以确定确切的原因。

Kubernetes中的部署失败常常导致特定的Pod无法启动。可以使用“kubectl describe pod ”命令输出描述失败原因的事件日志。kubectl命令采用“pod”,“replicaset”,和“deployment”参数。这些命令与“kubectl logs ”组合是调试部署失败的关键。

如果把Kubernetes中的默认策略设置为不总是从注册表中拉取,则即使提交了更新后的改动并推送镜像,这些改动也可能不可见。在产品中推荐的解决方法是为每个镜像分配唯一标签,并在拉取请求中使用这些标签。此外在部署配置中指定不存在的持久卷(persistent volumes)也可能导致部署失败。

另外两种无效输入是缺少程序运行时ConfigMap或Secrets,以及无效的Spec对象。 ConfigMap是一组键值对的映射,该组键值对属于应用程序所需的配置数据。ConfigMap可以被指定为CLI参数,环境变量,或已安装卷中的文件。如果缺少了这些信息,那么Pod创建会停止,并且状态被设置为“RunContainerError”。Secrets是一种用于存储敏感数据(如证书)的机制。Secrets缺失将导致类似的问题。ConfigMap和Secrets都可以安装为卷,如果安装失败,则容器创建停止,事件日志的状态停留在“ContainerCreating”。

另一种部署失败的原因是无效的Kubernetes Spec对象,这些无效对象是由YAML中的缩进错误或拼写错误所导致。通过基于CLI的YAML验证和使用--dry-run参数,我们可以很容易地避免此类错误,如下所示:

kubectl create -f test-application.deploy.yaml --dry-run --validate=true

但该方法需要运行Kubernetes集群。移除对集群依赖的工作正在进行当中,同时也会提供对客户端验证的支持。YAML验证可以被添加到源控制系统中,成为预提交钩子(pre-commit hook)的一部分。

另一类失败的Kubernetes部署是因为超出资源限制。Pod和容器都有指定的CPU和内存限制。超出这些限制将导致无法创建Pod。调试该问题需要花一点精力。命令“kubectl describe deployment ”可以帮助我们获取ReplicaSet的名称,此ReplicaSet正是Kubernetes所尝试去创建的。键入“kubectrl describe replicaset ”,并把上一步中获取的副本集(replica set)名称传递给它,就可以像在其它情况下一样,打印出事件日志,并显示错误消息。

部署失败也可能是因为超出资源配额。当团队间共享节点数固定的集群时,这种资源配额机制可以用来限制每个命名空间的资源消耗。资源包括Pod,服务和部署,以及计算资源的总量。 同样,在这种情况下,“kubectl describe”命令能够帮助我们挖掘出实际的错误消息。

当节点未充分使用资源时或者由于资源不足而无法运行Pod时,集群自动调整程序(cluster autoscaler)会自动调整Kubernetes集群大小。如果该自动调整程序未被启用,那么超出资源配额的部署将会失败,并且Pod停留在“Pending”状态。 事件日志将显示出实际短缺的资源(由于该资源短缺而导致部署失败)。

应用程序行为的意外更改可能以不同的方式引起部署失败。应用程序崩溃常常会导致启动错误,该错误的错误消息是“CrashLoopBackOff”。应用程序日志可以帮助解决此问题。此外,如果配置错误或者响应超时,Liveness/Readiness探测可能会停止工作,该探测被Kubernetes用来检测服务的健康情况。例如,URL健康检查可能在应用程序中已发生变更,或者由于数据库变动,URL健康检查可能无法正常工作。某些URL可能需要一段时间才能响应Readiness检查,这可能会超时并导致部署失败。

文章的作者已开源一个脚本,当创建失败时,该脚本可以在日志里打印出有用的相关信息。

查看英文原文:Common Reasons for Failed Kubernetes Deployments

关键字:Kubernetes部署

本文摘自:INFOQ

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^