k8s平台:手动部署Grafana
以下是一个可用于生产环境的 Kubernetes 部署 Grafana 的 YAML 文件。该配置包括 Deployment、Service、ConfigMap 和 PersistentVolumeClaim,确保 Grafana 的高可用性和数据持久化。
Grafana 生产部署 YAML 文件
☆实操示例
cat grafana-deployment.yaml
---
# Grafana Deployment
apiVersion: apps/v1
kind: Deployment
metadata:name: grafananamespace: monitoringlabels:app: grafana
spec:replicas: 2 # 副本数量,生产环境可根据需求调整selector:matchLabels:app: grafanatemplate:metadata:labels:app: grafanaspec:containers:- name: grafanaimage: harbor.fq.com/prometheus/grafana:9.5.3 # 建议使用固定版本,如 grafana/grafana:9.5.2ports:- containerPort: 3000 # Grafana 默认运行端口env:- name: GF_SECURITY_ADMIN_USERvalue: "admin" # 管理员用户名,生产环境建议修改- name: GF_SECURITY_ADMIN_PASSWORDvalue: "Abc123!" # 管理员密码,生产环境建议使用更强的密码- name: GF_INSTALL_PLUGINSvalue: "grafana-clock-panel,grafana-piechart-panel" # 需要安装的 Grafana 插件readinessProbe:httpGet:path: /api/health # 就绪探针,检测 Grafana 是否健康port: 3000initialDelaySeconds: 10 # 等待 10 秒后开始探测periodSeconds: 10 # 每 10 秒进行一次探测livenessProbe:httpGet:path: /api/health # 存活探针,检测 Grafana 是否正常运行port: 3000initialDelaySeconds: 30 # 等待 30 秒后开始探测periodSeconds: 60 # 每 60 秒进行一次探测volumeMounts:- name: grafana-storagemountPath: /var/lib/grafana # 挂载存储目录,存放 Grafana 数据- name: grafana-configmountPath: /etc/grafana/grafana.ini # 挂载配置文件subPath: grafana.ini # 只映射 configMap 中的 grafana.ini 文件volumes:- name: grafana-storageemptyDir: {} # 使用 emptyDir,不持久化存储数据,Pod 重启后数据会丢失- name: grafana-configconfigMap:name: grafana-config # 关联 ConfigMap,提供 Grafana 配置文件
---
# Grafana 配置文件 ConfigMap
apiVersion: v1
kind: ConfigMap
metadata:name: grafana-confignamespace: monitoring
data:grafana.ini: |[server]http_port = 3000 # Grafana 监听端口root_url = %(protocol)s://%(domain)s:%(http_port)s/[database]type = sqlite3 # 默认使用 SQLite 数据库path = /var/lib/grafana/grafana.db # 数据库存放路径[security]admin_user = admin # 管理员用户名admin_password = Abc123! # 管理员密码[users]default_theme = light # 默认 UI 主题(light / dark)[auth.anonymous]enabled = true # 允许匿名访问(默认 Viewer 权限)org_name = Main Org.org_role = Viewer
---
# Grafana Service (NodePort 方式暴露)
apiVersion: v1
kind: Service
metadata:name: grafananamespace: monitoringlabels:app: grafana
spec:type: NodePort # 使用 NodePort 方式暴露 Grafanaports:- port: 3000 # Service 端口targetPort: 3000 # Grafana 容器内部端口protocol: TCPnodePort: 32000 # 指定 NodePort 端口,范围 30000-32767selector:app: grafana # 关联到 app=grafana 的 Pod
---
# Grafana Deployment
apiVersion: apps/v1
kind: Deployment
metadata:name: grafananamespace: monitoringlabels:app: grafana
spec:replicas: 2 # 根据需求调整副本数selector:matchLabels:app: grafanatemplate:metadata:labels:app: grafanaspec:containers:- name: grafanaimage: grafana/grafana:latest # 建议使用固定版本,如 grafana/grafana:9.5.2ports:- containerPort: 3000env:- name: GF_SECURITY_ADMIN_USERvalue: "admin" # 生产环境建议使用更安全的用户名- name: GF_SECURITY_ADMIN_PASSWORDvalue: "StrongPassword123!" # 生产环境建议使用强密码- name: GF_INSTALL_PLUGINSvalue: "grafana-clock-panel,grafana-piechart-panel" # 可选:安装插件readinessProbe:httpGet:path: /api/healthport: 3000initialDelaySeconds: 10periodSeconds: 10livenessProbe:httpGet:path: /api/healthport: 3000initialDelaySeconds: 30periodSeconds: 60volumeMounts:- name: grafana-storagemountPath: /var/lib/grafana- name: grafana-configmountPath: /etc/grafana/grafana.inisubPath: grafana.inivolumes:- name: grafana-storagepersistentVolumeClaim:claimName: grafana-pvc- name: grafana-configconfigMap:name: grafana-config
---
# Grafana ConfigMap (配置文件)
apiVersion: v1
kind: ConfigMap
metadata:name: grafana-confignamespace: monitoring
data:grafana.ini: |[server]http_port = 3000root_url = %(protocol)s://%(domain)s:%(http_port)s/[database]type = sqlite3path = /var/lib/grafana/grafana.db[security]admin_user = adminadmin_password = StrongPassword123![users]default_theme = light[auth.anonymous]enabled = trueorg_name = Main Org.org_role = Viewer
---
# Grafana PersistentVolumeClaim (数据持久化)
apiVersion: v1
kind: PersistentVolumeClaim
metadata:name: grafana-pvcnamespace: monitoring
spec:accessModes:- ReadWriteOnceresources:requests:storage: 10Gi # 根据需求调整存储大小storageClassName: standard # 根据集群的 StorageClass 调整
---
# Grafana Service (暴露服务)
apiVersion: v1
kind: Service
metadata:name: grafananamespace: monitoringlabels:app: grafana
spec:type: ClusterIP # 生产环境建议使用 ClusterIP,配合 Ingress 暴露服务ports:- port: 3000targetPort: 3000protocol: TCPselector:app: grafana
---
# Grafana Ingress (可选,用于外部访问)
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:name: grafana-ingressnamespace: monitoringannotations:nginx.ingress.kubernetes.io/ssl-redirect: "true"nginx.ingress.kubernetes.io/force-ssl-redirect: "true"cert-manager.io/cluster-issuer: "letsencrypt-prod" # 使用 cert-manager 自动管理 TLS 证书
spec:tls:- hosts:- grafana.example.com # 替换为你的域名secretName: grafana-tlsrules:- host: grafana.example.com # 替换为你的域名http:paths:- path: /pathType: Prefixbackend:service:name: grafanaport:number: 3000
关键配置说明
-
Deployment:
- 使用
replicas: 2
确保高可用性。 - 通过环境变量设置管理员用户名和密码。
- 配置了
readinessProbe
和livenessProbe
以确保 Grafana 的健康状态。 - 挂载了持久化存储卷 (
PersistentVolumeClaim
) 和配置文件 (ConfigMap
)。
- 使用
-
ConfigMap:
- 包含
grafana.ini
配置文件,用于自定义 Grafana 的行为。 - 配置了匿名访问、数据库路径等。
- 包含
-
PersistentVolumeClaim:
- 使用持久化存储确保 Grafana 的数据(如仪表盘、用户配置)不会丢失。
- 可以根据需求调整存储大小和
StorageClass
。
-
Service:
- 使用
ClusterIP
类型,仅在集群内部暴露服务。 - 如果需要外部访问,可以通过
Ingress
暴露。
- 使用
-
Ingress(可选):
- 使用
Ingress
和cert-manager
自动管理 TLS 证书。 - 配置了 HTTPS 强制跳转以提高安全性。
- 使用
部署步骤
-
将上述 YAML 文件保存为
grafana-deployment.yaml
。 -
使用
kubectl
部署 Grafana:kubectl apply -f grafana-deployment.yaml
-
检查部署状态:
kubectl get pods -n monitoring kubectl get svc -n monitoring kubectl get ingress -n monitoring
-
访问 Grafana:
-
如果使用了
Ingress
,可以通过https://grafana.example.com
访问。 -
如果未使用
Ingress
,可以通过kubectl port-forward
临时访问:kubectl port-forward svc/grafana -n monitoring 3000:3000
然后访问
http://localhost:3000
。
-
生产环境建议
-
使用固定版本的镜像:
- 避免使用
latest
标签,改为固定版本(如grafana/grafana:9.5.2
)。
- 避免使用
-
启用身份验证:
- 配置 OAuth、LDAP 或 SAML 集成,避免使用默认的管理员账号。
-
备份数据:
- 定期备份 Grafana 的持久化数据(如
/var/lib/grafana
)。
- 定期备份 Grafana 的持久化数据(如
-
监控 Grafana:
- 使用 Prometheus 监控 Grafana 的性能和健康状态。
希望这个配置能帮助你顺利部署 Grafana!如果有其他问题,请随时告诉我。