Skip to content

Commit

Permalink
sync github prod-community
Browse files Browse the repository at this point in the history
  • Loading branch information
yetlau111 committed Aug 17, 2023
1 parent ea31dd3 commit bcd61a6
Show file tree
Hide file tree
Showing 87 changed files with 658 additions and 319 deletions.
4 changes: 3 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -18,4 +18,6 @@
2. 加入腾讯蓝鲸社区交流群,与运维大佬们一起研究交流技术干货--腾讯蓝鲸社区交流群:495299374
3. 给我们写邮件:[email protected]

具体教程:[文档更新指引](./ZH/DocumentationContributorGuide/7.0/collaborateguide.md)
具体教程:[文档更新指引](./ZH/DocumentationContributorGuide/7.0/collaborateguide.md)


2 changes: 1 addition & 1 deletion ZH/DeploymentGuides/7.1/prepare-bkctrl.md
Original file line number Diff line number Diff line change
Expand Up @@ -74,7 +74,7 @@ yum install -y jq unzip uuid
# 安装下载脚本
CentOS 支持在当前用户的 `bin` 目录下安装命令:
``` bash
mkdir ~/bin/
mkdir -p ~/bin/
curl -sSf https://bkopen-1252002024.file.myqcloud.com/ce7/7.1-stable/bkdl-7.1-stable.sh -o ~/bin/bkdl-7.1-stable.sh
chmod +x ~/bin/bkdl-7.1-stable.sh
```
Expand Down
53 changes: 53 additions & 0 deletions ZH/DeploymentGuides/7.1/update.md
Original file line number Diff line number Diff line change
Expand Up @@ -24,3 +24,56 @@ cd ~/bkce7.1-install/blueking/ # 进入工作目录

遵循界面指引完成升级过程,等待 Agent 上报新的版本号,即升级完成。


## 更新 bk-user

| | chart 版本号 | 软件版本号 |
|--|--|--|
| 7.1.0 发布 | 1.4.14-beta.1 | 2.5.4-beta.1 |
| 20230815 功能更新 | 1.4.14-beta.7 | 2.5.4-beta.7 |

### 20230815 功能更新
本版本为问题修复。

登录到 **中控机**,先更新 helm 仓库缓存:
``` bash
helm repo update
```
检查仓库里的版本:
``` bash
helm search repo bk-user --version 1.4.14-beta.7
```
预期输出如下所示:
>``` plain
>NAME CHART VERSION APP VERSION DESCRIPTION
>blueking/bk-user 1.4.14-beta.7 3.6.2-rc.3 略
>```
接下来开始升级了。
先进入工作目录:
``` bash
cd ~/bkhelmfile/blueking # 默认路径,按实际情况修改。
```
修改 `environments/default/version.yaml` 文件,配置 bk-user charts version 为 `1.4.14-beta.7`
``` bash
sed -i 's/bk-user:.*/bk-user: "1.4.14-beta.7"/' environments/default/version.yaml
grep bk-user environments/default/version.yaml # 检查修改结果
```
预期输出:
>``` yaml
> bk-user: "1.4.14-beta.7"
>```
更新 bk-user:
``` bash
helmfile -f base-blueking.yaml.gotmpl -l name=bk-user apply
```
等待命令执行完毕,结尾输出如下即为更新成功:
>``` plain
>UPDATED RELEASES:
>NAME CHART VERSION
>bk-user blueking/bk-user 1.4.14-beta.7
>```
172 changes: 92 additions & 80 deletions ZH/Monitor/3.8/SUMMARY.md

Large diffs are not rendered by default.

Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
22 changes: 14 additions & 8 deletions ZH/Monitor/3.8/UserGuide/Overview/README.md
Original file line number Diff line number Diff line change
@@ -1,25 +1,31 @@
# 产品简介

监控平台是蓝鲸智云官方推出的一款监控平台产品,除了具有丰富的数据采集能力,大规模的数据处理能力,还具有强大的平台扩展能力。依托于蓝鲸 PaaS,在整个蓝鲸生态中可以形成监控的闭环能力,帮助业务真正建立覆盖CI-CD-CO的业务运营体系。
监控平台是蓝鲸智云官方推出的一款业务观测产品,具有丰富的数据采集能力,大数据处理能力,强大的平台扩展能力。依托于蓝鲸 PaaS,在整个蓝鲸生态中可以形成完整的观测的闭环能力,帮助业务真正建立覆盖CI-CD-CO的业务运营体系。

监控平台具有易用性、及时性、准确性、智能化、开放性、生态化等特性,致力于满足不同的监控场景需求和能力,为在线业务保驾护航,助力业务"运筹帷幄之中,决胜千里之外"。

蓝鲸监控平台的定位: 企业级、一站式、围绕业务的多维度的可观测平台。

* 企业级:主要是解决企业级大量数据的处理需求,所以不是简单的监控工具。
* 一站式:监控的领域很多,能力也非常的多,尽可能的提供一站式监控服务满足不同角色不同场景的诉求。
* 可观测平台:提供不同视角不同能力的综合性的可观测能力,最终都是为业务来服务。
**一站式、企业级、满足不同业务架构、快速准确告警并定位处理的平台。**

监控平台并不是简单的一个产品,是包含了监控领域多个产品的共同作用的结果。
![](media/16905480672130.jpg)

涉及到的产品有:

相关的产品:

1. 依赖PaaS、CMDB、节点管理、容器管理服务等
2. 日志数据:日志平台
3. 故障处理:故障自愈
4. 智能监控:计算平台和AIOps平台
5. 周边服务:JOB、标准运维、ITSM等

![](media/16611709680440.jpg)
支持可观测能力的6种数据:

1. Metrics 指标数据
2. Logs 日志数据
3. Traces 调用链数据
4. Events 事件数据
5. Profiling 性能数据
6. Alerts 告警数据

![](media/16905477946028.jpg)

16 changes: 4 additions & 12 deletions ZH/Monitor/3.8/UserGuide/Overview/benefits.md
Original file line number Diff line number Diff line change
@@ -1,25 +1,17 @@
## 核心优势

![](media/16611790412033.jpg)


1. **生态闭环:** 依托蓝鲸 PaaS 深度整合了 CMDB,故障自愈,日志平台,作业平台,节点管理,数据平台,工单等能力。随着生态的完善监控的智能化将更加强大
![](media/16611790600963.jpg)


2. **观测场景-开箱即用:** 默认的主机、进程监控,拨测能力,容器监控和APM,还有默认的系统事件,策略配置,可以满足基本的开箱即用
![](media/16611791037513.jpg)

3. **数据集成-支持采集管理:** 一个简单的脚本,就可以采集数据,支持脚本的在线调试采集,全生命周期托管,无需考虑脚本如何部署如何管理问题。支持 Prometheus 的 Exporter 数据采集格式,可以简单的将 Exporter 迁移至监控平台的插件。

3. **数据集成-支持采集管理:** 一个简单的脚本,就可以采集数据,支持脚本的在线调试采集,全生命周期托管,无需考虑脚本如何部署如何管理问题。
支持 Prometheus 的 Exporter 数据采集格式,可以简单的将 Exporter 迁移至监控平台的插件。
支持远程采集
![](media/16622103216329.jpg)
4. **SDK上报:** 支持通过 HTTP、Prometheus SDK、OpenTelemetry SDK 自定义上报时序和事件数据。

4. **SDK上报** 支持通过 HTTP、Prometheus SDK、Opentelemetry SDK 自定义上报时序和事件数据。
5. **告警配置-告警及自愈** 灵活的策略配置满足单机,单实例,集群,多维度等告警需求;内置了 8 种静态检测算法、3种智能检测算法;多种告警收敛等防止告警风暴等

5. **告警配置-告警及自愈:** 灵活的策略配置满足单机,单实例,集群,多维度等告警需求;内置了 8 种检测算法;多种告警收敛等防止告警风暴等
![](media/16611791274210.jpg)
![](media/16906057539153.jpg)



Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
10 changes: 6 additions & 4 deletions ZH/Monitor/3.8/UserGuide/ProductArchitecture/datamodule.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,7 +2,7 @@

数据模型主要是介绍监控的数据上报格式、存储格式和监控管理运作的关系。

### 用户关心的数据分层
### 数据分层

不管是以什么方式进行数据的采集,上报;不论数据是从哪上报上来;不论是时序数据,事件数据还是日志数据都是为用户关心的数据分层而服务。

Expand Down Expand Up @@ -55,7 +55,7 @@
![](media/16612221352204.jpg)


## 监控平台基本数据结构
## 数据结构

### 自定义事件数据

Expand Down Expand Up @@ -85,7 +85,7 @@
}
```

### 时序数据结构
### 自定义时序数据结构

```json
{
Expand Down Expand Up @@ -129,6 +129,8 @@ http_request_total{status="404", method="POST", route="/user"} 94334

## Trace 的数据结构

支持Opentelemetry和OpenTracing
支持OpenTelemetry和OpenTracing

[OpenTelemetry介绍](integrations-traces/opentelemetry_overview.md)


Binary file not shown.
Binary file not shown.
Binary file not shown.
Binary file not shown.
Diff not rendered.
Original file line number Diff line number Diff line change
Expand Up @@ -6,21 +6,6 @@
1. 数据类型:指标数据,支持多维度的指标数据
2. 数据来源:监控采集,默认上报的,计算平台tspider的可以在监控查看到的数据。 自定义上报和日志的数据不包括在内。

### 配置方法

1. 监控数据中选择添加监控指标。
![](media/16614288675108.jpg)

2. 模型名称中选择“通用时间序列预测_小时级别”。
![](media/16614344829086.jpg)
3. 配置 是否为线性预测 和 预测时长。
4. 配置阈值,当满足阈值条件时将触发告警。
5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练

### 适用的数据场景

时序预测适用于大部分时序指标,特别适用于以下两种场景。


#### 场景一:指标呈现周期性波动

Expand All @@ -37,3 +22,16 @@
![](media/16614345294248.jpg)



### 配置方法

1. 监控数据中选择添加监控指标。
![](media/16614288675108.jpg)
![](media/16921698735590.jpg)

2. 模型名称中选择“通用时间序列预测_小时级别”。
![](media/16614344829086.jpg)
3. 配置 是否为线性预测 和 预测时长。
4. 配置阈值,当满足阈值条件时将触发告警。
5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练

Original file line number Diff line number Diff line change
Expand Up @@ -8,27 +8,6 @@ AIOps相关的能力依赖蓝鲸AIOps平台,蓝鲸监控对接了AIOps平台
1. 数据类型:指标数据,支持多维度的指标数据
2. 数据来源:监控采集,默认上报的,计算平台tspider的可以在监控查看到的数据。 自定义上报和日志的数据不包括在内。

### 配置方法

1. 监控数据中选择添加监控指标。
![](media/16614288675108.jpg)

2. 模型名称中选择“通用智能异常检测模型”。
![](media/16614288805917.jpg)
3. 配置希望检测的异常方向:向上、向下。
4. 配置敏感度,如果不清楚可以先不动,等有效果之后再根据告警情况进行调整,敏感度越高命中的告警更多,敏感度越低命中的告警越少。
PS:配置完成后有一段时间的延迟,并且智能学习有一定的学习过程。
![](media/16614288981493.jpg)
5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练
![](media/16614289123180.jpg)



### 适用的数据场景

智能异常检测适用于大部分时序指标,特别适用于以下三种场景。


#### 场景一:指标呈现周期性波动

当指标呈现周期性波动时,难以设置合理的静态阈值来检出图中明显的异常点,该场景下使用智能异常检测,既能保证检测的准确性,也能避免重复告警对用户的骚扰。
Expand All @@ -52,3 +31,24 @@ AIOps相关的能力依赖蓝鲸AIOps平台,蓝鲸监控对接了AIOps平台
![](media/16614289388258.jpg)




### 配置方法

1. 监控数据中选择添加监控指标。
![](media/16614288675108.jpg)

2. 模型名称中选择“通用智能异常检测模型”。
![](media/16914642718256.jpg)

3. 配置希望检测的异常方向:向上、向下。
4. 配置敏感度,如果不清楚可以先不动,等有效果之后再根据告警情况进行调整,敏感度越高命中的告警更多,敏感度越低命中的告警越少。
PS:配置完成后有一段时间的延迟,并且智能学习有一定的学习过程。
![](media/16914641915372.jpg)

5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练
![](media/16614289123180.jpg)




Diff not rendered.
Diff not rendered.
Original file line number Diff line number Diff line change
Expand Up @@ -17,8 +17,6 @@
1. 如果产生了高级别告警,同维度低级别告警会立即恢复。
2. 如果存在高级别告警,低级别告警不会产生

## 告警降噪


## 告警汇总

Expand Down
Diff not rendered.
Diff not rendered.
Diff not rendered.
Diff not rendered.
Loading

0 comments on commit bcd61a6

Please sign in to comment.