diff --git a/README.md b/README.md index 589425dbc..0a5c8f3b0 100644 --- a/README.md +++ b/README.md @@ -18,4 +18,6 @@ 2. 加入腾讯蓝鲸社区交流群,与运维大佬们一起研究交流技术干货--腾讯蓝鲸社区交流群:495299374 3. 给我们写邮件:contactus_bk@tencent.com -具体教程:[文档更新指引](./ZH/DocumentationContributorGuide/7.0/collaborateguide.md) \ No newline at end of file +具体教程:[文档更新指引](./ZH/DocumentationContributorGuide/7.0/collaborateguide.md) + + diff --git a/ZH/DeploymentGuides/7.1/prepare-bkctrl.md b/ZH/DeploymentGuides/7.1/prepare-bkctrl.md index a8343ee22..1be1bf988 100644 --- a/ZH/DeploymentGuides/7.1/prepare-bkctrl.md +++ b/ZH/DeploymentGuides/7.1/prepare-bkctrl.md @@ -74,7 +74,7 @@ yum install -y jq unzip uuid # 安装下载脚本 CentOS 支持在当前用户的 `bin` 目录下安装命令: ``` bash -mkdir ~/bin/ +mkdir -p ~/bin/ curl -sSf https://bkopen-1252002024.file.myqcloud.com/ce7/7.1-stable/bkdl-7.1-stable.sh -o ~/bin/bkdl-7.1-stable.sh chmod +x ~/bin/bkdl-7.1-stable.sh ``` diff --git a/ZH/DeploymentGuides/7.1/update.md b/ZH/DeploymentGuides/7.1/update.md index 8787bf9da..cdcfee597 100644 --- a/ZH/DeploymentGuides/7.1/update.md +++ b/ZH/DeploymentGuides/7.1/update.md @@ -24,3 +24,56 @@ cd ~/bkce7.1-install/blueking/ # 进入工作目录 遵循界面指引完成升级过程,等待 Agent 上报新的版本号,即升级完成。 + +## 更新 bk-user + +| | chart 版本号 | 软件版本号 | +|--|--|--| +| 7.1.0 发布 | 1.4.14-beta.1 | 2.5.4-beta.1 | +| 20230815 功能更新 | 1.4.14-beta.7 | 2.5.4-beta.7 | + +### 20230815 功能更新 +本版本为问题修复。 + +登录到 **中控机**,先更新 helm 仓库缓存: +``` bash +helm repo update +``` +检查仓库里的版本: +``` bash +helm search repo bk-user --version 1.4.14-beta.7 +``` +预期输出如下所示: +>``` plain +>NAME CHART VERSION APP VERSION DESCRIPTION +>blueking/bk-user 1.4.14-beta.7 3.6.2-rc.3 略 +>``` + +接下来开始升级了。 + +先进入工作目录: +``` bash +cd ~/bkhelmfile/blueking # 默认路径,按实际情况修改。 +``` + +修改 `environments/default/version.yaml` 文件,配置 bk-user charts version 为 `1.4.14-beta.7`: +``` bash +sed -i 's/bk-user:.*/bk-user: "1.4.14-beta.7"/' environments/default/version.yaml +grep bk-user environments/default/version.yaml # 检查修改结果 +``` +预期输出: +>``` yaml +> bk-user: "1.4.14-beta.7" +>``` + +更新 bk-user: +``` bash +helmfile -f base-blueking.yaml.gotmpl -l name=bk-user apply +``` + +等待命令执行完毕,结尾输出如下即为更新成功: +>``` plain +>UPDATED RELEASES: +>NAME CHART VERSION +>bk-user blueking/bk-user 1.4.14-beta.7 +>``` diff --git a/ZH/Monitor/3.8/SUMMARY.md b/ZH/Monitor/3.8/SUMMARY.md index 4f98662ea..2d10f0cdc 100644 --- a/ZH/Monitor/3.8/SUMMARY.md +++ b/ZH/Monitor/3.8/SUMMARY.md @@ -8,132 +8,144 @@ * [产品架构]() * [架构图](UserGuide/ProductArchitecture/architecture.md) * [数据模型](UserGuide/ProductArchitecture/datamodule.md) + * [监控空间](UserGuide/ProductArchitecture/namespace.md) * [快速入门]() * [入门须知](UserGuide/QuickStart/README.md) * [准备工作](UserGuide/QuickStart/prepare.md) * [权限申请](UserGuide/QuickStart/perm.md) * [快速接入案例](UserGuide/QuickStart/best_practices.md) * [PC端导航说明](UserGuide/QuickStart/menu.md) - * [移动端使用说明](UserGuide/QuickStart/h5_app.md) + * [移动端说明](UserGuide/QuickStart/h5_app.md) * [SDK接入说明](UserGuide/QuickStart/sdk_list.md) + * [BKMonitor As Code](UserGuide/QuickStart/as_code.md) * [产品功能]() * [采集器]() * [监控采集器安装](UserGuide/ProductFeatures/collectors/install.md) - * [bkmonitorbeat 4合1升级](UserGuide/ProductFeatures/collectors/bkmonitorbeat_upgrade.md) * [采集器FAQ](UserGuide/ProductFeatures/collectors/collectors_faq.md) - * [集成-指标插件制作]() - * [插件制作快速入门](UserGuide/ProductFeatures/integrations-metric-plugins/plugins.md) - * [制作 Script 插件 - 多种语言类型](UserGuide/ProductFeatures/integrations-metric-plugins/script_collect.md) - * [制作 Exporter 插件 - 复用Prometheus插件](UserGuide/ProductFeatures/integrations-metric-plugins/import_exporter.md) - * [制作 BK-Pull 插件 - 直接拉取Prometheus数据](UserGuide/ProductFeatures/integrations-metric-plugins/howto_bk-pull.md) - * [制作 DataDog 插件](UserGuide/ProductFeatures/integrations-metric-plugins/import_datadog_online.md) - * [制作 JMX 插件](UserGuide/ProductFeatures/integrations-metric-plugins/plugin_jmx.md) - * [制作 SNMP 指标插件](UserGuide/ProductFeatures/integrations-metric-plugins/plugin_snmp.md) - * [内置自带插件](UserGuide/ProductFeatures/integrations-metric-plugins/builtin_plugins.md) - * [集成-指标数据接入]() + * [集成-指标插件]() + * [开始插件制作](UserGuide/ProductFeatures/integrations-metric-plugins/plugins.md) + * [插件制作 Script](UserGuide/ProductFeatures/integrations-metric-plugins/script_collect.md) + * [插件制作 Exporter](UserGuide/ProductFeatures/integrations-metric-plugins/import_exporter.md) + * [插件制作 BK-Pull](UserGuide/ProductFeatures/integrations-metric-plugins/howto_bk-pull.md) + * [插件制作 DataDog](UserGuide/ProductFeatures/integrations-metric-plugins/import_datadog_online.md) + * [插件制作 JMX ](UserGuide/ProductFeatures/integrations-metric-plugins/plugin_jmx.md) + * [插件制作 SNMP](UserGuide/ProductFeatures/integrations-metric-plugins/plugin_snmp.md) + * [官方插件列表](UserGuide/ProductFeatures/integrations-metric-plugins/builtin_plugins.md) + * [集成-指标数据]() * [什么是指标和维度](UserGuide/ProductFeatures/integrations-metrics/what_metrics.md) * [指标输出量级参考](UserGuide/ProductFeatures/integrations-metrics/recommend_metrics.md) * [开始指标数据采集](UserGuide/ProductFeatures/integrations-metrics/collect_tasks.md) - * [如何实现多实例采集](UserGuide/ProductFeatures/integrations-metrics/multi_instance_monitor.md) - * [采集参数的内置变量列表](UserGuide/ProductFeatures/integrations-metrics/variables.md) + * [内置变量列表](UserGuide/ProductFeatures/integrations-metrics/variables.md) + * [HTTP简易上报](UserGuide/ProductFeatures/integrations-metrics/custom_metrics_http.md) + * [集成Prom SDK](UserGuide/ProductFeatures/integrations-metrics/custom_sdk_push.md) + * [Prom SDK Java 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_java.md) + * [Prom SDK Golang 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_golang.md) + * [Prom SDK Python 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_python.md) + * [Prom SDK C++ 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_cpp.md) * [如何对开源组件进行监控](UserGuide/ProductFeatures/integrations-metrics/component_monitor.md) - * [无 Agent 如何实现数据上报](UserGuide/ProductFeatures/integrations-metrics/noagent_monitor.md) - * [自定义指标上报-HTTP JSON](UserGuide/ProductFeatures/integrations-metrics/custom_metrics_http.md) - * [自定义指标上报-SDK PUSH上报](UserGuide/ProductFeatures/integrations-metrics/custom_sdk_push.md) - * [Prometheus SDK Java 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_java.md) - * [Prometheus SDK Golang 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_golang.md) - * [Prometheus SDK Python 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_python.md) - * [Prometheus SDK C++ 使用说明](UserGuide/ProductFeatures/integrations-metrics/prom_sdk_cpp.md) + * [如何实现多实例采集](UserGuide/ProductFeatures/integrations-metrics/multi_instance_monitor.md) + * [如何实现无 Agent 数据上报](UserGuide/ProductFeatures/integrations-metrics/noagent_monitor.md) * [自定义指标上报-FAQ](UserGuide/ProductFeatures/integrations-metrics/custom_metrics_faq.md) - * [集成-Trace数据接入]() - * [OpenTelemetry介绍](UserGuide/ProductFeatures/integrations-traces/opentelemetry_overview.md) - * [Opentelemetry SDK Java 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_java.md) - * [Opentelemetry SDK Golang 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_golang.md) - * [Opentelemetry SDK Python 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_python.md) - * [Opentelemetry SDK C++ 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_cpp.md) - * [Opentelemetry SDK 蓝鲸SaaS框架使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_bksaas.md) - * [Opentelemetry SDK 接入无数据排查思路](UserGuide/ProductFeatures/integrations-traces/otel_sdk_faq.md) - * [集成-事件数据接入]() - * [自定义事件上报-HTTP JSON](UserGuide/ProductFeatures/integrations-events/custom_events_http.md) - * [自定义上报命令行工具](UserGuide/ProductFeatures/integrations-events/custom_report_tools.md) - * [SNMP Trap 使⽤说明](UserGuide/ProductFeatures/integrations-events/snmp_trap.md) - * [字符型告警-gsecmdline](UserGuide/ProductFeatures/integrations-events/custom_events_gsecmdline.md) - * [集成-监控源接入]() - * [监控源接入说明](UserGuide/ProductFeatures/integrations-alerts/custom_alerts_source.md) - * [监控源插件制作](UserGuide/ProductFeatures/integrations-alerts/plugin_alerts.md) - * [数据查询-可视化]() - * [数据可视化介绍](UserGuide/ProductFeatures/data-visualization/data_view_intro.md) - * [首页数据介绍](UserGuide/ProductFeatures/data-visualization/home.md) - * [仪表盘功能介绍](UserGuide/ProductFeatures/data-visualization/dashboard.md) - * [数据报表-邮件订阅](UserGuide/ProductFeatures/data-visualization/report_email.md) - * [数据检索-指标检索](UserGuide/ProductFeatures/data-visualization/explore_metrics.md) - * [数据检索-事件检索](UserGuide/ProductFeatures/data-visualization/explore_events.md) - * [数据检索-日志检索](UserGuide/ProductFeatures/data-visualization/explore_logs.md) - * [数据检索-Trace检索](UserGuide/ProductFeatures/data-visualization/explore_traces.md) - * [数据采集-检查视图](UserGuide/ProductFeatures/data-visualization/data_quick_view.md) - * [指标数据-多指标计及函数](UserGuide/ProductFeatures/data-visualization/mutil_metric.md) - * [告警策略-配置及管理]() + * [集成-Trace数据]() + * [什么是OpenTelemetry](UserGuide/ProductFeatures/integrations-traces/opentelemetry_overview.md) + * [OTel SDK Java 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_java.md) + * [OTel SDK Golang 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_golang.md) + * [OTel SDK Python 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_python.md) + * [OTel SDK C++ 使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_cpp.md) + * [蓝鲸SaaS框架使用说明](UserGuide/ProductFeatures/integrations-traces/otel_sdk_bksaas.md) + * [Trace接入-FAQ](UserGuide/ProductFeatures/integrations-traces/otel_sdk_faq.md) + * [集成-事件数据]() + * [事件上报-HTTP JSON](UserGuide/ProductFeatures/integrations-events/custom_events_http.md) + * [事件上报-命令行工具](UserGuide/ProductFeatures/integrations-events/custom_report_tools.md) + * [SNMP Trap 采集插件](UserGuide/ProductFeatures/integrations-events/snmp_trap.md) + * [字符型上报-gsecmdline工具](UserGuide/ProductFeatures/integrations-events/custom_events_gsecmdline.md) + * [集成-告警源]() + * [告警源接入说明](UserGuide/ProductFeatures/integrations-alerts/custom_alerts_source.md) + * [告警源插件制作](UserGuide/ProductFeatures/integrations-alerts/plugin_alerts.md) + * [数据探索-可视化]() + * [数据可视化](UserGuide/ProductFeatures/data-visualization/data_view_intro.md) + * [首页数据](UserGuide/ProductFeatures/data-visualization/home.md) + * [仪表盘](UserGuide/ProductFeatures/data-visualization/dashboard.md) + * [邮件订阅](UserGuide/ProductFeatures/data-visualization/report_email.md) + * [临时分享](UserGuide/ProductFeatures/data-visualization/share.md) + * [指标检索](UserGuide/ProductFeatures/data-visualization/explore_metrics.md) + * [事件检索](UserGuide/ProductFeatures/data-visualization/explore_events.md) + * [日志检索](UserGuide/ProductFeatures/data-visualization/explore_logs.md) + * [Trace检索](UserGuide/ProductFeatures/data-visualization/explore_traces.md) + * [数据采集可视化](UserGuide/ProductFeatures/data-visualization/data_quick_view.md) + * [多指标计算及PromQL](UserGuide/ProductFeatures/data-visualization/mutil_metric.md) + * [告警配置-策略]() * [告警策略创建](UserGuide/ProductFeatures/alarm-configurations/rules.md) - * [告警组及轮值](UserGuide/ProductFeatures/alarm-configurations/alarm_group.md) * [检测算法说明](UserGuide/ProductFeatures/alarm-configurations/algorithms.md) - * [告警收敛-通知收敛和汇总机制](UserGuide/ProductFeatures/alarm-configurations/coverge.md) - * [告警通知-如何自定义通知模版](UserGuide/ProductFeatures/alarm-configurations/notify_case.md) - * [告警通知-添加新的通知渠道](UserGuide/ProductFeatures/alarm-configurations/notify_setting.md) - * [日志告警策略-直接在客户端判断](UserGuide/ProductFeatures/alarm-configurations/keywords_event.md) - * [日志告警策略-监控ES存储的数据](UserGuide/ProductFeatures/alarm-configurations/log_monitor.md) - * [关联告警策略-多个告警事件同时产生](UserGuide/ProductFeatures/alarm-configurations/composite_monitor.md) + * [日志告警-来源采集端](UserGuide/ProductFeatures/alarm-configurations/keywords_event.md) + * [日志告警-来源日志平台](UserGuide/ProductFeatures/alarm-configurations/log_monitor.md) + * [指标监控-来源计算平台](UserGuide/ProductFeatures/alarm-configurations/bigdata_monitor.md) + * [关联告警策略](UserGuide/ProductFeatures/alarm-configurations/composite_monitor.md) * [事件告警策略](UserGuide/ProductFeatures/alarm-configurations/events_monitor.md) - * [指标告警策略-监控计算平台的数据](UserGuide/ProductFeatures/alarm-configurations/bigdata_monitor.md) - * [基于日历服务告警](UserGuide/ProductFeatures/alarm-configurations/calendar_rules.md) + * [关联日历服务](UserGuide/ProductFeatures/alarm-configurations/calendar_rules.md) * [如何进行秒级监控](UserGuide/ProductFeatures/alarm-configurations/collect_interval.md) - * [告警策略-智能检测]() - * [单指标智能异常检测](UserGuide/ProductFeatures/aiops/aiops_metrics_intelligent_detect.md) - * [单指标智能预测](UserGuide/ProductFeatures/aiops/aiops_metrics_forecast.md) - * [告警通知-事件分析]() - * [查看告警事件](UserGuide/ProductFeatures/alarm-analysis/alerts.md) - * [查看告警处理明细](UserGuide/ProductFeatures/alarm-analysis/alert_recording.md) - * [告警通知内容说明](UserGuide/ProductFeatures/alarm-analysis/messages_example.md) + * [告警通知及管理]() + * [通知收敛和汇总](UserGuide/ProductFeatures/alarm-configurations/coverge.md) + * [告警组及轮值](UserGuide/ProductFeatures/alarm-configurations/alarm_group.md) + * [告警分派](UserGuide/ProductFeatures/alarm-configurations/alarm_routing.md) + * [告警屏蔽](UserGuide/ProductFeatures/alarm-handling/block.md) + * [不同告警屏蔽的区别](UserGuide/ProductFeatures/alarm-handling/block_case1.md) + * [如何自定义通知模版](UserGuide/ProductFeatures/alarm-configurations/notify_case.md) + * [如何添加新的通知渠道](UserGuide/ProductFeatures/alarm-configurations/notify_setting.md) * [告警处理-故障自愈]() - * [告警屏蔽功能说明](UserGuide/ProductFeatures/alarm-handling/block.md) - * [不同告警屏蔽处理的区别](UserGuide/ProductFeatures/alarm-handling/block_case1.md) * [什么是故障自愈](UserGuide/ProductFeatures/alarm-handling/what_fta.md) - * [快速使用故障自愈能力](UserGuide/ProductFeatures/alarm-handling/fta_quickstart.md) + * [开启故障自愈](UserGuide/ProductFeatures/alarm-handling/fta_quickstart.md) * [快捷套餐列表](UserGuide/ProductFeatures/alarm-handling/solutions_express.md) - * [套餐内置变量](UserGuide/ProductFeatures/alarm-handling/solutions_parameters_all.md) + * [内置变量列表](UserGuide/ProductFeatures/alarm-handling/solutions_parameters_all.md) * [防御规则列表](UserGuide/ProductFeatures/alarm-handling/solutions_convergence_rules.md) * [处理套餐-HTTP回调](UserGuide/ProductFeatures/alarm-handling/solutions_http_callback.md) * [处理套餐-作业平台](UserGuide/ProductFeatures/alarm-handling/solutions_job.md) * [处理套餐-标准运维](UserGuide/ProductFeatures/alarm-handling/solutions_sops.md) * [处理套餐-流程服务](UserGuide/ProductFeatures/alarm-handling/solutions_itsm.md) * [案例:微信群自定义机器人](UserGuide/ProductFeatures/alarm-handling/solutions_http_callback_case1.md) + * [告警查看和分析]() + * [告警事件](UserGuide/ProductFeatures/alarm-analysis/alerts.md) + * [告警处理明细](UserGuide/ProductFeatures/alarm-analysis/alert_recording.md) + * [通知内容说明](UserGuide/ProductFeatures/alarm-analysis/messages_example.md) + * [智能监控]() + * [单指标异常检测](UserGuide/ProductFeatures/aiops/aiops_metrics_intelligent_detect.md) + * [单指标预测](UserGuide/ProductFeatures/aiops/aiops_metrics_forecast.md) + * [离群检测](UserGuide/ProductFeatures/aiops/aiops_metrics_outline.md) + * [场景检测](UserGuide/ProductFeatures/aiops/aiops_multi_metrics_detect.md) + * [告警分析-多维度下钻](UserGuide/ProductFeatures/aiops/aiops_multidimensional.md) + * [告警分析-指标推荐](UserGuide/ProductFeatures/aiops/aiops_similar_metrics.md) * [观测场景-主机监控]() * [开启主机监控](UserGuide/ProductFeatures/scene-host/host_monitor.md) * [主机指标说明](UserGuide/ProductFeatures/scene-host/host_metrics.md) - * [主机系统事件说明](UserGuide/ProductFeatures/scene-host/host_events.md) + * [主机事件说明](UserGuide/ProductFeatures/scene-host/host_events.md) * [主机策略说明](UserGuide/ProductFeatures/scene-host/builtin_host_rules.md) * [观测场景-进程监控]() * [开启进程监控](UserGuide/ProductFeatures/scene-process/process_monitor_overview.md) - * [基于CMDB配置的进程监控](UserGuide/ProductFeatures/scene-process/process_cmdb_monitor.md) - * [基于动态进程采集插件的进程监控](UserGuide/ProductFeatures/scene-process/process_pattern_monitor.md) - * [CMDB的各种进程配置方法](UserGuide/ProductFeatures/scene-process/process_cases.md) * [进程指标说明](UserGuide/ProductFeatures/scene-process/process_metrics.md) * [进程策略说明](UserGuide/ProductFeatures/scene-process/process_default_rules.md) + * [进程监控-基于CMDB](UserGuide/ProductFeatures/scene-process/process_cmdb_monitor.md) + * [进程监控-采集插件](UserGuide/ProductFeatures/scene-process/process_pattern_monitor.md) + * [CMDB的进程配置方法](UserGuide/ProductFeatures/scene-process/process_cases.md) * [观测场景-k8s监控]() * [开启容器监控](UserGuide/ProductFeatures/scene-k8s/k8s_monitor_overview.md) + * [容器监控组件](UserGuide/ProductFeatures/scene-k8s/k8s_monitor_operator.md) * [容器指标说明](UserGuide/ProductFeatures/scene-k8s/k8s_metrics.md) - * [k8s策略说明](UserGuide/ProductFeatures/scene-k8s/k8s_default_rules.md) - * [迁移Prometheus](UserGuide/ProductFeatures/scene-k8s/howto_migrate_prometheus.md) + * [容器事件说明](UserGuide/ProductFeatures/scene-k8s/k8s_events.md) + * [容器策略说明](UserGuide/ProductFeatures/scene-k8s/k8s_default_rules.md) + * [VS Prometheus](UserGuide/ProductFeatures/scene-k8s/howto_migrate_prometheus.md) * [观测场景-综合拨测]() * [开启综合拨测](UserGuide/ProductFeatures/scene-synthetic/synthetic_monitor.md) + * [拨测指标说明](UserGuide/ProductFeatures/scene-synthetic/synthetic_metrics.md) + * [拨测策略说明](UserGuide/ProductFeatures/scene-synthetic/synthetic_default_rules.md) * [观测场景-APM]() * [开启APM](UserGuide/ProductFeatures/scene-apm/apm_monitor_overview.md) * [APM指标说明](UserGuide/ProductFeatures/scene-apm/apm_metrics.md) * [APM策略说明](UserGuide/ProductFeatures/scene-apm/apm_default_rules.md) -* [附录]() - * [导入导出](UserGuide/Appendix/import_export.md) - * [全局配置](UserGuide/Appendix/admin_config.md) - * [自监控](UserGuide/Appendix/self_monitor.md) - * [其他小功能](UserGuide/Appendix/tricks.md) + * [其他]() + * [批量导入导出](UserGuide/Appendix/import_export.md) + * [其他小功能](UserGuide/Appendix/tricks.md) + * [全局配置](UserGuide/Appendix/admin_config.md) + * [自监控](UserGuide/Appendix/self_monitor.md) * [二次开发]() * [Exporter 插件开发](UserGuide/Dev/plugin_exporter_dev.md) * [DataDog 插件开发](UserGuide/Dev/plugin_datadog_dev.md) diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15754471359709.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15754471359709.jpg deleted file mode 100644 index e9a0cae35..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15754471359709.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15754473248000.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15754473248000.jpg deleted file mode 100644 index 3ac649db5..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15754473248000.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797073734399.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797073734399.jpg deleted file mode 100644 index 649dec52e..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797073734399.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797077471928.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797077471928.jpg deleted file mode 100644 index 781948df1..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797077471928.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797092075306.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797092075306.jpg deleted file mode 100644 index 922f43188..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797092075306.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797093343755.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797093343755.jpg deleted file mode 100644 index b9b9d28de..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15797093343755.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15807892716298.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15807892716298.jpg deleted file mode 100644 index bdc3c0052..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15807892716298.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15834000575887.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15834000575887.jpg deleted file mode 100644 index 34e28c07c..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15834000575887.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15834001297160.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15834001297160.jpg deleted file mode 100644 index 7239ec16f..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/conf/media/15834001297160.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/functions/report/media/15909154784863.jpg b/ZH/Monitor/3.8/UserGuide/Other/functions/report/media/15909154784863.jpg deleted file mode 100644 index 143e1a73c..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/functions/report/media/15909154784863.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/media/15369096411514.jpg b/ZH/Monitor/3.8/UserGuide/Other/media/15369096411514.jpg deleted file mode 100644 index c726f4c1e..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/media/15369096411514.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/media/15369097029175.jpg b/ZH/Monitor/3.8/UserGuide/Other/media/15369097029175.jpg deleted file mode 100644 index 6263abf91..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/media/15369097029175.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/media/dashboard_panel.jpg b/ZH/Monitor/3.8/UserGuide/Other/media/dashboard_panel.jpg deleted file mode 100644 index 810ccae52..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/media/dashboard_panel.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Other/media/dashboard_panel_set.jpg b/ZH/Monitor/3.8/UserGuide/Other/media/dashboard_panel_set.jpg deleted file mode 100644 index a30d5b508..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Other/media/dashboard_panel_set.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/README.md b/ZH/Monitor/3.8/UserGuide/Overview/README.md index f2da8c0c5..188b50ccc 100644 --- a/ZH/Monitor/3.8/UserGuide/Overview/README.md +++ b/ZH/Monitor/3.8/UserGuide/Overview/README.md @@ -1,18 +1,16 @@ # 产品简介 -监控平台是蓝鲸智云官方推出的一款监控平台产品,除了具有丰富的数据采集能力,大规模的数据处理能力,还具有强大的平台扩展能力。依托于蓝鲸 PaaS,在整个蓝鲸生态中可以形成监控的闭环能力,帮助业务真正建立覆盖CI-CD-CO的业务运营体系。 +监控平台是蓝鲸智云官方推出的一款业务观测产品,具有丰富的数据采集能力,大数据处理能力,强大的平台扩展能力。依托于蓝鲸 PaaS,在整个蓝鲸生态中可以形成完整的观测的闭环能力,帮助业务真正建立覆盖CI-CD-CO的业务运营体系。 监控平台具有易用性、及时性、准确性、智能化、开放性、生态化等特性,致力于满足不同的监控场景需求和能力,为在线业务保驾护航,助力业务"运筹帷幄之中,决胜千里之外"。 -蓝鲸监控平台的定位: 企业级、一站式、围绕业务的多维度的可观测平台。 -* 企业级:主要是解决企业级大量数据的处理需求,所以不是简单的监控工具。 -* 一站式:监控的领域很多,能力也非常的多,尽可能的提供一站式监控服务满足不同角色不同场景的诉求。 -* 可观测平台:提供不同视角不同能力的综合性的可观测能力,最终都是为业务来服务。 +**一站式、企业级、满足不同业务架构、快速准确告警并定位处理的平台。** -监控平台并不是简单的一个产品,是包含了监控领域多个产品的共同作用的结果。 +![](media/16905480672130.jpg) -涉及到的产品有: + +相关的产品: 1. 依赖PaaS、CMDB、节点管理、容器管理服务等 2. 日志数据:日志平台 @@ -20,6 +18,14 @@ 4. 智能监控:计算平台和AIOps平台 5. 周边服务:JOB、标准运维、ITSM等 -![](media/16611709680440.jpg) +支持可观测能力的6种数据: + +1. Metrics 指标数据 +2. Logs 日志数据 +3. Traces 调用链数据 +4. Events 事件数据 +5. Profiling 性能数据 +6. Alerts 告警数据 +![](media/16905477946028.jpg) diff --git a/ZH/Monitor/3.8/UserGuide/Overview/benefits.md b/ZH/Monitor/3.8/UserGuide/Overview/benefits.md index 70a28c478..cb6e44baf 100644 --- a/ZH/Monitor/3.8/UserGuide/Overview/benefits.md +++ b/ZH/Monitor/3.8/UserGuide/Overview/benefits.md @@ -1,25 +1,17 @@ ## 核心优势 -![](media/16611790412033.jpg) - 1. **生态闭环:** 依托蓝鲸 PaaS 深度整合了 CMDB,故障自愈,日志平台,作业平台,节点管理,数据平台,工单等能力。随着生态的完善监控的智能化将更加强大 -![](media/16611790600963.jpg) - 2. **观测场景-开箱即用:** 默认的主机、进程监控,拨测能力,容器监控和APM,还有默认的系统事件,策略配置,可以满足基本的开箱即用 -![](media/16611791037513.jpg) +3. **数据集成-支持采集管理:** 一个简单的脚本,就可以采集数据,支持脚本的在线调试采集,全生命周期托管,无需考虑脚本如何部署如何管理问题。支持 Prometheus 的 Exporter 数据采集格式,可以简单的将 Exporter 迁移至监控平台的插件。 -3. **数据集成-支持采集管理:** 一个简单的脚本,就可以采集数据,支持脚本的在线调试采集,全生命周期托管,无需考虑脚本如何部署如何管理问题。 - 支持 Prometheus 的 Exporter 数据采集格式,可以简单的将 Exporter 迁移至监控平台的插件。 - 支持远程采集 -![](media/16622103216329.jpg) +4. **SDK上报:** 支持通过 HTTP、Prometheus SDK、OpenTelemetry SDK 自定义上报时序和事件数据。 -4. **SDK上报:** 支持通过 HTTP、Prometheus SDK、Opentelemetry SDK 自定义上报时序和事件数据。 +5. **告警配置-告警及自愈:** 灵活的策略配置满足单机,单实例,集群,多维度等告警需求;内置了 8 种静态检测算法、3种智能检测算法;多种告警收敛等防止告警风暴等 -5. **告警配置-告警及自愈:** 灵活的策略配置满足单机,单实例,集群,多维度等告警需求;内置了 8 种检测算法;多种告警收敛等防止告警风暴等 -![](media/16611791274210.jpg) +![](media/16906057539153.jpg) diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16611709680440.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16611709680440.jpg deleted file mode 100644 index 7ba37b8eb..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16611709680440.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16611790412033.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16611790412033.jpg deleted file mode 100644 index a01bdf93b..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16611790412033.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16611790600963.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16611790600963.jpg deleted file mode 100644 index 781a43d36..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16611790600963.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16611791037513.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16611791037513.jpg deleted file mode 100644 index f78cbd551..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16611791037513.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16611791274210.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16611791274210.jpg deleted file mode 100644 index 3fd8cb39b..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16611791274210.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16611791403655.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16611791403655.jpg deleted file mode 100644 index 22f92bbdd..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16611791403655.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/Overview/media/16622103216329.jpg b/ZH/Monitor/3.8/UserGuide/Overview/media/16622103216329.jpg deleted file mode 100644 index 01f61622b..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/Overview/media/16622103216329.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/datamodule.md b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/datamodule.md index 5629ad946..78993adef 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/datamodule.md +++ b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/datamodule.md @@ -2,7 +2,7 @@ 数据模型主要是介绍监控的数据上报格式、存储格式和监控管理运作的关系。 -### 用户关心的数据分层 +### 数据分层 不管是以什么方式进行数据的采集,上报;不论数据是从哪上报上来;不论是时序数据,事件数据还是日志数据都是为用户关心的数据分层而服务。 @@ -55,7 +55,7 @@ ![](media/16612221352204.jpg) -## 监控平台基本数据结构 +## 数据结构 ### 自定义事件数据 @@ -85,7 +85,7 @@ } ``` -### 时序数据结构 +### 自定义时序数据结构 ```json { @@ -129,6 +129,8 @@ http_request_total{status="404", method="POST", route="/user"} 94334 ## Trace 的数据结构 -支持Opentelemetry和OpenTracing +支持OpenTelemetry和OpenTracing + +[OpenTelemetry介绍](integrations-traces/opentelemetry_overview.md) diff --git a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15743891014248.jpg b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15743891014248.jpg deleted file mode 100644 index 499d6048d..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15743891014248.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15744111248853.jpg b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15744111248853.jpg deleted file mode 100644 index 4388b5268..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15744111248853.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15799998161447.jpg b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15799998161447.jpg deleted file mode 100644 index c16309b01..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/15799998161447.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/16003085498859.jpg b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/16003085498859.jpg deleted file mode 100644 index aba81cce8..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/16003085498859.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/16003086275528.jpg b/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/16003086275528.jpg deleted file mode 100644 index 6daaeadfe..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductArchitecture/media/16003086275528.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_forecast.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_forecast.md index 0750d81c1..c5f8b1753 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_forecast.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_forecast.md @@ -6,21 +6,6 @@ 1. 数据类型:指标数据,支持多维度的指标数据 2. 数据来源:监控采集,默认上报的,计算平台tspider的可以在监控查看到的数据。 自定义上报和日志的数据不包括在内。 -### 配置方法 - -1. 监控数据中选择添加监控指标。 -![](media/16614288675108.jpg) - -2. 模型名称中选择“通用时间序列预测_小时级别”。 -![](media/16614344829086.jpg) -3. 配置 是否为线性预测 和 预测时长。 -4. 配置阈值,当满足阈值条件时将触发告警。 -5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练 - -### 适用的数据场景 - -时序预测适用于大部分时序指标,特别适用于以下两种场景。 - #### 场景一:指标呈现周期性波动 @@ -37,3 +22,16 @@ ![](media/16614345294248.jpg) + +### 配置方法 + +1. 监控数据中选择添加监控指标。 +![](media/16614288675108.jpg) +![](media/16921698735590.jpg) + +2. 模型名称中选择“通用时间序列预测_小时级别”。 +![](media/16614344829086.jpg) +3. 配置 是否为线性预测 和 预测时长。 +4. 配置阈值,当满足阈值条件时将触发告警。 +5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练 + diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_intelligent_detect.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_intelligent_detect.md index 56317ab6f..6b65f926d 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_intelligent_detect.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/aiops_metrics_intelligent_detect.md @@ -8,27 +8,6 @@ AIOps相关的能力依赖蓝鲸AIOps平台,蓝鲸监控对接了AIOps平台 1. 数据类型:指标数据,支持多维度的指标数据 2. 数据来源:监控采集,默认上报的,计算平台tspider的可以在监控查看到的数据。 自定义上报和日志的数据不包括在内。 -### 配置方法 - -1. 监控数据中选择添加监控指标。 -![](media/16614288675108.jpg) - -2. 模型名称中选择“通用智能异常检测模型”。 -![](media/16614288805917.jpg) -3. 配置希望检测的异常方向:向上、向下。 -4. 配置敏感度,如果不清楚可以先不动,等有效果之后再根据告警情况进行调整,敏感度越高命中的告警更多,敏感度越低命中的告警越少。 - PS:配置完成后有一段时间的延迟,并且智能学习有一定的学习过程。 -![](media/16614288981493.jpg) -5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练 -![](media/16614289123180.jpg) - - - -### 适用的数据场景 - -智能异常检测适用于大部分时序指标,特别适用于以下三种场景。 - - #### 场景一:指标呈现周期性波动 当指标呈现周期性波动时,难以设置合理的静态阈值来检出图中明显的异常点,该场景下使用智能异常检测,既能保证检测的准确性,也能避免重复告警对用户的骚扰。 @@ -52,3 +31,24 @@ AIOps相关的能力依赖蓝鲸AIOps平台,蓝鲸监控对接了AIOps平台 ![](media/16614289388258.jpg) + + +### 配置方法 + +1. 监控数据中选择添加监控指标。 +![](media/16614288675108.jpg) + +2. 模型名称中选择“通用智能异常检测模型”。 +![](media/16914642718256.jpg) + +3. 配置希望检测的异常方向:向上、向下。 +4. 配置敏感度,如果不清楚可以先不动,等有效果之后再根据告警情况进行调整,敏感度越高命中的告警更多,敏感度越低命中的告警越少。 + PS:配置完成后有一段时间的延迟,并且智能学习有一定的学习过程。 +![](media/16914641915372.jpg) + +5. 接收到告警后,如果不准确,可以在告警详情中进行反馈,模型会定期持续训练 +![](media/16614289123180.jpg) + + + + diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/media/16614288805917.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/media/16614288805917.jpg deleted file mode 100644 index 386c0f096..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/media/16614288805917.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/media/16614288981493.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/media/16614288981493.jpg deleted file mode 100644 index 14e044c7a..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/aiops/media/16614288981493.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/coverge.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/coverge.md index 19a7dad88..9df820195 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/coverge.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/coverge.md @@ -17,8 +17,6 @@ 1. 如果产生了高级别告警,同维度低级别告警会立即恢复。 2. 如果存在高级别告警,低级别告警不会产生 -## 告警降噪 - ## 告警汇总 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616814100826.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616814100826.jpg deleted file mode 100644 index 10181c2c2..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616814100826.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616817125285.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616817125285.jpg deleted file mode 100644 index 25abdb5ef..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616817125285.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616820381848.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616820381848.jpg deleted file mode 100644 index 5c703e275..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16616820381848.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16621091575595.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16621091575595.jpg deleted file mode 100644 index f59775dea..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/media/16621091575595.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/rules.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/rules.md index c25bc7c92..303ebff16 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/rules.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/alarm-configurations/rules.md @@ -48,26 +48,33 @@ **关联告警**:对于不同的告警事件,或者来源于其他平台的告警事件,再进行关联的配置是否要进行处理,如当两个告警同时产生时才进行打电话等。 -#### 指标数据 +#### 监控数据-指标数据 -指标选择器 +- 指标选择器 ![](media/16616811859071.jpg) -指标数据查询和计算,更多查看[多指标查询及函数](../data-visualization/mutil_metric.md) -![](media/16616814100826.jpg) +- 指标数据查询和计算 + 更多查看[多指标查询及函数](../data-visualization/mutil_metric.md) +![](media/16914099813189.jpg) -监控目标,可以锁定策略生效的数据范围,只有与CMDB产生联动的才会有,其他的默认都是本业务的数据范围。 +- PromQL +![](media/16914103441943.jpg) + + +- 监控目标 + 可以锁定策略生效的数据范围,只有与CMDB产生联动的才会有,其他的默认都是本业务的数据范围。 ![](media/16616815573445.jpg) -检测规则: +### 检测规则 + +* 常规算法:提供了静态阈值、同比、环比等能力 +* 智能算法:提供了[单指标异常检测](../aiops/aiops_metrics_intelligent_detect.md)、[时序预测](../aiops/aiops_metrics_forecast.md)、[离群检测](../aiops/aiops_metrics_outline.md) +* 算法关系:各算法之间可以使用同时生效,也可以分别生效 -* 提供了8种自带的检测算法 -* 提供了单指标智能异常检测和单指标预测,依赖计算平台和AIOps平台,并且只有单指标的时候才会有,每种算法又对应AIOps多种模型,模型可自定义。 -* 各算法之间可以使用同时生效,也可以分别生效 +![](media/16914113186152.jpg) -![](media/16616817125285.jpg) 具体算法的说明查看附录 [算法说明](../../Other/functions/addenda/algorithms.md) @@ -79,43 +86,45 @@ * **触发条件**:是一种防抖机制,控制数据的敏感度,当然越不敏感告警通知的及时性越差,越敏感告警通知越多 * **恢复条件**:是判断问题恢复的方法,也是决定了事件恢复的结束时间 * **无数据**: 可以基于指标或者基于某个维度是否有无数据进行判断,维度选择的范围就是数据查询的范围(汇聚维度)。 -* **通知时间段**:如果能确认每个时间段不需要接收通知也没有问题,那就设置吧。默认是整天。还可以关联日历服务做更复杂的通知敲定。 - -#### 触发条件、恢复条件工作原理 - -数据经过算法检测后,会得到一个个的异常点。如果每一个异常点,都发送通知的话,那么在数据抖动或持续异常的场景下,一段时间内会多次收到通知,造成告警风暴。为了防止因为数据抖动等场景导致的告警骚扰,可以通过设置触发条件、恢复条件,以及通知间隔这三种方式来进行告警抑制。 - -- 页面设置 - -- 触发条件 +* **生效时间段**:如果能确认每个时间段不需要接收通知也没有问题,那就设置吧。默认是整天。还可以关联日历服务做更复杂的通知敲定。 - 只有在连续多个检测周期中满足多次检测算法,才触发告警通知。 - 如设置触发条件为 5 个周期满足 3 次检测算法。则表示在连续 5 次数据检测中,有 3 次或 3 次以上检测结果满足检测算法,那么则触发告警。 - -![15807882679366](media/15807882679366.jpg) +### 告警处理设置 -如上图,2、7、17、18、19、20、21...等这些点都满足检测算法,但是从检测窗口来看。 +![](media/16616819683430.jpg) -> 注:检测窗口,当前点往前看 5 个周期,在这 5 个周期内看有多少个点满足条件。 -只有 19、20、21...等这些才满足触发条件(5 个周期满足 3 次),满足条件的才触发告警通知。从而可以有效的避免因抖动而产生的多次告警。 +### 告警通知设置 -- 恢复条件 - 恢复条件,是在触发条件的基础上来判断,只有**连续**多次不满足触发条件则表示恢复。 +![](media/16914100447639.jpg) - 如设置恢复条件为连续 5 个周期不满足触发条件,表示在连续 5 次触发条件检测中,没有一次满足触发条件,则告警恢复。 -![15808060152493](media/15808060152493.jpg) +* **告警阶段**:指发生告警时,告警恢复时,告警关闭时,有相应的通知能力。 +* **处理阶段**:指在配置了告警处理动作的时候,才会需要确定是否使用。 +* **通知方式**: 有两种 + * 1)基于分派规则通知,具体查看[告警分派](alarm_routing.md) + * 2)默认通知 + * **告警组**:默认是告警组,一般情况下接收告警的人都是相对固定的。通过告警组的设置和变更将更加的方便,还可以支持多个告警组。告警组的使用方法详细查看[告警组说明](./alarm_group.md) + * **通知升级**:当告警多久没有恢复就逐个通知其他告警组。 +* 高级配置 + * **通知间隔**:指的是未恢复或未确认前则每隔多久将再进行告警。有固定和递增两种方式。 + * **告警风暴**:指的是当同一时刻达到了某个平台设置的最大上限将进行跨策略汇总告警通知 + * 配置方法:导航 → 系统管理 → 全局配置 → 告警通知汇总设置 + * 更多告警汇聚和收敛说明请查看附录[通知收敛&汇总机制说明](../alarm-configurations/coverge.md) + * **降噪设置**: 可以基于某些维度情况达到一定量后才真正产生告警通知。 + * **告警通知模版**:影响告警通知查看的内容,因为不同的通知渠道都有字符的限制,所以默认的告警通知是做了自动转换和截段处理等。目的是在有限的字符限制内提供更有用的信息。通知的种类有: + * 异常单条告警 按级别 + * 同策略不同目标 按级别 + * 异常跨策略汇总告警 按级别) + * 以上对应的恢复通知 + > 更多告警通知模版的配置请查看场景案例[如何设置自己的通知模版](../alarm-configurations/notify_case.md) -如上图,19、20、21、22、23、24、25、26 等这些点都是满足触发条件(5 个周期满足 3 次),那么从 27 开始,27、28、29、30、31、32 这些点都是不满足触发条件的。那么告警会在 31 这个点恢复,因为这个点首次达到连续 5 次不满足触发条件。 +#### 触发条件、恢复条件、通知工作原理 -> 注意: -> 触发条件里的周期,分两种情况: -> 时序类:按用户配置的聚合周期来 -> 事件类:事件只有异常的时候才有数据,没有周期的概念,所以这里的周期固定为 1 分钟,5 个周期,即 5 分钟 +数据经过算法检测后,会得到一个个的异常点。如果每一个异常点,都发送通知的话,那么在数据抖动或持续异常的场景下,一段时间内会多次收到通知,造成告警风暴。为了防止因为数据抖动等场景导致的告警骚扰,可以通过设置触发条件、恢复条件,以及通知间隔这三种方式来进行告警抑制。 +![](media/16914097670289.jpg) #### 无数据工作原理 @@ -140,84 +149,6 @@ > 注:无数据告警同样有触发条件、恢复条件、告警间隔等这些。会跟随策略的配置。 -### 告警处理设置 - -![](media/16616819683430.jpg) - - -### 告警通知设置 - - -![](media/16616820381848.jpg) - - -* **告警通知**:指发生告警时,告警恢复时,告警关闭时,有相应的通知能力。 -* **处理通知**:指在配置了告警处理动作的时候,才会需要确定是否使用。 -* **通知间隔**:指的是未恢复或未确认前则每隔多久将再进行告警。有固定和递增两种方式。 -* **告警组**:默认是告警组,一般情况下接收告警的人都是相对固定的。通过告警组的设置和变更将更加的方便,还可以支持多个告警组。告警组的使用方法详细查看[告警组说明](./alarm_group.md) -* **告警风暴**:指的是当同一时刻达到了某个平台设置的最大上限将进行跨策略汇总告警通知 - * 配置方法:导航 → 系统管理 → 全局配置 → 告警通知汇总设置 - * 更多告警汇聚和收敛说明请查看附录[通知收敛&汇总机制说明](../alarm-configurations/coverge.md) -* **告警降噪**: 可以基于某些维度情况达到一定量后才真正产生告警通知。 -* **告警通知模版**:影响告警通知查看的内容,因为不同的通知渠道都有字符的限制,所以默认的告警通知是做了自动转换和截段处理等。目的是在有限的字符限制内提供更有用的信息。通知的种类有: - * 异常单条告警 按级别 - * 同策略不同目标 按级别 - * 异常跨策略汇总告警 按级别) - * 以上对应的恢复通知 -> 更多告警通知模版的配置请查看场景案例[如何设置自己的通知模版](../alarm-configurations/notify_case.md) - -#### 设置通知间隔工作原理 - -- 页面设置 - -- 说明 - - 在持续异常的情况下,前面的触发条件会一直满足,则会一直触发告警,称为[持续事件],为了防止频繁的收到告警,可以设置两次通知之间的最小间隔。如上图,通知间隔设置 2 个小时,一直产生告警的话,只要是未恢复,那么会按 2 个小时的最小间隔来发送。 - -![15807882679366](media/15807882679366.jpg) - -这里引用触发条件里的图片,19、20、21、22、23、24 等都是满足触发条件,则都会触发告警通知,如果设置了告警间隔 120 分钟,那么只有在 19 会发送一次通知,后面的都不会发送,如果一直持续满足触发条件的话,那么下一次就是 139 这个点之后再通知一次。 - -#### 事件生成原理 - -- 如下图,磁盘使用率告警,配置如下 - - 检测算法:>= 90 - - 触发条件:5 个周期满足 1 次 - - 恢复条件:连续 5 个周期不满足触发条件 - - 通知间隔:120 分钟 - -- 数据点 - -![-w2021](media/15809634260615.jpg) - -- 异常点 - -![-w2021](media/15809656915728.jpg) - -- 每个时间点判断结果 - -|时间|检测算法(>= 90)|触发条件(5 个周期满足 1 次)|通知(间隔 120 分钟)| 是否恢复 | -|---|---|---|---|---| -|第 1 分钟|无|无|无|无| -|第 2 分钟|无|无|无|无| -|第 3 分钟|无|无|无|无| -|第 4 分钟|满足>90|5 个周期满足 1 次|产生新的事件,并通知。
下一次通知时间第 124 分钟|无| -|第 5 分钟|满足>90|5 个周期满足 2 次|被收敛,不通知|无| -|... ...|满足>90|... ...|... ...|... ...| -|第 123 分钟|满足>90|5 个周期满足 5 次|被收敛,不通知|无| -|第 124 分钟|满足>90|5 个周期满足 5 次|产生通知。
下一次通知时间第 244 分钟|无| -|第 125 分钟|满足>90|5 个周期满足 5 次|被收敛,不通知|无| -|... ...|满足>90|... ...|... ...|... ...| -|第 130 分钟|满足>90|5 个周期满足 5 次|被收敛,不通知|无| -|第 131~134 分钟|无|5 个周期分别满足 4~1 次|被收敛,不通知|无| -|第 135~138 分钟|无|无|被收敛,不通知|不满足触发条件 1~4 次| -|第 139 分钟|无|无|结束通知,重置下次告警时间|不满足触发条件 5 次,事件恢复| -|第 140 分钟|无|无|无|无| -|... ...|无|... ...|... ...|... ...| -|第 143 分钟|满足>90|5 个周期满足 1 次|产生新的事件,并通知。
下一次通知时间第 263 分钟|无| -|第 144 分钟|满足>90|5 个周期满足 2 次|被收敛,不通知|无| - -该事件变化情况可以在事件详情的事件流水中查看。 ## 高级告警联动 @@ -256,3 +187,5 @@ * [如何对进程进行监控](../../ProductFeatures/scene-process/process_cases.md) * [如何监控日志平台的数据](./log_monitor.md) * [如何监控计算平台的数据](./bigdata_monitor.md) + + diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/collectors/install.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/collectors/install.md index eb7cc5a25..4b0dceb16 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/collectors/install.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/collectors/install.md @@ -2,7 +2,7 @@ ## 名词 -* gse_agent:是指蓝鲸平台提供的agent +* gse_agent:是指蓝鲸平台提供的Agent * 采集器:是采集数据的程序,通过gse_agent上报数据 * 采集器和gse_agent的关系 @@ -58,16 +58,12 @@ ![](media/16612270957278.jpg) - * 查看日志 查看详细的插件更新日志,如图所示。 ![](media/16612271094922.jpg) - - - ## 托管插件 插件托管是gse_agent对插件进行管理的一个功能,将控制gse_agent插件进程的启动,停止,自动拉起。其规则如下: diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/dashboard.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/dashboard.md index 7b73df463..e8745853b 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/dashboard.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/dashboard.md @@ -2,7 +2,7 @@ 仪表盘使用的是Grafana , 基于Grafana的设计理念,基本在不改变Grafana的情况下融入了蓝鲸监控自己的功能。 -![-w2021](media/15909151125720.jpg) +![](media/16914685284705.jpg) Grafana的基本使用可以查看官网或者网上的使用文章。 接下来主要介绍一些蓝鲸监控附加的功能和一些常用的功能介绍。 @@ -10,7 +10,6 @@ Grafana的基本使用可以查看官网或者网上的使用文章。 接下来 ### 新建视图和分组 -![](media/16614127646107.jpg) 1. 新建视图,可以先选数据也可以先选图 2. 如果想实现分组,使用 Convert to row 就可以实现类似的分组功能 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/data_view_intro.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/data_view_intro.md index 458f710f7..54af9b23b 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/data_view_intro.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/data_view_intro.md @@ -15,7 +15,7 @@ 1. 指标 Metrics 2. 事件 Events 3. 日志 Logs -4. Traces +4. 调用链 Traces 5. 告警 Alerts ## 可视化之间的转换关系 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_metrics.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_metrics.md index 8c4a6fbca..2082573d3 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_metrics.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_metrics.md @@ -2,8 +2,7 @@ 所有接入到监控平台、计算平台Tspider、ES、日志平台ES数据都可以在指标检索中快速的查询 -![](media/16614217580999.jpg) - +![](media/16914688426728.jpg) ## 功能列表 @@ -18,6 +17,8 @@ 8. 视图显示:一行一个,一行两个,一行三个 最多五个 9. 查看相关告警 10. 支持PromQL +![](media/16914688908698.jpg) + 11. 多指标计算 12. 索引功能快速定位 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_traces.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_traces.md index 377b081da..04083fe29 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_traces.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/explore_traces.md @@ -1,2 +1,109 @@ # Trace检索 +Trace检索主要是满足通过APM上报上来的Trace进行快速的检索目的。查看基于该Trace调用链的所有相关的数据情况。 具体数据接入查看[开启APM](../scene-apm/apm_monitor_overview.md) + + +## ID精确检索和范围检索 + +![](media/16915625175344.jpg) + +- 第一种: 一般是有明确的ID,从浏览器或者日志中获取后直接进行ID精准查看 + + 如在http的Header里面可以获取相应的TraceID和SpanID`Traceparent:00-29a543417ecfe6b3c2939ccff4ee3eba-fb11889da130bf29-01` + +- 第二种: 无明确的ID,有大致的时间范围,可以查看大致的一个情况 + +## 范围检索 + +![](media/16915629969323.jpg) + +1. 查询条件,有丰富的查询条件可以进行快速的查询相关的列表数据 +2. 列表数据提供了四种视角: + - Trace视角:TraceID列表,不区分Span,相同TraceID都会聚成一行记录 + - Span视角:SpanID列表,最原始的数据列表,按SpanID一行记录呈现,不区分TraceID + - 接口统计:按接口维度进行汇聚 + - 服务统计:按服务维度进行汇聚 +3. 提供了一些快捷能力: + - 错误:包含错误 OTel中status_code:2的情况 + - 入口服务 : 服务端进程的第一个Service + - 入口接口 : 入口服务的第一个接口 + - 根Span :整个Trace的第一个Span + +## 单个Trace详情 + +四种数据查看能力: + +1. 瀑布列表:有严格的父子上下级关系,可以根据上下游进行快速定位。 +2. 节点拓扑:忽略时间关系,仅展示Span之间的层级和拓扑关系,整体性非常的直观。 +3. 表格统计:以表格的方式呈现不同维度的数据,可以快速的对数值进行比对和查看,聚焦问题点。 +4. 时序图:以程序实现的角度表现调用和被调的关系,快速查看是否与原设计相符。 +5. 火焰图:以火焰图的方式呈现Span耗时占用大的情况,快速的进行重点Span的查看。并且解决了并发进程上面的呈现问题。 + +其他高级能力: + +1. 来源: 默认OTel , 支持eBPF(需要集成DeepFlow,待后续版本发布) +2. 跨应用:当一个TraceID跨应用的时候,会进行呈现,有权限的情况是可以进行相应的查看。 +3. 推断:像DB、中间件、第三方这种都可以从主调的服务中推断出来 +4. 折叠:为了更好的查看数据,不同的数据类型都有相应的折叠能力,减少相似数据的干扰。 + + +### 瀑布列表 + +![](media/16915642874323.jpg) + + +### 节点拓扑 +![](media/16915652754192.jpg) + + +### 表格统计 + +![](media/16915653050154.jpg) + + +### 时序图 + +![](media/16915653596975.jpg) + + +### 火焰图 + +![](media/16915654017287.jpg) + + +## 对比功能 + +对比功能主要是解决两类问题: + +1. 以完整的一个TraceID为参照,发现当前Trace是否有数据缺失 +2. 调优后对比是否有变化 + +对比功能只支持节点拓扑和火焰图 + +![](media/16915657613288.jpg) + +![](media/16915658023227.jpg) + + +## Span详情 + +### 基础信息 + +![](media/16915659360448.jpg) + +### 异常事件 + +![](media/16915660474805.jpg) + +### 日志和主机 + +日志和主机是通过服务的配置进行关联,并且会基于instance信息进行匹配。 + +![](media/16915667930054.jpg) + + + + + + + diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614117842620.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614117842620.jpg index dac7e4526..5f6fb042a 100644 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614117842620.jpg and b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614117842620.jpg differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614127646107.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614127646107.jpg deleted file mode 100644 index 90319e8bf..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614127646107.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614173069887.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614173069887.jpg deleted file mode 100644 index 1eca39be7..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614173069887.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614217580999.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614217580999.jpg deleted file mode 100644 index 174fd9c40..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/media/16614217580999.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/mutil_metric.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/mutil_metric.md index d98fd26ca..147eb40cf 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/mutil_metric.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/mutil_metric.md @@ -18,7 +18,7 @@ ### PromQL -支持原生的PromQL语法 , 可以直接切换成source的模式 +支持原生的PromQL语法 , 可以直接切换成PromQL的模式 ![](media/16614142376385.jpg) diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/report_email.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/report_email.md index cd4a9a985..509416fe3 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/report_email.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/data-visualization/report_email.md @@ -23,10 +23,13 @@ 1. 该功能不需要申请权限,但要订阅仪表盘的数据所以一定需要有仪表盘的权限. -![](media/16614173069887.jpg) +![](media/16914674831239.jpg) -* 1) 可以指定接收人,主动给需要的人. +* 1) 订阅人 + * 内部邮件:基于用户管理的人员列表,可以指定接收人,主动给需要的人. + * 外部邮件:基于邮件列表,指定邮件列表,可以是任意的邮件地址。注意公司安全。 + * 企业微信群:可以通过企业微信群机器人进行发送。。 * 2) 被订阅的人可以主动退订,在订阅列表里面会看到退订的人员 * 3) 管理员:后续可以编辑和修改的人 * 4) 发送频率:支持多种,那么这个时间范围会与仪表盘联动,如选择按周,那么对应的图表数据就是这一周的. diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metric-plugins/builtin_plugins.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metric-plugins/builtin_plugins.md index ac621345e..acdb08d29 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metric-plugins/builtin_plugins.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metric-plugins/builtin_plugins.md @@ -2,15 +2,15 @@ 内置官方插件是由蓝鲸官方维护的插件,主要是满足监控平台开箱即用的一个需求。 -注意: 虽然是内置的官方插件,也会有一定的依赖和功能局限性。因为只测试过已有的版本,尤其是新出现的版本内置的插件不一定能满足。 - -如果使用描述不清或者错误,或者有需求可以反馈给官方。 - -> **注意**:其实基于监控平台的插件定义可以非常方便的扩展监控能力,可以不用完全依赖官方的插件。具体查看 - * [制作Script插件(多种插件类型)](script_collect.md) - * [制作Exporter插件(复用Prometheus插件)](import_exporter.md) - * [制作BK-Pull插件(拉取Prometheus数据)](howto_bk-pull.md) - * [制作DataDog插件](import_datadog_online.md) +> 注意: +1. 虽然是内置的官方插件,也会有一定的依赖和功能局限性。因为只测试过已有的版本,尤其是新出现的版本内置的插件不一定能满足。 +2. 如果使用描述不清或者错误,或者有需求可以反馈给官方。 +3. 基于监控平台的插件定义可以非常方便的扩展监控能力,可以不用完全依赖官方的插件。 + +* [制作插件 Script](script_collect.md) +* [制作插件 Exporter](import_exporter.md) +* [制作插件 BK-Pull](howto_bk-pull.md) +* [制作插件 DataDog](import_datadog_online.md) ## Exporter 插件 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metrics/what_metrics.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metrics/what_metrics.md index 3ef258d85..b82d266ae 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metrics/what_metrics.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-metrics/what_metrics.md @@ -1,7 +1,6 @@ # 什么是指标和维度 - ## 1.指标概述      在监控系统中,指标是一个很重要的概念,我们常常忽视他的存在。指标的定义,与监控系统所支持的数据模型结构,有着非常密切的关系。 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-traces/opentelemetry_overview.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-traces/opentelemetry_overview.md index 5b77da6e4..c6581ab7d 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-traces/opentelemetry_overview.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/integrations-traces/opentelemetry_overview.md @@ -1,7 +1,6 @@ # Opentelemetry 介绍 - |标准 |概述 |Traces |Metrics |Logs |状态 | |---|---|---|---|---|---| |OpenTracing |2015年底发起,2016年被批准为CNCF第三个项目 |✓ | | |停止更新 | diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_default_rules.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_default_rules.md index aad542866..2d412fa04 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_default_rules.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_default_rules.md @@ -1,10 +1,42 @@ -# APM默认策略说明 +# APM相关的策略 +## APM默认策略说明 + + 默认在应用设置里面可以开启无数据告警 ![](media/16618545698952.jpg) +## 策略配置 + +### 方法一: 基于黄金指标 + +每个应用都会有相应的黄金指标,可以直接在指标选择器中使用,用于策略告警和绘图。 +![](media/16921736927221.jpg) + +优点: + +- 速度快,已经是汇聚后的数据 +- 准确度高,是采样前的汇聚数据 + +缺点: + +- 只适用于黄金指标和对应维度的内容,内置的 + +### 方法二: 直接使用原始数据 + + +![](media/16921737916834.jpg) + +优点: + +- 可以基于任意维度和指标 + +缺点: + +- 原始数据量越大越慢 +- 只能是统计采集后存储下来的数据 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_metrics.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_metrics.md index 0ad816b34..2d21b376d 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_metrics.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_metrics.md @@ -30,3 +30,40 @@ Apdex 定义了应用响应时间的最优门槛为 T(即 Apdex 阈值,T 由 接口在服务的运行过程中的调用次数。 +### 黄金指标 + +指标选择器中的指标 + +* 耗时 bk_apm_duration +* 调用次数 bk_apm_count + * 统计方法:count +* 最大耗时 bk_apm_max_duration + * 统计方法:max +* 总耗时 bk_apm_sum_duration + * 统计方法:sum +* 错误数量 bk_apm_error_count + * 维度:span_name,service_name,kind,resource.bk.instance.id,attributes.peer.service,bk_app_name,bk_biz_id + * 条件:kind == 2 status.code = 2 + * 统计方法:count +* 慢查询数 bk_apm_frustrated_count + * 维度:span_name,service_name,kind,resource.bk.instance.id,attributes.peer.service,bk_app_name,bk_biz_id + * 条件:apdex_type==frustrated + * 统计方法:count +* 正常查询数 bk_apm_satisfied_count + * 维度:span_name,service_name,kind,resource.bk.instance.id,attributes.peer.service,bk_app_name,bk_biz_id + * 条件: apdex_type==satisfied + * 统计方法:count +* 可容忍查询数 bk_apm_tolerating_count + * 维度:span_name,service_name,kind,resource.bk.instance.id,attributes.peer.service,bk_app_name,bk_biz_id + * 条件:apdex_type==tolerating + * 统计方法:count +* 被调数 bk_apm_call_count + * 维度: span_name,service_name,kind,resource.bk.instance.id,attributes.peer.service,bk_app_name,bk_biz_id + * 条件: kind == 2|4 + * 统计方法:count +* 主调数 bk_apm_request_count + * 维度:span_name,service_name,kind,resource.bk.instance.id,attributes.peer.service,bk_app_name,bk_biz_id + * 条件 kind == 3|5 + * 统计方法:count + + diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_monitor_overview.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_monitor_overview.md index 15c3c54c3..606523355 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_monitor_overview.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/apm_monitor_overview.md @@ -1,14 +1,12 @@ # 开启APM监控 -观测场景-应用监控 - +## 什么是APM -## 什么是APM +![](media/16916522683038.jpg) -APM(Application Performance Monitoring)即应用性能监控 , 通过应用软件之间的服务调用来分析软件的问题,可以更细粒度的监控和满足用户更好的体验。APM具体要解决三方面的问题 +APM(Application Performance Monitoring)即应用性能监控 , 通过应用软件之间的服务调用来分析软件的问题,可以更细粒度的监控和满足用户更好的体验。APM具体要解决三方面的问题。 -![](media/16618503644108.jpg) ### 用户排障流程 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/media/16618503644108.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/media/16618503644108.jpg deleted file mode 100644 index b257027ac..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-apm/media/16618503644108.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-k8s/howto_migrate_prometheus.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-k8s/howto_migrate_prometheus.md index e69de29bb..979543c57 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-k8s/howto_migrate_prometheus.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-k8s/howto_migrate_prometheus.md @@ -0,0 +1,137 @@ +# 蓝鲸监控 VS Prometheus + +在容器监控领域Prometheus是标配,也成为最流行的监控工具。但在复杂的企业环境下,Prometheus总是有很多的局限,所以社区也推出了很多的解决方案。 当前蓝鲸监控提供了一套完整的Kubernetes的解决方案,覆盖指标、事件、日志、Trace等。 + +## Prometheus的局限 + +### 功能局限 + +* Prometheus 是基于 Metric 的监控,不适用于日志(Logs)、事件(Event)、调用链(Tracing)。 +* Prometheus 默认是 Pull 模型,没有跨云区域的解决方案 +* 数据量过大时非常容易OOM,无法集群化和水平扩展,官方和社区都没有银弹,需要合理组合选择 Federate、Cortex、Thanos 等方案。虽然有这些高可用方案,但在数据量大的情况效率依然很慢,有遇到好多大的集群无法承接的情况 如Lgame 合金弹头等
本质原因是,Prometheus 的本地存储没有数据同步能力,要在保证可用性的前提下,再保持数据一致性是比较困难的。 +* Prometheus,Alertmanager Grafana等多个系统较为割裂,缺乏统一视图,无法开箱即用 +* 生产环境运行多套prometheus集群,管理和使用成本都非常的高 +* Yaml很灵活,成本也比较高,UI太弱 + + +### Prometheus 大内存问题 + +随着规模变大,Prometheus 需要的 CPU 和内存都会升高,内存一般先达到瓶颈,这个时候要么加内存,要么集群分片减少单机指标。这里我们先讨论单机版 Prometheus 的内存问题。 + +原因: + +* Prometheus 的内存消耗主要是因为每隔 2 小时做一个 Block 数据落盘,落盘之前所有数据都在内存里面,因此和采集量有关。 +* 加载历史数据时,是从磁盘到内存的,查询范围越大,内存越大。这里面有一定的优化空间。 +* 一些不合理的查询条件也会加大内存,如 Group 或大范围 Rate。 + +### Prometheus 重启慢与热加载 + +Prometheus 重启的时候需要把 Wal 中的内容 Load 到内存里,保留时间越久、Wal 文件越大,重启的实际越长,这个是 Prometheus 的机制,没得办法,因此能 Reload 的就不要重启,重启一定会导致短时间的不可用,而这个时候Prometheus高可用就很重要了 + + +## 为什么OpenTelemetry主推Push + +Prometheus主推Pull方式,OpenTelemetry主推Push方式,到底哪种方式更好呢? + +### Pull VS Push 的工作原理 + +|原理对比 |Pull|Push| +|---|---|---| +|配置管理 |中心化配置 |1. 端上静态配置
2. 通过配置中心获取配置 | +|监控对象发现 |1. 静态
2. 依赖服务发现机制 如k8s,CMDB等 |由应用自主上报,无需服务发现模块 | +|部署方式 |1. 应用直接暴露端口,接入服务发现
2. 服务不直接暴露端口的,如MYSQL依赖适配器(Exporter) |应用主动推送到监控系统 | +|可扩展性 |1. 依赖Pull端扩展;
2. 需要Pull Agent和存储解耦(原生Prometheus不支持) |简单,只需要中心接收端横向扩展 | + +要想正确的选择,需要先了解Pull和Push的工作原理,这里的关键区别点就在于监控对象是如何来发现的,Pull就需要提前得到目标地址列表,为了能够基于业务的扩缩容自动的进行采集,就一定少不了服务发现的能力,比如K8s中天然就有这个服务发现的优势。 而Push就不需要提前知晓目标地址列表,相对来说就非常的简单了。 + +![](media/16921759032406.jpg) +Pull方式 + +![](media/16921759163876.jpg) + +Push方式 + +### Pull VS Push 能力对比 + +|能力对比 |PULL |PUSH | +|---|---|---| +|监控对象存活性 |简单 |无法区分 | +|数据齐全度计算 |可行 |较困难 | +|短生命周期(Job,Serverles)实时性高 |难以适用 |适用 | +|指标获取灵活性 |固定,方便分享,可按需获取 |灵活, 被动接受链路中学习 | + +正是因为两者的工作原理不一样所以也决定了两者能力的区别。 在监控领域监控对象的存活性是非常重要的,pull的时候有明确的目标,所以可以非常简单的判断是拉到空数据还是监控对象出问题了,而且也可以控制拉取的周期。而push的时候 不知道周期是多少,没有收到数据的时候也不知道是因为下线了,还是因为挂掉了。 所以这也是为什么Prom一直更倾向Pull的方式而不是Push。 + +但是在一些短生命周期进程,或者trace这类场景,实时性要求很高,或者压根没有办法提前定义监控对象的如浏览器、移动端这种,就只能通过Push的方式进行上报。 所以这也是为什么Opentelemetry推出的架构是Push的方式。 + +![](media/16921759336623.jpg) + +Pull方式 + +![](media/16921759392417.jpg) +Push方式 + + +### Pull VS Push 成本对比 + +|成本对比 |Pull |Push | +|---|---|---| +|资源消耗 |1. 应用暴露端口方式 低
2. Exporter方式 较高 3.占用端口资源 |1.应用推送 消耗低
2. Agent推送 消耗低 | +|安全性保证 |工作量大,暴露端口的安全性 |工作量低 | +|核心运维消耗 |1.平台维护的组件多,成本高
2.定位简单 |1.平台维护的组件少,成本低
2.定位难 | + +最后一个就是成本的区别,现在服务器的性能已经非常高了,企业的安全保障也相对完善,所以资源消耗和安全性考虑相对可以忽略了。 而在实际的生产过程中,其实Push带来的不确定性和扯皮的情况更明显。 + +### 选型基本原则 + +Pull or Push到底如何选型? + +作为平台方同时具备Pull和Push的能力才是最优解: + +- 主机、进程、中间件监控使用Agent Pull采集器模式 +- Kubernetes等直接暴露Pull端口的使用Pull模式 +- 应用与CMDB结合(服务发现)的选择Pull模式 +- 应用无法部署Agent , 无法服务发现, 生命周期短的使用Push + +简单原则: + +能用PULL尽量用PULL ( 能解决服务发现问题),其他使用PUSH。 + + + +## 蓝鲸监控解决方案 + +![](media/16921757683635.jpg) + +上方为蓝鲸监控基本工作示意图,里面有Pull和Push的两种方式。简单画了三个云区域来表示蓝鲸监控的跨云区域数据传输能力。 + +* 取长 + * 兼容Prom和OTel数据协议 + * 兼容PromQL和函数查询方式 + * 可以简单的封装exporter成蓝鲸监控插件 + * 完全兼容ServiceMonitor和PodMonitor + +* 补短 (Prom只有Metric ,没有开箱即用能力等) + - Prom仪表盘可一键导入 + - 支持更简易的UI配置 + - 支持便利的开箱即用的数据展示能力 + - 功能全复用,如故障自愈和AIOps能力 + +* 补短 (Prom没有跨云区域解决方案,单点、内存OOM,Otel的metric和log还不稳定) + - 支持跨云区域 跨集群传输 ,依托于蓝鲸GSE管道,已经承载过几十万服务器的数据传输就包括的JOB指令、日志传输、Metric采集等 + - 支持本地pull、远程pull、push;本地pull是有效的分散了集中pull的拉取压力,也加大了数据传输的并发能力,远程pull通过负载均衡优化了单点拉取等架构问题。 + - Metric支持TraceID的输出方式,在Prom的SDK上实现了带TraceID输出的能力。 + +另外蓝鲸监控还有一些独有的能力 + +* 整个蓝鲸是可以私有化独立部署,所有功能不受影响。 +* 依托于蓝鲸的CD管控能力 + * 蓝鲸监控拥有了插件采集能力,只需要编写插件 + * 动态采集和插件进程托管都可以由监控完成 + * 拥有了故障处理甚至自愈的能力,可以联动周边的流程服务、标准运维、JOB作业 +* 依托于计算平台和AIOps平台 + * 蓝鲸监控拥有了大数据计算和AI分析能力 + * 蓝鲸监控也可以消费计算平台的数据,为计算平台提供监控能力。 + + + diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-process/process_pattern_monitor.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-process/process_pattern_monitor.md index 04860f3b4..41dc882fe 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-process/process_pattern_monitor.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-process/process_pattern_monitor.md @@ -1,4 +1,4 @@ -# 基于动态进程采集插件的进程监控 +# 进程监控-进程采集插件 动态进程采集插件是平台内置的一个插件配置能力,依赖bkmonitorbeat,当采集任务配置好下发到目标机器后,会基于采集的任务信息进行工作。 diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/media/16618551002386.jpg b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/media/16618551002386.jpg deleted file mode 100644 index a66a841d5..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/media/16618551002386.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/synthetic_monitor.md b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/synthetic_monitor.md index 90420eb39..dfd1e0f4a 100644 --- a/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/synthetic_monitor.md +++ b/ZH/Monitor/3.8/UserGuide/ProductFeatures/scene-synthetic/synthetic_monitor.md @@ -36,7 +36,9 @@ 选择节点后,配置不同的协议对网站/应用服务进行主动拨测,就是服务拨测采集的第二步:添加拨测任务。 -![](media/16618551002386.jpg) +![](media/16921736146969.jpg) + +![](media/16921736296097.jpg) ### 查看拨测任务 diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/README.md b/ZH/Monitor/3.8/UserGuide/QuickStart/README.md index 974ffca75..a6ac4b327 100644 --- a/ZH/Monitor/3.8/UserGuide/QuickStart/README.md +++ b/ZH/Monitor/3.8/UserGuide/QuickStart/README.md @@ -47,7 +47,7 @@ * [告警屏蔽](../ProductFeatures/alarm-handling/block.md) * 仪表盘:提供不同的图表配置,支持日志数据、数据平台数据、监控采集的指标数据画图需求 * [仪盘表](../ProductFeatures/data-visualization/data_view_intro.md) -* 服务拨测:提供模拟用户请求的监控需求。 +* 综合拨测:提供模拟用户请求的监控需求。 * [服务拨测](../ProductFeatures/scene-synthetic/synthetic_monitor.md) * 日志采集和监控 * 通过日志平台可以进行日志采集和字段提取 diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809632369678.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809632369678.jpg deleted file mode 100644 index dc93dcd05..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809632369678.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809715128894.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809715128894.jpg deleted file mode 100644 index 48903ecce..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809715128894.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809774652787.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809774652787.jpg deleted file mode 100644 index a70df9fd5..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809774652787.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809845810410.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809845810410.jpg deleted file mode 100644 index fe512c86d..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809845810410.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809852566515.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809852566515.jpg deleted file mode 100644 index 0031874f9..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809852566515.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809863857690.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809863857690.jpg deleted file mode 100644 index 6a8048179..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809863857690.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809864515258.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809864515258.jpg deleted file mode 100644 index ce3c2ede5..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809864515258.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809895919471.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809895919471.jpg deleted file mode 100644 index 3e5b08780..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15809895919471.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15833972925153.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/15833972925153.jpg deleted file mode 100644 index fc19fdcfa..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/15833972925153.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16044597491804.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/16044597491804.jpg deleted file mode 100644 index b2c8bf66b..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16044597491804.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16044602044573.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/16044602044573.jpg deleted file mode 100644 index ea88ae4ef..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16044602044573.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16049160893702.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/16049160893702.jpg deleted file mode 100644 index ae2b6a67c..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16049160893702.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16611817843294.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/16611817843294.jpg deleted file mode 100644 index 9db548080..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16611817843294.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16612243844773.jpg b/ZH/Monitor/3.8/UserGuide/QuickStart/media/16612243844773.jpg deleted file mode 100644 index 46669564d..000000000 Binary files a/ZH/Monitor/3.8/UserGuide/QuickStart/media/16612243844773.jpg and /dev/null differ diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/menu.md b/ZH/Monitor/3.8/UserGuide/QuickStart/menu.md index 69ea11d87..41b2df3c1 100644 --- a/ZH/Monitor/3.8/UserGuide/QuickStart/menu.md +++ b/ZH/Monitor/3.8/UserGuide/QuickStart/menu.md @@ -2,9 +2,9 @@ 简单了解下导航的功能说明,能够快速的了解监控平台的功能分布。 -![](media/16611817843294.jpg) +![](media/16906159613257.jpg) -![](media/16612243844773.jpg) +![](media/16906158541474.jpg) ## 首页 @@ -34,8 +34,8 @@ * [主机监控](../ProductFeatures/scene-host/host_monitor.md):查看主机和进程相关信息的场景 * [综合拨测](../ProductFeatures/scene-synthetic/synthetic_monitor.md):通过远程拨测服务判断服务是否正常。提供在这个场景在的各种视角和信息 -* [容器监控](../ProductFeatures/scene-k8s/k8s_monitor_overview.md):提供k8s云原生的监控解决方案。 -* [应用监控](../ProductFeatures/scene-apm/apm_monitor_overview.md):提供基于Opentelemetry的应用性能监控。 +* [K8s监控](../ProductFeatures/scene-k8s/k8s_monitor_overview.md):提供k8s云原生的监控解决方案。 +* [APM](../ProductFeatures/scene-apm/apm_monitor_overview.md):提供基于OpenTelemetry的应用性能监控。 * 自定义场景:基于数据源进行场景呈现,如同一个监控插件的数据源,跨多个数据采集任务,同时进行观测。也可以满足个性化的可视化图表配置。 ## 监控配置 @@ -46,6 +46,7 @@ * [告警组](../ProductFeatures/alarm-configurations/alarm_group.md):设置常用的一组人和通知方式 * [告警屏蔽](../ProductFeatures/alarm-handling/block.md):屏蔽告警通知, 有基于范围屏蔽,基于策略,基于事件屏蔽 * [处理套餐](../ProductFeatures/alarm-handling/what_fta.md): 可以通过设置处理套餐,联动JOB、标准运维、ITSM、HTTP回调等周边服务。 +* [告警分派](../ProductFeatures/alarm-configurations/alarm_routing.md):通过告警数据的维度进行路由分派提供告警升级等能力。 ## 集成 diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/perm.md b/ZH/Monitor/3.8/UserGuide/QuickStart/perm.md index acb70b099..0aed72207 100644 --- a/ZH/Monitor/3.8/UserGuide/QuickStart/perm.md +++ b/ZH/Monitor/3.8/UserGuide/QuickStart/perm.md @@ -17,6 +17,6 @@ * 监控的配置者:如运维。适用于申请查看+管理类操作。 * 监控平台的管理者:适用于全局的功能。 -![-w2021](media/16044602044573.jpg) 需要新截图 +![](media/16906145903680.jpg) diff --git a/ZH/Monitor/3.8/UserGuide/QuickStart/sdk_list.md b/ZH/Monitor/3.8/UserGuide/QuickStart/sdk_list.md index fb6107fac..c7871235b 100644 --- a/ZH/Monitor/3.8/UserGuide/QuickStart/sdk_list.md +++ b/ZH/Monitor/3.8/UserGuide/QuickStart/sdk_list.md @@ -1,49 +1,65 @@ # SDK支持的列表 -蓝鲸监控平台完全遵循OpenTelemetry Oteam 和Prometheus 标准 +蓝鲸监控平台完全遵循OpenTelemetry 和 Prometheus 标准 * [Prometheus SDK上报](../ProductFeatures/integrations-metrics/custom_sdk_push.md) -* [Opentelemetry SDK上报](../ProductFeatures/integrations-traces/opentelemetry_overview.md) +* [OpenTelemetry SDK上报](../ProductFeatures/integrations-traces/opentelemetry_overview.md) ## Go -* OTel SDK https://github.com/open-telemetry/opentelemetry-go +* https://github.com/open-telemetry/opentelemetry-go * https://github.com/prometheus/client_golang +使用说明 + +* [OTel SDK golang 使用说明]() +* [Prometheus SDK golang 使用说明]() -* OpenTelemetry SDK(golang) 使用说明 -* Prometheus SDK(golang) 使用说明 mandochen ## Cpp -* OTel SDK https://github.com/open-telemetry/opentelemetry-cpp -* Prometheus SDK(C++) https://github.com/jupp0r/prometheus-cpp -* OpenTelemetry SDK(c++) Oteam 使用说明 -* Prometheus SDK(c++) 使用说明 +* OTel https://github.com/open-telemetry/opentelemetry-cpp +* Prometheus https://github.com/jupp0r/prometheus-cpp + +使用说明 + +* [OTel SDK Cpp 使用说明]() +* [Prometheus SDK Cpp 使用说明]() + ## Java -* OTel SDK https://github.com/open-telemetry/opentelemetry-java -* Prometheus SDK(Java) https://github.com/prometheus/client_java +* OTel https://github.com/open-telemetry/opentelemetry-java +* Prometheus https://github.com/prometheus/client_java + +使用说明 + +* [OTel SDK Java 使用说明]() +* [Prometheus SDK Java 使用说明]() -* OpenTelemetry SDK(Java) 使用说明·1852244526 -* Prometheus SDK(Java) 使用文档 -## python +## Python -* OTel SDk https://github.com/open-telemetry/opentelemetry-python -* Prometheus SDK(python) https://github.com/prometheus/client_python -* OpenTelemetry SDK(python) 使用说明 -* Prometheus SDK(python) 使用文档 +* OTel https://github.com/open-telemetry/opentelemetry-python +* Prometheus https://github.com/prometheus/client_python -## Web JS +使用说明 +* [OTel SDK Python 使用说明]() +* [Prometheus SDK Python 使用说明]() + + +## Web + + +* https://github.com/open-telemetry/opentelemetry-js -## lua ## 蓝鲸SaaS框架 -* 蓝鲸SaaS框架 待补充 -* OpenTelemetry SDK(python 蓝鲸SaaS框架集成)使用说明 等补充 +* 蓝鲸SaaS框架 +* OpenTelemetry SDK(python 蓝鲸SaaS框架集成)使用说明 + + diff --git a/ZH/Monitor/3.8/UserGuide/Term/glossary.md b/ZH/Monitor/3.8/UserGuide/Term/glossary.md index 56bdafea5..c21e55a10 100644 --- a/ZH/Monitor/3.8/UserGuide/Term/glossary.md +++ b/ZH/Monitor/3.8/UserGuide/Term/glossary.md @@ -59,7 +59,7 @@ ### 业务 -业务是监控平台工作的命名空间。 +业务是监控平台工作的命名空间之一,管理所有的主机资源。 ### 服务模块 diff --git a/ZH/PaaS/DevelopTools/SaaSGuide/SUMMARY.md b/ZH/PaaS/DevelopTools/SaaSGuide/SUMMARY.md index e4952d41f..1d190083c 100644 --- a/ZH/PaaS/DevelopTools/SaaSGuide/SUMMARY.md +++ b/ZH/PaaS/DevelopTools/SaaSGuide/SUMMARY.md @@ -22,4 +22,4 @@ * [开发框架使用进阶](DevAdvanced/python_framework_advanced_usage.md) * [BKUI-CLI 使用指南](DevAdvanced/bkui/bkui.md) * [BKUI-CLI 与 Python 开发框架结合使用](DevAdvanced/BKUI.md) - * [蓝鲸 Django 开发框结合 Vue.js 框架项目](DevAdvanced/Django+Vue.js.md) + * [蓝鲸 Django 开发框结合 Vue.js 框架项目](DevAdvanced/Django+Vue.md) diff --git a/config/co-map.yml b/config/co-map.yml index 60461e8ee..e4c2bbb16 100644 --- a/config/co-map.yml +++ b/config/co-map.yml @@ -9115,6 +9115,10 @@ feature_path_map: #https://bk.tencent.com/docs/markdown/ + 流程服务/产品 部署指南/附录/开源组件版本/version.md: ZH/DeploymentGuides/index.md + ZH/Devops/UserGuide/Services/Store/plugins/plugin-error-code.md: ZH/Devops/UserGuide/Developer/plugins/plugin-dev-standard/plugin-error-code.md + ZH/Devops/UserGuide/Services/Store/plugins/plugin-specification.md: ZH/Devops/UserGuide/Developer/plugins/plugin-dev-standard/plugin-specification.md + + diff --git a/script/update_ip.sh b/script/update_ip.sh new file mode 100644 index 000000000..645714b94 --- /dev/null +++ b/script/update_ip.sh @@ -0,0 +1,12 @@ +path=$(cat a.txt | awk '{print $1}') +ip=$(cat a.txt | awk '{print $3}' | grep -Eo "\w+\.\w+\.\w+\.\w+") +lines=$(wc -l a.txt | awk '{print $1}') + +# echo ${path[0]} + +while read line +do + file=$(echo $line | awk '{print $1}' | sed -r 's/\/data\/landun\/workspace/\.\./') + sed -rn '/1/p' $file + exit 1 +done < a.txt