Merge pull request #3 from micado-scale/dev

chore: catch-up main branch for development
micado-scale · Feb 21, 2022 · ceb86db · ceb86db
2 parents ef3bce4 + 418ad95
commit ceb86db
Show file tree

Hide file tree

Showing 64 changed files with 2,738 additions and 4,379 deletions.
diff --git a/data/constants.yaml b/data/constants.yaml
@@ -1,22 +1,24 @@
+action_lag: 1
 advice_freeze_interval: 0
+auto_trainer: true
 input_metrics:
-- name: PktIn
-- name: KBIn
 - name: AVG_RR
+- name: SUM_RR
+- name: CPU
 - name: Inter
 - name: CTXSW
+- name: KBIn
+- name: PktIn
 - name: KBOut
-- name: CPU
-- name: SUM_RR
 - name: PktOut
 knowledge_base: use_existing
-max_downscale_delta: 6
-max_upscale_delta: 6
+max_downscale_delta: 4
+max_upscale_delta: 5
 max_vm_number: 10
 min_vm_number: 1
 nn_stop_error_rate: 10.0
 target_metrics:
-- max_threshold: 12000
-  min_threshold: 6000
+- max_threshold: 4000000
+  min_threshold: 1000000
   name: AVG_LAT_05
-training_samples_required: 4000
+training_samples_required: 300
diff --git a/data/nn_training_data.csv b/data/nn_training_data.csv
diff --git a/images/AverageLatencyQuantileZeroPointFiveTimeLines.png b/images/AverageLatencyQuantileZeroPointFiveTimeLines.png
diff --git a/...s/AverageLatencyQuantileZeroPointFiveTimeLinesAndPredictedValuesAgainstTime.png b/...s/AverageLatencyQuantileZeroPointFiveTimeLinesAndPredictedValuesAgainstTime.png
diff --git a/...AverageLatencyQuantileZeroPointFiveTimeLinesAndPredictedValuesAgainstTime_3.png b/...AverageLatencyQuantileZeroPointFiveTimeLinesAndPredictedValuesAgainstTime_3.png
diff --git a/images/InnerStateMetricRegression1.png b/images/InnerStateMetricRegression1.png
diff --git a/images/InnerStateMetricRegression2.png b/images/InnerStateMetricRegression2.png
diff --git a/images/InnerStateMetricRegression3.png b/images/InnerStateMetricRegression3.png
diff --git a/images/InnerStateMetricRegression4.png b/images/InnerStateMetricRegression4.png
diff --git a/images/InnerStateMetricRegression5.png b/images/InnerStateMetricRegression5.png
diff --git a/images/InnerStateMetricRegression6.png b/images/InnerStateMetricRegression6.png
diff --git a/images/InnerStateMetricRegression7.png b/images/InnerStateMetricRegression7.png
diff --git a/images/InnerStateVariableTimeLines_2.png b/images/InnerStateVariableTimeLines_2.png
diff --git a/images/InnerStateVariableVsTargetVariable.png b/images/InnerStateVariableVsTargetVariable.png
diff --git a/images/PredictedYByWorkers.png b/images/PredictedYByWorkers.png
diff --git a/images/ResponseTimeAdvicePredicted.png b/images/ResponseTimeAdvicePredicted.png
diff --git a/images/ResponseTimeAdvicePredictedWorkerCount.png b/images/ResponseTimeAdvicePredictedWorkerCount.png
diff --git a/images/VisualizePredictedYLineWithValuesDenormalized.png b/images/VisualizePredictedYLineWithValuesDenormalized.png
diff --git a/images/VisualizePredictedYLineWithValuesNormalized.png b/images/VisualizePredictedYLineWithValuesNormalized.png
diff --git a/images/Y_normailizedVsY_predictedLatency.png b/images/Y_normailizedVsY_predictedLatency.png
diff --git a/models/saved_linearregression_model_CPU.pkl b/models/saved_linearregression_model_CPU.pkl
diff --git a/models/saved_linearregression_model_CTXSW.pkl b/models/saved_linearregression_model_CTXSW.pkl
diff --git a/models/saved_linearregression_model_Inter.pkl b/models/saved_linearregression_model_Inter.pkl
diff --git a/models/saved_linearregression_model_KBIn.pkl b/models/saved_linearregression_model_KBIn.pkl
diff --git a/models/saved_linearregression_model_KBOut.pkl b/models/saved_linearregression_model_KBOut.pkl
diff --git a/models/saved_linearregression_model_PktIn.pkl b/models/saved_linearregression_model_PktIn.pkl
diff --git a/models/saved_linearregression_model_PktOut.pkl b/models/saved_linearregression_model_PktOut.pkl
diff --git a/models/saved_mlp_model.pkl b/models/saved_mlp_model.pkl
diff --git a/models/scaler_normalizeX.save b/models/scaler_normalizeX.save
diff --git a/models/scaler_normalizeY.save b/models/scaler_normalizeY.save
diff --git a/opt_advisor.py b/opt_advisor.py
@@ -24,6 +24,7 @@
 from visualizerlinux import VisualizePredictedXY2Line
 from visualizerlinux import VisualizePredictedXY3Line
 from visualizerlinux import VisualizePredictedXY4Line
+from visualizerlinux import VisualizeDemo1
 # from visualizerlinux import VisualizePredictedXYLine
 # from visualizerlinux import VisualizePredictedXYLine
 
@@ -60,7 +61,8 @@
 default_advice_freeze_interval = 0        # must be positive
 
 start_training_vm_number = 1                    # vm number when train phase stars
-autotrain = True                                # handle the optimizer -> adviser the scaling durint the training phas
+default_autotrain = True
+autotrain = None                                # handle the optimizer -> adviser the scaling during the training phase
 
 
 
@@ -122,7 +124,8 @@ def init(_target_metric, input_metrics, worker_count, _outsource_metrics, _confi
     start_training_vm_number = 1
 
     global autotrain
-    autotrain = True
+    # autotrain = True
+    autotrain = constants.get('auto_trainer') if constants.get('auto_trainer') else default_autotrain
 
     logger.info('     ----------------------------------------------')
     logger.info('     ---------- ADVISOR INIT DIAGNOSIS ------------')
@@ -142,6 +145,8 @@ def init(_target_metric, input_metrics, worker_count, _outsource_metrics, _confi
     logger.info(f'     worker_count_name = {worker_count_name}')
     logger.info(f'     _outsource_metrics = {_outsource_metrics}')
     logger.info(f'     outsource_metrics = {outsource_metrics}')
+    logger.info('     ----------------------------------------')
+    logger.info(f'     autotrain         = {autotrain}')
 
     logger.info('-----------------------  advisor init end  ----------------------')
 
@@ -152,12 +157,27 @@ def init(_target_metric, input_metrics, worker_count, _outsource_metrics, _confi
 # ## ------------------------------------------------------------------------------------------------------
 
 def advice_msg(valid = False, phase = 'training', vm_number = 0, reliability = 0, error_msg = None):
+    logger = logging.getLogger('optimizer')
     if valid:
-        return jsonify(dict(valid = valid, phase = phase, vm_number = vm_number, reliability = reliability, error_msg = 'no error')), 200
+        error_msg = 'no error'
+
+    logger.info('----------------------------------------------------------')
+    logger.info('   ADVICE FOR THE POLICY KEEPER')
+    logger.info('----------------------------------------------------------')
+    logger.info(f'   valid               = {valid}')
+    logger.info(f'   phase               = {phase}')
+    logger.info(f'   vm_number           = {vm_number}')
+    logger.info(f'   reliability         = {reliability}')
+    logger.info(f'   error_msg           = {error_msg}')
+    logger.info('----------------------------------------------------------')
+    logger.info('----------------------------------------------------------')
+    logger.info('----------------------------------------------------------')
+
+    if valid:
+        return jsonify(dict(valid = valid, phase = phase, vm_number = vm_number, reliability = reliability, error_msg = error_msg)), 200
     else:
         return jsonify(dict(valid = valid, phase = phase, vm_number = vm_number, reliability = reliability, error_msg = error_msg)), 400
-
-
+
 
 
 # ## ------------------------------------------------------------------------------------------------------
@@ -213,8 +233,8 @@ def run(csfFileName, vm_number_from_sample, target_variable_from_sample, last =
     # testFileName = 'data/test_data.csv'                                  # test data
     testFileName = csfFileName                                             # from parameter
 
-    maximumNumberIncreasableNode = 6                                       # must be positive 6
-    minimumNumberReducibleNode = -6                                        # must be negativ -4
+    # maximumNumberIncreasableNode = 6                                     # must be positive 6
+    # minimumNumberReducibleNode = -6                                      # must be negativ -4
 
     upperLimit = target_metric_max                                         # 4000000
     lowerLimit = target_metric_min                                         # 1000000
@@ -267,8 +287,8 @@ def run(csfFileName, vm_number_from_sample, target_variable_from_sample, last =
     logger.info('----------- Checking advisor data properties -------------')
     if df.shape[0] <= 0:
         error_msg = 'There is no training sample yet.'
-        logger.error(error_msg)
-        return advice_msg(valid = False, phase = 'training', error_msg = error_msg)
+        logger.warning(error_msg)
+        return advice_msg(valid = False, vm_number = 1, phase = 'training', error_msg = error_msg)
 
 
     # ## ------------------------------------------------------------------------------------------------------
@@ -282,7 +302,7 @@ def run(csfFileName, vm_number_from_sample, target_variable_from_sample, last =
         logger.info('------- There is no training sample at all. -------')
         logger.info(f'---------------- We have only {df.shape[0]} sample ----------------')
         error_msg = 'There is no training sample at all.'
-        return advice_msg(valid = False, phase = 'training', error_msg = error_msg)
+        return advice_msg(valid = False, vm_number = 1, phase = 'training', error_msg = error_msg)
 
 
     # ## ------------------------------------------------------------------------------------------------------
@@ -309,7 +329,7 @@ def run(csfFileName, vm_number_from_sample, target_variable_from_sample, last =
     # Original
     if( autotrain == False ):
         if(df.shape[0] < constants.get('training_samples_required')):
-            error_msg = 'There are not enough training samples yet.'
+            error_msg = 'There are not enough training samples yet. [' + df.shape[0] + ']'
             logger.warn(error_msg)
             return advice_msg(valid = False, phase = 'training', error_msg = error_msg)
 
@@ -340,7 +360,7 @@ def run(csfFileName, vm_number_from_sample, target_variable_from_sample, last =
             logger.warn(f'--------------------------------------')
             logger.warn(f'Current number of resources during the training')
             logger.warn(f'start_training_vm_number = {start_training_vm_number}')
-            return advice_msg(valid = True, phase = 'production', vm_number = start_training_vm_number, error_msg = error_msg)
+            return advice_msg(valid = True, phase = 'training', vm_number = start_training_vm_number, error_msg = error_msg)
 
 
 
@@ -629,9 +649,16 @@ def calculatePredictedLatencyWithVariousWorkers(modelNeuralNet, to):
     logger.info('------ Get Actual Number of WorkerCount based on investigationDeNormalizedDF ------')
 
     # itt eldönthetem, hogy a dataframeből olvasom ki ezt az adatot, vagy paraméterként veszem át
-    actual_worker_number = investigationDeNormalizedDF[['WorkerCount']].get_value(investigationDeNormalizedDF.index[0], 'WorkerCount')
+    # Ez a vm_number_from_sample érték a run metodus paramétere, az opt_rest elvileg a valós vm számot adja itt át
+    actual_worker_number = vm_number_from_sample
+    # actual_worker_number = investigationDeNormalizedDF[['WorkerCount']].get_value(investigationDeNormalizedDF.index[0], 'WorkerCount')
     # másfelől lehet, hogy ezt az értéket az épen aktuális mintából kéne kivennem?!
     # nem ezt már kiolvastam a sample df-ből (persze lehet, hogy az épen aktuális már nem ez)
+    logger.info('-----------------------------------------------------------------------------------')
+    logger.info('\n\n\n\n\n\n\n\n')
+    logger.info(f'  actual_worker_number                    = {actual_worker_number}')
+    logger.info('\n\n\n\n\n\n\n\n')
+    logger.info('-----------------------------------------------------------------------------------')
 
 
     advice = 0
@@ -714,7 +741,9 @@ def calculatePredictedLatencyWithVariousWorkers(modelNeuralNet, to):
 
         if( upperLimit > real and lowerLimit < real ):
             advice = 0
-            actual_worker_number = investigationDeNormalizedDF[['WorkerCount']].get_value(i, 'WorkerCount')
+            # Ez a vm_number_from_sample érték a run metodus paramétere, az opt_rest elvileg a valós vm számot adja itt át
+            # actual_worker_number = vm_number_from_sample
+            # actual_worker_number = investigationDeNormalizedDF[['WorkerCount']].get_value(i, 'WorkerCount')
             # advicedVM = investigationDeNormalizedDF[['WorkerCount']].get_value(i, 'WorkerCount')
             advicedVM = actual_worker_number
             # Ne a javaslatot, hanem a konkrét gép számot adja vissza
@@ -824,7 +853,7 @@ def calculatePredictedLatencyWithVariousWorkers(modelNeuralNet, to):
     logger.info('--------- Pass back Goodness of Fit ----------')
     if( training_result[1] is not None ):
         # TODO:
-        # Avoid potential error with try exept
+        # Avoid potential error with try except
         try:
             reliability = training_result[1].get('correlation') * 100
             if( reliability < 0 ):
@@ -885,6 +914,19 @@ def calculatePredictedLatencyWithVariousWorkers(modelNeuralNet, to):
         logger.info(f'  vm_number_total = {vm_number_total}')
         logger.info('---------------------------------------------------------------------------')
 
+    # ## 2019.11.07
+
+    # ## ------------------------------------------------------------------------------------------------------
+    # ## Bekorlátozás
+    # ## ------------------------------------------------------------------------------------------------------
+
+    vm_number_total = max(constants.get('min_vm_number'), vm_number_total)
+    vm_number_total = min(constants.get('max_vm_number'), vm_number_total)
+
+
+    # ## ------------------------------------------------------------------------------------------------------
+    # ## Send JSON back to Pollicy Keeper
+    # ## ------------------------------------------------------------------------------------------------------
 
     return_msg = advice_msg(valid = True, phase = phase, vm_number = vm_number_total, reliability = reliability)
 
@@ -991,17 +1033,34 @@ def calculatePredictedLatencyWithVariousWorkers(modelNeuralNet, to):
 
 def generate_report(df, min_threshold, max_threshold):
 
-    VisualizePredictedXY2Line(df[[target_variable]], df[['advised_vm_number']], target_variable, min_threshold, max_threshold)
+    row = df.shape[0]
+
+    if( row % 5 == 0 ):
 
-    VisualizePredictedXY3Line(df[[target_variable]], \
-                              df[['post_scaled_target_variable']], \
-                              df[['advised_vm_number']], target_variable, min_threshold, max_threshold)
+        VisualizePredictedXY2Line(df[[target_variable]], df[['advised_vm_number']], target_variable, min_threshold, max_threshold)
 
-    VisualizePredictedXY4Line(df[[target_variable]], \
-                              df[['post_scaled_target_variable']], \
-                              df[['advised_vm_number']], \
-                              df[['vm_number']], \
-                              target_variable, min_threshold, max_threshold)
+    if( row % 5 == 1 ):
+
+        VisualizePredictedXY3Line(df[[target_variable]], \
+                                  df[['post_scaled_target_variable']], \
+                                  df[['advised_vm_number']], target_variable, min_threshold, max_threshold)
+
+    if( row % 5 == 2 ):
+        VisualizePredictedXY4Line(df[[target_variable]], \
+                                  df[['post_scaled_target_variable']], \
+                                  df[['advised_vm_number']], \
+                                  df[['vm_number']], \
+                                  target_variable, min_threshold, max_threshold)
+
+    if( row % 5 == 3 ):
+        VisualizeDemo1(df[['SUM_RR']], \
+                       df[['vm_number']], \
+                       df[['advised_vm_number']], 'Sum Request Rate', 'demo1.png')
+
+    if( row % 5 == 4 ):
+        VisualizeDemo1(df[[target_variable]], \
+                       df[['vm_number']], \
+                       df[['advised_vm_number']], target_variable, 'demo2.png')
 
     # r = re.compile('.*0*.')
     r = re.compile('.*denormalized*.')

diff --git a/opt_rest.py b/opt_rest.py
@@ -1,4 +1,5 @@
-from flask import Flask, jsonify, request, send_file, render_template, Response
+from flask import Flask, jsonify, request, send_file, render_template, Response, send_from_directory
+from werkzeug import secure_filename
 from ruamel import yaml
 
 import logging
@@ -11,11 +12,25 @@
 
 import pandas as pd
 import numpy as np
+import os
+
+
+UPLOAD_FOLDER = 'data'
+ALLOWED_EXTENSIONS = set(['csv'])
+
+def allowed_file(filename):
+    return '.' in filename and filename.rsplit('.', 1)[1].lower() in ALLOWED_EXTENSIONS
+
+
 
 
 app = Flask(__name__)
+# app = Flask(__name__,static_folder='data')
+app.config['UPLOAD_FOLDER'] = UPLOAD_FOLDER
 app.config['SEND_FILE_MAX_AGE_DEFAULT'] = 0
 
+
+
 logger = None
 config = None
 training_unit = None
@@ -135,7 +150,7 @@ def init():
 
         global opt_trainer
         training_samples_required = constants.get('training_samples_required')
-        opt_trainer.init(target_metrics, input_metrics, worker_count, training_samples_required, outsource_metrics)
+        opt_trainer.init(target_metrics, input_metrics, worker_count, training_samples_required, outsource_metrics, constants)
 
         logger.info('--------------------------------------------------------------')
         logger.info('          Optimizer REST initialized successfully             ')
@@ -199,6 +214,13 @@ def sample():
         logger.info('      ----------------------- sample -----------------------')
         logger.info('')
         logger.info('--------------------------------------------------------------')
+
+        print(len(target_metrics))
+        if(len(target_metrics) == 0):
+            target_metrics[0] = 0.0
+        print(target_metrics)
+        logger.info(f'      target_variable = {target_variable}')
+        logger.info(f'      target_metrics = {target_metrics}')
 
 
         # if None not in timestamp_col+input_metrics+target_metrics+[vm_number]: 
@@ -393,7 +415,48 @@ def report():
         return render_template('index.html')
     else:
         logger.info('        application is NOT reportable         ')
-        return 'There is not enough sample to get report'
+        # return 'There is not enough sample to get report'
+        return render_template('manager.html')
+
+
+@app.route('/report', methods=['POST'])
+def report_post():
+    logger.info('----------------------------------------------------------')
+    logger.info('              report POST method called                   ')
+    logger.info('----------------------------------------------------------')
+    if( is_reportable == True ):
+        url = 'index.html'
+    else:
+        url = 'manager.html'
+
+    url = 'index.html' if is_reportable == True else 'manager.html'
+
+    if request.method =='POST':
+        file = request.files['file[]']
+        logger.info(f'------type(file) = {type(file)}')
+        if file:
+            logger.info('------ file ------')
+            filename = secure_filename(file.filename)
+            logger.info('------ file ------')
+            file.save(os.path.join(app.config['UPLOAD_FOLDER'],filename))
+            logger.info('------ save ------')
+            # return render_template('index.html')
+            return render_template(url)
+    # return render_template('index.html')
+    return render_template(url)
+
+# Custom static data
+@app.route('/data/<path:filename>')
+def custom_static(filename):
+    # return send_from_directory('data', filename)
+    return send_from_directory(directory='data', filename=filename)
+
+# Custom static data
+@app.route('/outputs/<path:filename>')
+def download_from_outputs(filename):
+    return send_from_directory(directory='outputs', filename=filename)
+
+
 
 
 class RequestException(Exception):