npy_cmp.py

import numpy as np
from glob import glob
import argparse
from tqdm import tqdm
from numpy import dot
from numpy.linalg import norm
from concurrent.futures import ProcessPoolExecutor
from functools import partial

# python npy_cmp.py --in_dir new-spkid/ --test_list test_metas/veri_test2.txt
# compare whether the two way(parallel) of generating spkid will produce the same result
mode='aishell'
def cos_sim(a, b):
    return dot(a, b) / (norm(a) * norm(b))

if mode=='compare':
    parser = argparse.ArgumentParser()
    parser.add_argument("--in_dir", type=str, required=True, help="input dir")
    parser.add_argument("--out_dir", type=str, required=True, help="out dir")
    args = parser.parse_args()

    in_dir=args.in_dir
    out_dir=args.out_dir

    in_npy=glob('%s/**/*.npy' % in_dir)
    out_npy=glob('%s/**/*.npy' % out_dir)

    for infile, outfile in zip(in_npy, out_npy):
        inwav=np.load(infile)
        outwav=np.load(outfile)
        #import pdb;pdb.set_trace()
        mse=np.mean((inwav-outwav) ** 2)
        print(mse, '           ', infile)
    exit()

if mode=='old':
    parser = argparse.ArgumentParser()
    parser.add_argument("--in_dir", type=str, required=True, help="input dir")
    args = parser.parse_args()

    in_dir=args.in_dir

    spk_dirs=glob('%s/*' % in_dir)

    all_spkids=[]
    for spk_dir in spk_dirs:
        cur_spkids=[]
        wav_spkid_npys=glob('%s/*.npy' % spk_dir)
        for wav_spkid_npy in wav_spkid_npys:
            wav_spkid=np.load(wav_spkid_npy)
            cur_spkids.append(wav_spkid)
        all_spkids.append(cur_spkids)

    centroids=[np.mean(cur_spkids, axis=0) for cur_spkids in all_spkids]
    predicts=[]
    labels=[]
    for ind, cur_spkids in tqdm(enumerate(all_spkids)):
        for spkid in tqdm(cur_spkids):
            for ind_cent, cent in enumerate(centroids):
                score=cos_sim(spkid, cent)
                if ind==ind_cent:
                    label=1
                else:
                    label=0
                predicts.append(score)
                labels.append(label)
elif mode=='new':
    def get_spkid_relpath(p):
        #return '/'.join(p.split('/')[::2]).replace('wav', 'npy')
        return p.replace('wav', 'npy')
    parser = argparse.ArgumentParser()
    parser.add_argument("--in_dir", type=str, required=True, help="input dir")
    parser.add_argument("--test_list", type=str, required=True, help="the list of test wavs")
    args = parser.parse_args()

    #assume all the spkid are generated and stored in this folder
    spkid_folder=args.in_dir
    test_file=args.test_list
    predicts=[]
    labels=[]
    with open(test_file) as f:
        for line in tqdm(f.readlines()):
            line=line.strip()
            if line=='':
                continue
            fields=line.split(' ')
            labels.append(int(fields[0]))
            fn1="%s/%s" % (spkid_folder, get_spkid_relpath(fields[1]))
            fn2="%s/%s" % (spkid_folder, get_spkid_relpath(fields[2]))
            #import pdb;pdb.set_trace()
            spkid1=np.load(fn1)
            spkid2=np.load(fn2)
            predicts.append(cos_sim(spkid1, spkid2))

elif mode=='aishell':
    def get_spkid_relpath(s):
        spkid=s[1:6]
        return "%s/%s.npy" % (spkid, s)
    parser = argparse.ArgumentParser()
    parser.add_argument("-i", "--in_dir", type=str, help="input dir")
    parser.add_argument("-t", "--test_list", type=str, help="the list of test wavs")
    parser.add_argument("-r", "--res", type=str, help="result")
    args = parser.parse_args()

    #assume all the spkid are generated and stored in this folder
    spkid_folder=args.in_dir
    test_file=args.test_list
    res_file=args.res
    #predicts=[]
    #labels=[]
    n_jobs=40

    def process_list(part_list, fn):
        labels=[]
        predicts=[]
        for line in tqdm(part_list):
            line=line.strip()
            if line=='':
                continue
            fields=line.split(' ')
            labels.append(int(fields[2]))
            fn1="%s/%s" % (spkid_folder, get_spkid_relpath(fields[0]))
            fn2="%s/%s" % (spkid_folder, get_spkid_relpath(fields[1]))
            #import pdb;pdb.set_trace()
            spkid1=np.load(fn1)
            spkid2=np.load(fn2)
            predicts.append(cos_sim(spkid1, spkid2))
        with open(fn, 'w') as f:
            for predict, label in zip(predicts, labels):
                f.write("%f %d\n" % (predict, label))


    import pdb;pdb.set_trace()
    if spkid_folder and test_file:
        with open(test_file) as f:
            lines=f.readlines()

        splitted_lines=[lines[i*5000:(i+1)*5000] for i in range(n_jobs)]
        executor = ProcessPoolExecutor(max_workers=n_jobs)
        futures_tuples=[]
        futures=[]
        for i, part_list in enumerate(splitted_lines):
            futures.append(executor.submit(partial(
                process_list, part_list, "tmp/out%d.txt" % i)))
        futures_tuples.append([future.result() for future in tqdm(futures) if future.result() is not None])
        exit()

    elif res_file:
        with open(res_file) as f:
            predicts=[]
            labels=[]
            for line in f.readlines():
                line=line.strip()
                if line=='':
                    continue
                predict, label=line.split(' ')
                predicts.append(float(predict))
                labels.append(int(label))


    #with open(test_file) as f:
    #    for line in tqdm(f.readlines()[:1000]):
    #        line=line.strip()
    #        if line=='':
    #            continue
    #        fields=line.split(' ')
    #        labels.append(int(fields[2]))
    #        fn1="%s/%s" % (spkid_folder, get_spkid_relpath(fields[0]))
    #        fn2="%s/%s" % (spkid_folder, get_spkid_relpath(fields[1]))
    #        #import pdb;pdb.set_trace()
    #        spkid1=np.load(fn1)
    #        spkid2=np.load(fn2)
    #        predicts.append(cos_sim(spkid1, spkid2))

#import numpy
#import argparse
#import pdb

from scipy.optimize import brentq
from sklearn.metrics import roc_curve
from scipy.interpolate import interp1d

# ==================== === ====================

#parser = argparse.ArgumentParser(description = "VoxSRC");
#
#parser.add_argument('--ground_truth', type=str, default='data/veri_test.txt', help='Ground truth file');
#parser.add_argument('--prediction', type=str, default='data/veri_test_output.txt', help='Prediction file');
#parser.add_argument('--positive', type=int, default=1, help='1 if higher is positive; 0 is lower is positive');
#
#opt = parser.parse_args();
pos=1

# ==================== === ====================

def calculate_eer(y, y_score, pos):
# y denotes groundtruth scores,
# y_score denotes the prediction scores.

	fpr, tpr, thresholds = roc_curve(y, y_score, pos_label=pos)
        # fpr = fp/n
        # tpr = tp/p
        # fnr = fn/p = 1-tpr
        # tnr = tn/n = 1-fpr
        # since fpr == fnr in this case, the total error rate is fpr
	eer = brentq(lambda x : 1. - x - interp1d(fpr, tpr)(x), 0., 1.)
	thresh = interp1d(fpr, thresholds)(eer)

	return eer, thresh

# ==================== === ====================

eer, thresh = calculate_eer(labels, predicts, pos)

print('EER : %.3f%%'%(eer*100))