Functions
	computeFingerprint (x, f_s)
	computes subfingerprints from audio (derived from Haitsma et al.), 256 subfingerprints comprise one fingerprint

	generateBands_I (iFftLength, f_s)

	computeFingerprintCl (cPath)
	main

Variables
	parser = argparse.ArgumentParser(description='Extract fingerprint from wav file')

	metavar

	required

	help

	args = parser.parse_args()

	cPath = args.infile

Function Documentation

◆ computeFingerprint()

computeFingerprint	(		x,
			f_s )

computes subfingerprints from audio (derived from Haitsma et al.), 256 subfingerprints comprise one fingerprint

Parameters

x	array with floating point audio data (dimension samples x channels)
f_s	sample rate of audio data

Returns: F: series of subfingerprints; t: time stamps

Definition at line 19 of file computeFingerprint.py.

def computeFingerprint(x, f_s):
 
    # set default parameters
    fs_target = 5000
    iBlockLength = 2048
    iHopLength = 64
  
    # pre-processing: down-mixing and normalization
    x = ToolPreprocAudio(x)
 
    # pre-processing: downsampling to target sample rate
    if f_s != fs_target:
        x, t_x = ToolResample(x, fs_target, f_s)
    
    # initialization: generate transformation matrix for 33 frequency bands
    H = generateBands_I(iBlockLength, fs_target)
    
    # initialization: generate FFT window
    afWindow = ToolComputeHann(iBlockLength)
    
    # in the real world, we would do this block by block...
    [X, f, tf] = computeSpectrogram(x, f_s, afWindow, iBlockLength, iHopLength)
 
    # power spectrum
    X = np.abs(X)**2
    
    # group spectral bins in bands
    E = np.matmul(H, X)
    
    # extract fingerprint through diff (both time and freq)
    SubFingerprint = np.diff(np.diff(E, 1, axis=0), 1, axis=1)
    tf = tf[:-1] + iHopLength / (2 * fs_target)
 
    # quantize fingerprint
    SubFingerprint[SubFingerprint < 0] = 0
    SubFingerprint[SubFingerprint > 0] = 1
 
    return SubFingerprint, tf
 
 

Here is the call graph for this function:

◆ computeFingerprintCl()

computeFingerprintCl ( cPath )

main

Definition at line 83 of file computeFingerprint.py.

def computeFingerprintCl(cPath):
    from pyACA.ToolReadAudio import ToolReadAudio
 
    # read audio file
    [f_s, x] = ToolReadAudio(cPath)
    
    # compute fingerprint
    [F, t] = computeFingerprint(x, f_s)
 
    return F, t

◆ generateBands_I()

generateBands_I	(		iFftLength,
			f_s )

Definition at line 59 of file computeFingerprint.py.

def generateBands_I(iFftLength, f_s):
 
    # constants
    iNumBands = 33
    f_max = 2000
    f_min = 300
    
    # initialize
    f_band_bounds = f_min * np.exp(np.log(f_max / f_min) * range(iNumBands+1) / iNumBands)
    f_fft = np.arange(iFftLength / 2 + 1) / iFftLength * f_s
    H = np.zeros([iNumBands, iFftLength // 2 + 1])
    idx = np.zeros([len(f_band_bounds), 2]).astype(int)
 
    # get indices falling into each band
    for k in range(len(f_band_bounds)-1):
        idx[k, 0] = np.ceil(ToolFreq2Bin(f_band_bounds[k], iFftLength, f_s)).astype(int)
        idx[k, 1] = np.floor(ToolFreq2Bin(f_band_bounds[k+1], iFftLength, f_s)).astype(int)
        H[k, idx[k, 0]:idx[k, 1] + 1] = 1
    
    return H
 
 

Here is the caller graph for this function:

Variable Documentation

◆ args

args = parser.parse_args()

Definition at line 104 of file computeFingerprint.py.

◆ cPath

str cPath = args.infile

Definition at line 105 of file computeFingerprint.py.

◆ help

help

Definition at line 101 of file computeFingerprint.py.

◆ metavar

metavar

Definition at line 100 of file computeFingerprint.py.

◆ parser

parser = argparse.ArgumentParser(description='Extract fingerprint from wav file')

Definition at line 99 of file computeFingerprint.py.

◆ required

required