Source code for umap_metric

"""
Distance metrics for functions and curves in R^n for use with UMAP
(https://github.com/lmcinnes/umap)

moduleauthor:: J. Derek Tucker <jdtuck@sandia.gov>

"""

import numba
from numba.core.typing import cffi_utils
from _DP import ffi, lib
import _DP
from numpy import (
    linspace,
    interp,
    zeros,
    diff,
    double,
    sqrt,
    arange,
    int64,
    trapezoid,
    ones,
)
from numpy import (
    ascontiguousarray,
    roll,
    eye,
    arccos,
)
from numpy import kron, floor, mean
from numpy.linalg import norm, svd, det, solve


DP = lib.DP
cffi_utils.register_module(_DP)


@numba.njit()
def grad(f, binsize):
    n = f.shape[0]
    g = zeros(n)
    h = binsize * arange(1, n + 1)
    g[0] = (f[1] - f[0]) / (h[1] - h[0])
    g[-1] = (f[-1] - f[(-2)]) / (h[-1] - h[-2])

    h = h[2:] - h[0:-2]
    g[1:-1] = (f[2:] - f[0:-2]) / h[0]

    return g


@numba.njit()
def warp(q1, q2):
    M = q1.shape[0]
    disp = 0
    n1 = 1
    lam = 0.0
    gam = zeros(M)
    q1 = q1 / norm(q1)
    q2 = q2 / norm(q2)
    q1 = ascontiguousarray(q1)
    q2 = ascontiguousarray(q2)
    gam = ascontiguousarray(gam)
    q2i = ffi.from_buffer(q2)
    q1i = ffi.from_buffer(q1)
    gami = ffi.from_buffer(gam)
    DP(q2i, q1i, n1, M, lam, disp, gami)

    return gam


@numba.njit()
def basis(q):
    n, T = q.shape
    e = eye(n)
    Ev = zeros((n, T, n))
    for i in range(0, n):
        x = e[:, i]
        Ev[:, :, i] = x.repeat(T).reshape((-1, T))

    qnorm = zeros(T)
    for t in range(0, T):
        qnorm[t] = norm(q[:, t])

    delG = list()
    for i in range(0, n):
        x = q[i, :] / qnorm
        tmp1 = x.repeat(n).reshape((-1, n)).T
        tmp2 = qnorm.repeat(n).reshape((-1, n)).T
        delG.append(tmp1 * q + tmp2 * Ev[:, :, i])

    return delG


@numba.njit()
def freshape(f):
    n, M = f.shape
    out1 = f.reshape(M * n)
    out = zeros(M * n)
    out[::2] = out1[0:M]
    out[1::2] = out1[M:]

    return out


@numba.njit()
def warp_curve(q1, q2):
    n1, M = q1.shape
    disp = 0
    lam = 0.0
    gam = zeros(M)
    q1i = freshape(q1)
    q2i = freshape(q2)

    q1i = ascontiguousarray(q1i)
    q2i = ascontiguousarray(q2i)

    gam = ascontiguousarray(gam)
    q1ptr = ffi.from_buffer(q1i)
    q2ptr = ffi.from_buffer(q2i)
    gami = ffi.from_buffer(gam)
    DP(q2ptr, q1ptr, n1, M, lam, disp, gami)

    return gam


@numba.njit()
def shift_curve(f, tau):
    n, T = f.shape
    fn = zeros((n, T))
    for i in range(n):
        fn[i, 0 : (T - 1)] = roll(f[i, 0 : (T - 1)], tau)
        fn[i, T - 1] = fn[i, 0]
    return fn


@numba.njit()
def c_to_q(beta, closed):
    n, T = beta.shape
    v = zeros((n, T))
    for i in range(n):
        v[i, :] = grad(beta[i, :], 1.0 / (T - 1))

    q = zeros((n, T))
    for i in range(T):
        L = sqrt(norm(v[:, i]))
        if L > 0.0001:
            q[:, i] = v[:, i] / L
        else:
            q[:, i] = v[:, i] * 0.0001

    tmp = q * q
    tmp.sum() / T
    tmp1 = tmp.sum() / T
    q = q / sqrt(tmp1)

    if closed == 1:
        q = proj_c(q)

    return q


@numba.njit()
def find_rot(q1, q2):
    q1 = ascontiguousarray(q1)
    q2 = ascontiguousarray(q2)
    n = q1.shape[0]
    A = q1.dot(q2.T)
    U, s, Vh = svd(A)

    tst = det(A)
    if tst > 0:
        S = eye(n)
    else:
        S = eye(n)
        S[:, -1] = -S[:, -1]

    R = U.dot(S).dot(Vh)
    return R


@numba.njit()
def inner_prod(q1, q2):
    T = q1.shape[1]
    cst = q1 * q2
    tmp = cst.sum() / T
    return tmp


@numba.njit()
def proj_c(q):
    n, T = q.shape
    if n == 2:
        dt = 0.35
    if n == 3:
        dt = 0.2
    epsilon = 1e-6

    iter = 1
    res = ones(n)
    J = zeros((n, n))

    s = linspace(0, 1, T)

    qnew = q / sqrt(inner_prod(q, q))
    qnorm = zeros(T)
    G = zeros(n)
    C = zeros(300)
    while norm(res) > epsilon:
        if iter > 300:
            break

        # Jacobian
        for i in range(0, n):
            for j in range(0, n):
                J[i, j] = 3 * trapezoid(qnew[i, :] * qnew[j, :], s)

        J += eye(n)

        for i in range(0, T):
            qnorm[i] = norm(qnew[:, i])

        # Compute the residue
        for i in range(0, n):
            G[i] = trapezoid(qnew[i, :] * qnorm, s)

        res = -G

        if norm(res) < epsilon:
            break

        x = solve(J, res)
        C[iter] = norm(res)

        delG = basis(qnew)
        temp = zeros((n, T))
        for i in range(0, n):
            temp += x[i] * delG[i] * dt

        qnew += temp
        iter += 1

    qnew = qnew / sqrt(inner_prod(qnew, qnew))

    return q


@numba.njit()
def find_seed_rot(beta1, beta2, closed):
    beta1 = ascontiguousarray(beta1)
    beta2 = ascontiguousarray(beta2)
    q1 = c_to_q(beta1, closed)

    n, T = beta1.shape
    scl = 4.0
    minE = 1000
    if closed == 1:
        end_idx = int(floor(T / scl))
        scli = 4
    else:
        end_idx = 0

    x = linspace(0, 1, T)
    for ctr in range(0, end_idx + 1):
        if closed == 1:
            shift = int(scli * ctr)
            beta2n = shift_curve(beta2, shift)
        else:
            beta2n = beta2

        R = find_rot(beta1, beta2n)
        beta2new = R.dot(beta2n)
        q2new = c_to_q(beta2new, closed)

        gam = warp_curve(q2new, q1)
        gamI = interp(x, gam, x)

        # apply warp
        beta_warp = zeros((n, T))
        for j in range(0, n):
            beta_warp[j, :] = interp(gamI, x, beta2new[j, :])

        q2new = c_to_q(beta_warp, closed)

        if closed == 1:
            q2new = proj_c(q2new)

        tmp = inner_prod(q1, q2new)
        if tmp > 1:
            tmp = 1
        Ec = arccos(tmp)
        if Ec < minE:
            q2best = q2new

    return q2best


@numba.njit()
def curve_center(beta):
    n, T = beta.shape
    betadot = zeros((n, T))
    for i in range(n):
        betadot[i, :] = grad(beta[i, :], 1.0 / (T - 1))

    normbetadot = zeros(T)
    integrand = zeros((n, T))
    for i in range(T):
        normbetadot[i] = norm(betadot[:, i])
        integrand[:, i] = beta[:, i] * normbetadot[i]

    scale = trapezoid(normbetadot, linspace(0, 1, T))
    centroid = zeros(n)
    for i in range(n):
        centroid[i] = trapezoid(integrand[i, :], linspace(0, 1, T)) / scale

    return centroid



[docs]
@numba.njit()
def efda_distance(q1, q2, alpha=0):
    """ "
    calculates the distances between two curves, where
    q2 is aligned to q1. In other words calculates the elastic distances/
    This metric is set up for use with UMAP or t-sne from scikit-learn

    :param q1: vector of size N
    :param q2: vector of size N
    :param alpha: weight between phase and amplitude
                  (default = 0, returns amplitude)

    :rtype: scalar
    :return dist: amplitude distance
    """
    tst = q1 - q2
    if tst.sum() == 0:
        dist = 0
    else:
        q1 = q1.astype(double)
        q2 = q2.astype(double)
        gam = warp(q1, q2)
        M = q1.shape[0]
        time = linspace(0, 1, q1.shape[0])
        gam = (gam - gam[0]) / (gam[-1] - gam[0])
        gam_dev = grad(gam, 1 / double(M - 1))
        tmp = interp((time[-1] - time[0]) * gam + time[0], time, q2)

        qw = tmp * sqrt(gam_dev)

        y = (qw - q1) ** 2
        tmp = diff(time) * (y[0:-1] + y[1:]) / 2
        da = sqrt(tmp.sum())

        binsize = mean(diff(time))
        psi = sqrt(grad(gam, binsize))
        q1dotq2 = trapezoid(psi, time)
        if q1dotq2 > 1:
            q1dotq2 = 1
        elif q1dotq2 < -1:
            q1dotq2 = -1
        dp = arccos(q1dotq2)

        dist = (1 - alpha) * da + alpha * dp

    return dist




[docs]
@numba.njit()
def efda_distance_curve(beta1, beta2, closed):
    """ "
    calculates the distances between two curves, where
    beta2 is aligned to beta1. In other words calculates the elastic distance.
    This metric is set up for use with UMAP or t-sne from scikit-learn

    :param beta1: vector of size n*M
    :param beta2: vector of size n*M
    :param closed: (0) if open curves and (1) if closed curves

    :rtype: scalar
    :return dist: shape distance
    """
    tst = beta1 - beta2
    if tst.sum() == 0:
        dist = 0.0
    else:
        n = int64(2)
        T = int64(beta1.shape[0] / n)
        beta1 = ascontiguousarray(beta1)
        beta2 = ascontiguousarray(beta2)
        beta1_i = beta1.reshape((n, T))
        beta2_i = beta2.reshape((n, T))
        beta1_i = beta1_i.astype(double)
        beta2_i = beta2_i.astype(double)

        centroid1 = curve_center(beta1_i)
        beta1_i = beta1_i - kron(ones((T, 1)), centroid1).T
        centroid2 = curve_center(beta2_i)
        beta2_i = beta2_i - kron(ones((T, 1)), centroid2).T

        q1 = c_to_q(beta1_i, closed)

        q1 = ascontiguousarray(q1)
        # optimize over SO(n) x Gamma
        q2 = find_seed_rot(beta1_i, beta2_i, closed)

        q1dotq2 = inner_prod(q1, q2)
        if q1dotq2 > 1:
            q1dotq2 = 1
        elif q1dotq2 < -1:
            q1dotq2 = -1
        dist = arccos(q1dotq2)

    return dist