Source code for pauxy.analysis.extraction

import pandas as pd
import numpy
import json
import h5py
from pauxy.utils.misc import get_from_dict


[docs]def extract_data(filename, group, estimator, raw=False):
    fp = get_param(filename, ['propagators', 'free_projection'])
    with h5py.File(filename, 'r') as fh5:
        dsets = list(fh5[group][estimator].keys())
        data = numpy.array([fh5[group][estimator][d][:] for d in dsets])
        if 'rdm' in estimator or raw:
            return data
        else:
            header = fh5[group]['headers'][:]
            header = numpy.array([h.decode('utf-8') for h in header])
            df = pd.DataFrame(data)
            df.columns = header
            if not fp:
                df = df.apply(numpy.real)
            return df

[docs]def extract_mixed_estimates(filename, skip=0):
    return extract_data(filename, 'basic', 'energies')[skip:]

[docs]def extract_bp_estimates(filename, skip=0):
    return extract_data(filename, 'back_propagated', 'energies')[skip:]

[docs]def extract_rdm(filename, est_type='back_propagated', rdm_type='one_rdm', ix=None):
    rdmtot = []
    if ix is None:
        splits = get_param(filename, ['estimators', 'estimators',
                                      'back_prop', 'splits'])
        ix = splits[0][-1]
    denom = extract_data(filename, est_type, 'denominator_{}'.format(ix), raw=True)
    one_rdm = extract_data(filename, est_type, rdm_type+'_{}'.format(ix), raw=True)
    fp = get_param(filename, ['propagators','free_projection'])
    if fp:
        print("# Warning analysis of FP RDM not implemented.")
        return (one_rdm, denom)
    else:
        if (len(one_rdm.shape) == 4):
            return one_rdm / denom[:,None,None]
        elif (len(one_rdm.shape) == 5):
            return one_rdm / denom[:,None,None,None]
        elif (len(one_rdm.shape) == 3):
            return one_rdm / denom[:,None]
        else:
            return one_rdm / denom

[docs]def set_info(frame, md):
    system = md.get('system')
    qmc = md.get('qmc')
    propg = md.get('propagators')
    trial = md.get('trial')
    ncols = len(frame.columns)
    frame['dt'] = qmc.get('dt')
    frame['nwalkers'] = qmc.get('ntot_walkers')
    frame['free_projection'] = propg.get('free_projection')
    beta = qmc.get('beta')
    bp = md['estimators']['estimators'].get('back_prop')
    frame['nbasis'] = system.get('nbasis', 0)
    if bp is not None:
        frame['tau_bp'] = bp['tau_bp']
    if beta is not None:
        frame['beta'] = beta
        br = qmc.get('beta_scaled')
        if br is not None:
            frame['beta_red'] = br
        mu = system.get('mu')
        if mu is not None:
            frame['mu'] = system.get('mu')
        frame['mu_T'] = trial.get('mu')
        frame['Nav_T'] = trial.get('nav')
    else:
        frame['E_T'] = trial.get('energy')
    if system['name'] == "UEG":
        frame['rs'] = system.get('rs')
        frame['ecut'] = system.get('ecut')
        frame['nup'] = system.get('nup')
        frame['ndown'] = system['ndown']
    elif system['name'] == "Hubbard":
        frame['U'] = system.get('U')
        frame['nx'] = system.get('nx')
        frame['ny'] = system.get('ny')
    elif system['name'] == "Generic":
        ints = system.get('integral_file')
        if ints is not None:
            frame['integrals'] = ints
        chol = system.get('threshold')
        if chol is not None:
            frame['cholesky_treshold'] = chol
        frame['nup'] = system.get('nup')
        frame['ndown'] = system.get('ndown')
        frame['nbasis'] = system.get('nbasis', 0)
    return list(frame.columns[ncols:])

[docs]def get_metadata(filename):
    with h5py.File(filename, 'r') as fh5:
        metadata = json.loads(fh5['metadata'][()])
    return metadata

[docs]def get_param(filename, param):
    md = get_metadata(filename)
    return get_from_dict(md, param)

[docs]def get_sys_param(filename, param):
    return get_param(filename, ['system', param])

[docs]def extract_test_data_hdf5(filename):
    """For use with testcode"""
    data = extract_mixed_estimates(filename).drop(['Iteration', 'Time'], axis=1).to_dict(orient='list')
    # print(data)
    try:
        mrdm = extract_rdm(filename, est_type='mixed', rdm_type='one_rdm')
    except KeyError:
        mrdm = None
    try:
        brdm = extract_rdm(filename, est_type='back_propagated', rdm_type='one_rdm')
    except KeyError:
        brdm = None
    if mrdm is not None:
        mrdm = mrdm[::8].ravel()
        data['Gmixed_re'] = list(numpy.real(mrdm))
        data['Gmixed_im'] = list(numpy.imag(mrdm))
    if brdm is not None:
        brdm = brdm[::8].flatten().copy()
        data['Gbp_re'] = numpy.real(brdm)
        data['Gbp_im'] = numpy.imag(brdm)
    # if itcf is not None:
        # itcf = itcf[abs(itcf) > 1e-10].flatten()
        # data = pd.DataFrame(itcf)
    return data


# TODO : FDM FIX.
# def analysed_itcf(filename, elements, spin, order, kspace):
    # data = h5py.File(filename, 'r')
    # md = json.loads(data['metadata'][:][0])
    # dt = md['qmc']['dt']
    # mode = md['estimators']['estimators']['itcf']['mode']
    # stack_size = md['psi']['stack_size']
    # convert = {'up': 0, 'down': 1, 'greater': 0, 'lesser': 1}
    # if kspace:
        # gf = data['kspace_itcf'][:]
        # gf_err = data['kspace_itcf_err'][:]
    # else:
        # gf = data['real_itcf'][:]
        # gf_err = data['real_itcf_err'][:]
    # tau = stack_size * dt * numpy.arange(0,gf.shape[0])
    # isp = convert[spin]
    # it = convert[order]
    # results = pd.DataFrame()
    # results['tau'] = tau
    # # note that the interpretation of elements necessarily changes if we
    # # didn't store the full green's function.
    # if mode == 'full':
        # name = 'G_'+order+'_spin_'+spin+'_%s%s'%(elements[0],elements[1])
        # results[name] = gf[:,isp,it,elements[0],elements[1]]
        # results[name+'_err'] = gf_err[:,isp,it,elements[0],elements[1]]
    # else:
        # name = 'G_'+order+'_spin_'+spin+'_%s%s'%(elements[0],elements[0])
        # results[name] = gf[:,isp,it,elements[0]]
        # results[name+'_err'] = gf_err[:,isp,it,elements[0]]

    # return results