Source code for pyscf.pbc.df.df_jk

#!/usr/bin/env python
# Copyright 2014-2020 The PySCF Developers. All Rights Reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#
# Author: Qiming Sun <osirpt.sun@gmail.com>
#

'''
Density fitting with Gaussian basis
Ref:
J. Chem. Phys. 147, 164119 (2017)
'''


from functools import reduce
import numpy
from pyscf import lib
from pyscf.lib import logger, zdotNN, zdotCN, zdotNC
from pyscf.pbc import tools
from pyscf.pbc.lib.kpts_helper import is_zero, gamma_point, member, get_kconserv_ria
from pyscf import __config__

DM2MO_PREC = getattr(__config__, 'pbc_gto_df_df_jk_dm2mo_prec', 1e-10)


[docs]
def density_fit(mf, auxbasis=None, mesh=None, with_df=None):
    '''Generte density-fitting SCF object

    Args:
        auxbasis : str or basis dict
            Same format to the input attribute mol.basis.  If auxbasis is
            None, auxiliary basis based on AO basis (if possible) or
            even-tempered Gaussian basis will be used.
        mesh : tuple
            number of grids in each direction
        with_df : DF object
    '''
    from pyscf.pbc.scf.hf import KohnShamDFT
    from pyscf.df.addons import predefined_auxbasis
    from pyscf.pbc.df import df
    from pyscf.pbc.scf.khf import KSCF
    if with_df is None:
        if isinstance(mf, KSCF):
            kpts = mf.kpts
        else:
            kpts = numpy.reshape(mf.kpt, (1,3))

        cell = mf.cell
        if auxbasis is None and isinstance(cell.basis, str):
            if isinstance(mf, KohnShamDFT):
                xc = mf.xc
            else:
                xc = 'HF'
            if xc == 'LDA,VWN':
                # This is likely the default xc setting of a KS instance.
                # Postpone the auxbasis assignment to with_df.build().
                auxbasis = None
            else:
                auxbasis = predefined_auxbasis(cell, cell.basis, xc)
        with_df = df.DF(cell, kpts)
        with_df.max_memory = mf.max_memory
        with_df.stdout = mf.stdout
        with_df.verbose = mf.verbose
        with_df.auxbasis = auxbasis
        if mesh is not None:
            with_df.mesh = mesh

    mf = mf.copy().reset()
    mf.with_df = with_df
    return mf




[docs]
def get_j_kpts(mydf, dm_kpts, hermi=1, kpts=numpy.zeros((1,3)), kpts_band=None):
    log = logger.Logger(mydf.stdout, mydf.verbose)
    t0 = (logger.process_clock(), logger.perf_counter())
    if mydf._cderi is None or not mydf.has_kpts(kpts_band):
        if mydf._cderi is not None:
            log.warn('DF integrals for band k-points were not found %s. '
                     'DF integrals will be rebuilt to include band k-points.',
                     mydf._cderi)
        mydf.build(j_only=True, kpts_band=kpts_band)
        t0 = log.timer_debug1('Init get_j_kpts', *t0)

    dm_kpts = lib.asarray(dm_kpts, order='C')
    dms = _format_dms(dm_kpts, kpts)
    nset, nkpts, nao = dms.shape[:3]
    if mydf.auxcell is None:
        # If mydf._cderi is the file that generated from another calculation,
        # guess naux based on the contents of the integral file.
        naux = mydf.get_naoaux()
    else:
        naux = mydf.auxcell.nao_nr()
    nao_pair = nao * (nao+1) // 2

    kpts_band, input_band = _format_kpts_band(kpts_band, kpts), kpts_band
    nband = len(kpts_band)
    j_real = gamma_point(kpts_band) and not numpy.iscomplexobj(dms)

    t1 = (logger.process_clock(), logger.perf_counter())
    dmsR = dms.real.transpose(0,1,3,2).reshape(nset,nkpts,nao**2)
    dmsI = dms.imag.transpose(0,1,3,2).reshape(nset,nkpts,nao**2)
    rhoR = numpy.zeros((nset,naux))
    rhoI = numpy.zeros((nset,naux))
    max_memory = max(2000, (mydf.max_memory - lib.current_memory()[0]))
    for k, kpt in enumerate(kpts):
        kptii = numpy.asarray((kpt,kpt))
        p1 = 0
        for LpqR, LpqI, sign in mydf.sr_loop(kptii, max_memory, False):
            p0, p1 = p1, p1+LpqR.shape[0]
            #:Lpq = (LpqR + LpqI*1j).reshape(-1,nao,nao)
            #:rhoR[:,p0:p1] += numpy.einsum('Lpq,xqp->xL', Lpq, dms[:,k]).real
            #:rhoI[:,p0:p1] += numpy.einsum('Lpq,xqp->xL', Lpq, dms[:,k]).imag
            rhoR[:,p0:p1] += sign * numpy.einsum('Lp,xp->xL', LpqR, dmsR[:,k])
            rhoI[:,p0:p1] += sign * numpy.einsum('Lp,xp->xL', LpqR, dmsI[:,k])
            if LpqI is not None:
                rhoR[:,p0:p1] -= sign * numpy.einsum('Lp,xp->xL', LpqI, dmsI[:,k])
                rhoI[:,p0:p1] += sign * numpy.einsum('Lp,xp->xL', LpqI, dmsR[:,k])
            LpqR = LpqI = None
    t1 = log.timer_debug1('get_j pass 1', *t1)

    weight = 1./nkpts
    rhoR *= weight
    rhoI *= weight
    if hermi == 0:
        aos2symm = False
        vjR = numpy.zeros((nset,nband,nao**2))
        vjI = numpy.zeros((nset,nband,nao**2))
    else:
        aos2symm = True
        vjR = numpy.zeros((nset,nband,nao_pair))
        vjI = numpy.zeros((nset,nband,nao_pair))
    for k, kpt in enumerate(kpts_band):
        kptii = numpy.asarray((kpt,kpt))
        p1 = 0
        for LpqR, LpqI, sign in mydf.sr_loop(kptii, max_memory, aos2symm):
            p0, p1 = p1, p1+LpqR.shape[0]
            #:Lpq = (LpqR + LpqI*1j)#.reshape(-1,nao,nao)
            #:vjR[:,k] += numpy.dot(rho[:,p0:p1], Lpq).real
            #:vjI[:,k] += numpy.dot(rho[:,p0:p1], Lpq).imag
            vjR[:,k] += numpy.dot(rhoR[:,p0:p1], LpqR)
            if not j_real:
                vjI[:,k] += numpy.dot(rhoI[:,p0:p1], LpqR)
                if LpqI is not None:
                    vjR[:,k] -= numpy.dot(rhoI[:,p0:p1], LpqI)
                    vjI[:,k] += numpy.dot(rhoR[:,p0:p1], LpqI)
            LpqR = LpqI = None
    t1 = log.timer_debug1('get_j pass 2', *t1)

    if j_real:
        vj_kpts = vjR
    else:
        vj_kpts = vjR + vjI*1j
    if aos2symm:
        vj_kpts = lib.unpack_tril(vj_kpts.reshape(-1,nao_pair))
    vj_kpts = vj_kpts.reshape(nset,nband,nao,nao)

    log.timer('get_j', *t0)

    return _format_jks(vj_kpts, dm_kpts, input_band, kpts)




[docs]
def get_j_kpts_kshift(mydf, dm_kpts, kshift, hermi=0, kpts=numpy.zeros((1,3)), kpts_band=None):
    r''' Math:
            J^{k1 k1'}_{pq}
                = (1/Nk) \sum_{k2} \sum_{rs} (p k1 q k1' |r k2' s k2) D_{sr}^{k2 k2'}
        where k1' and k2' satisfies
            (k1 - k1' - kpts[kshift]) \dot a = 2n \pi
            (k2 - k2' - kpts[kshift]) \dot a = 2n \pi
        For kshift = 0, :func:`get_j_kpts` is called.
    '''
    if kshift == 0:
        return get_j_kpts(mydf, dm_kpts, hermi=hermi, kpts=kpts, kpts_band=kpts_band)

    if kpts_band is not None:
        raise NotImplementedError

    log = logger.Logger(mydf.stdout, mydf.verbose)
    t0 = (logger.process_clock(), logger.perf_counter())
    if mydf._cderi is None or not mydf.has_kpts(kpts_band):
        if mydf._cderi is not None:
            log.warn('DF integrals for band k-points were not found %s. '
                     'DF integrals will be rebuilt to include band k-points.',
                     mydf._cderi)
        mydf.build(kpts_band=kpts_band)
        t0 = log.timer_debug1('Init get_j_kpts', *t0)

    dm_kpts = lib.asarray(dm_kpts, order='C')
    dms = _format_dms(dm_kpts, kpts)
    nset, nkpts, nao = dms.shape[:3]
    if mydf.auxcell is None:
        # If mydf._cderi is the file that generated from another calculation,
        # guess naux based on the contents of the integral file.
        naux = mydf.get_naoaux()
    else:
        naux = mydf.auxcell.nao_nr()
    nao_pair = nao * (nao+1) // 2

    kpts_band, input_band = _format_kpts_band(kpts_band, kpts), kpts_band
    nband = len(kpts_band)
    j_real = (gamma_point(kpts_band) and gamma_point(kpts[kshift]) and
              not numpy.iscomplexobj(dms))

    kconserv = get_kconserv_ria(mydf.cell, kpts)[kshift]

    t1 = (logger.process_clock(), logger.perf_counter())
    dmsR = dms.real.transpose(0,1,3,2).reshape(nset,nkpts,nao**2)
    dmsI = dms.imag.transpose(0,1,3,2).reshape(nset,nkpts,nao**2)
    rhoR = numpy.zeros((nset,naux))
    rhoI = numpy.zeros((nset,naux))
    max_memory = max(2000, (mydf.max_memory - lib.current_memory()[0]))
    for k, kpt in enumerate(kpts):
        kp = kconserv[k]
        kptp = kpts[kp]
        kptii = numpy.asarray((kptp,kpt))
        p1 = 0
        for LpqR, LpqI, sign in mydf.sr_loop(kptii, max_memory, False):
            p0, p1 = p1, p1+LpqR.shape[0]
            #:Lpq = (LpqR + LpqI*1j).reshape(-1,nao,nao)
            #:rhoR[:,p0:p1] += numpy.einsum('Lpq,xqp->xL', Lpq, dms[:,k]).real
            #:rhoI[:,p0:p1] += numpy.einsum('Lpq,xqp->xL', Lpq, dms[:,k]).imag
            rhoR[:,p0:p1] += sign * numpy.einsum('Lp,xp->xL', LpqR, dmsR[:,k])
            rhoI[:,p0:p1] += sign * numpy.einsum('Lp,xp->xL', LpqR, dmsI[:,k])
            if LpqI is not None:
                rhoR[:,p0:p1] -= sign * numpy.einsum('Lp,xp->xL', LpqI, dmsI[:,k])
                rhoI[:,p0:p1] += sign * numpy.einsum('Lp,xp->xL', LpqI, dmsR[:,k])
            LpqR = LpqI = None
    t1 = log.timer_debug1('get_j pass 1', *t1)

    weight = 1./nkpts
    rhoR *= weight
    rhoI *= weight
    if hermi == 0:
        aos2symm = False
        vjR = numpy.zeros((nset,nband,nao**2))
        vjI = numpy.zeros((nset,nband,nao**2))
    else:
        aos2symm = True
        vjR = numpy.zeros((nset,nband,nao_pair))
        vjI = numpy.zeros((nset,nband,nao_pair))
    for k, kpt in enumerate(kpts_band):
        kp = kconserv[k]
        kptp = kpts[kp]
        kptii = numpy.asarray((kpt,kptp))
        p1 = 0
        for LpqR, LpqI, sign in mydf.sr_loop(kptii, max_memory, aos2symm):
            p0, p1 = p1, p1+LpqR.shape[0]
            #:Lpq = (LpqR + LpqI*1j)#.reshape(-1,nao,nao)
            #:vjR[:,k] += numpy.dot(rho[:,p0:p1], Lpq).real
            #:vjI[:,k] += numpy.dot(rho[:,p0:p1], Lpq).imag
            vjR[:,k] += numpy.dot(rhoR[:,p0:p1], LpqR)
            if not j_real:
                vjI[:,k] += numpy.dot(rhoI[:,p0:p1], LpqR)
                if LpqI is not None:
                    vjR[:,k] -= numpy.dot(rhoI[:,p0:p1], LpqI)
                    vjI[:,k] += numpy.dot(rhoR[:,p0:p1], LpqI)
            LpqR = LpqI = None
    t1 = log.timer_debug1('get_j pass 2', *t1)

    if j_real:
        vj_kpts = vjR
    else:
        vj_kpts = vjR + vjI*1j
    if aos2symm:
        vj_kpts = lib.unpack_tril(vj_kpts.reshape(-1,nao_pair))
    vj_kpts = vj_kpts.reshape(nset,nband,nao,nao)

    log.timer('get_j', *t0)

    return _format_jks(vj_kpts, dm_kpts, input_band, kpts)



[docs]
def get_k_kpts(mydf, dm_kpts, hermi=1, kpts=numpy.zeros((1,3)), kpts_band=None,
               exxdiv=None):
    cell = mydf.cell
    log = logger.Logger(mydf.stdout, mydf.verbose)

    if exxdiv is not None and exxdiv != 'ewald':
        log.warn('GDF does not support exxdiv %s. '
                 'exxdiv needs to be "ewald" or None', exxdiv)
        raise RuntimeError('GDF does not support exxdiv %s' % exxdiv)

    t0 = (logger.process_clock(), logger.perf_counter())
    if mydf._cderi is None or not mydf.has_kpts(kpts_band):
        if mydf._cderi is not None:
            log.warn('DF integrals for band k-points were not found %s. '
                     'DF integrals will be rebuilt to include band k-points.',
                     mydf._cderi)
        mydf.build(j_only=False, kpts_band=kpts_band)
        t0 = log.timer_debug1('Init get_k_kpts', *t0)
    elif mydf._j_only:
        log.warn('DF integrals for HF exchange were not initialized. '
                 'df.j_only cannot be used with hybrid functional. DF integrals will be rebuilt.')
        mydf.build(j_only=False, kpts_band=kpts_band)

    mo_coeff = getattr(dm_kpts, 'mo_coeff', None)
    if mo_coeff is not None:
        mo_occ = dm_kpts.mo_occ

    dm_kpts = lib.asarray(dm_kpts, order='C')
    dms = _format_dms(dm_kpts, kpts)
    nset, nkpts, nao = dms.shape[:3]

    skmoR = skmo2R = None
    if not mydf.force_dm_kbuild:
        if mo_coeff is not None:
            if isinstance(mo_coeff[0], (list, tuple)) or (isinstance(mo_coeff[0], numpy.ndarray)
                                                          and mo_coeff[0].ndim == 3):
                mo_coeff = [mo for mo1 in mo_coeff for mo in mo1]
            if len(mo_coeff) != nset*nkpts: # wrong shape
                log.warn('mo_coeff from dm tag has wrong shape. '
                         'Calculating mo from dm instead.')
                mo_coeff = None
            elif isinstance(mo_occ[0], (list, tuple)) or (isinstance(mo_occ[0], numpy.ndarray)
                                                          and mo_occ[0].ndim == 2):
                mo_occ = [mo for mo1 in mo_occ for mo in mo1]
        if mo_coeff is not None:
            skmoR, skmoI = _format_mo(mo_coeff, mo_occ, shape=(nset,nkpts), order='F',
                                      precision=cell.precision)
        elif hermi == 1:
            skmoR, skmoI = _mo_from_dm(dms.reshape(-1,nao,nao), method='eigh',
                                       shape=(nset,nkpts), order='F',
                                       precision=cell.precision)
            if skmoR is None:
                log.debug1('get_k_kpts: Eigh fails for input dm due to non-PSD. '
                           'Try SVD instead.')
        if skmoR is None:
            skmoR, skmoI, skmo2R, skmo2I = _mo_from_dm(dms.reshape(-1,nao,nao),
                                                   method='svd', shape=(nset,nkpts),
                                                   order='F', precision=cell.precision)
            if skmoR[0,0].shape[1] > nao//2:
                log.debug1('get_k_kpts: rank(dm) = %d exceeds half of nao = %d. '
                           'Fall back to DM-based build.', skmoR[0,0].shape[1], nao)
                skmoR = skmo2R = None

    kpts_band, input_band = _format_kpts_band(kpts_band, kpts), kpts_band
    nband = len(kpts_band)
    vkR = numpy.zeros((nset,nband,nao,nao))
    vkI = numpy.zeros((nset,nband,nao,nao))

    tspans = numpy.zeros((7,2))
    tspannames = ['buf1', 'ct11', 'ct12', 'buf2', 'ct21', 'ct22', 'load']

    ''' math
    K(p,q; k2 from k1)
        = V(r k1, q k2, p k2, s k1) * D(s,r; k1)
        = V(L, r k1, q k2) * V(L, s k1, p k2).conj() * D(s,r; k1)         eqn (1)
    --> in case of Hermitian & PSD DM
        = ( V(L, s k1, p k2) * C(s,i; k1).conj() ).conj()
          * V(L, r k1, q k2) * C(r,i; k1).conj()                          eqn (2)
        = W(L, i k1, p k2).conj() * W(L, i k1, q k2)                      eqn (3)
    --> in case of non-Hermitian or non-PSD DM
        = ( V(L, s k1, p k2) * A(s,i; k1).conj() ).conj()
          * V(L, r k1, q k2) * B(r,i; k1).conj()                          eqn (4)
        = X(L, i k1, p k2).conj() * Y(L, i k1, q k2)                      eqn (5)

    if swap_2e:
    K(p,q; k1 from k2)
        = V(p k1, s k2, r k2, q k1) * D(s,r; k2)
        = V(L, p k1, s k2) * V(L, q k1, r k2).conj() * D(s,r; k2)         eqn (1')
    --> in case of Hermitian & PSD DM
        = V(L, p k1, s k2) * C(s,i; k2)
          * ( V(L, q k1, r k2) * C(r,i; k2) ).conj()                      eqn (2')
        = W(L, p k1, i k2) * W(L, q k1, i k2).conj()                      eqn (3')
    --> in case of non-Hermitian or non-PSD DM
        = V(L, p k1, s k2) * A(s,i; k2)
          * ( V(L, q k1, r k2) * B(r,i; k2) ).conj()                      eqn (4')
        = X(L, p k1, i k2) * Y(L, q k1, i k2).conj()                      eqn (5')

    Mode 1: DM-based K-build uses eqn (1) and eqn (1')
    Mode 2: Symm MO-based K-build uses eqns (2,3) and eqns (2',3')
    Mode 3: Asymm MO-based K-build uses eqns (4,5) and eqns (4',5')
    '''
    # K_pq = ( p{k1} i{k2} | i{k2} q{k1} )
    if skmoR is None: # input dm is not Hermitian/PSD --> build K from dm
        log.debug2('get_k_kpts: build K from dm')
        dmsR = numpy.asarray(dms.real, order='C')
        dmsI = numpy.asarray(dms.imag, order='C')
        bufR = numpy.empty((mydf.blockdim*nao**2))
        bufI = numpy.empty((mydf.blockdim*nao**2))
        max_memory = max(2000, mydf.max_memory-lib.current_memory()[0])
        def make_kpt(ki, kj, swap_2e, inverse_idx=None):
            kpti = kpts[ki]
            kptj = kpts_band[kj]

            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

            for LpqR, LpqI, sign in mydf.sr_loop((kpti,kptj), max_memory, False):
                nrow = LpqR.shape[0]

                tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[6] += tick - tock

                pLqR = numpy.ndarray((nao,nrow,nao), buffer=bufR)
                pLqI = numpy.ndarray((nao,nrow,nao), buffer=bufI)
                tmpR = numpy.ndarray((nao,nrow*nao), buffer=LpqR)
                tmpI = numpy.ndarray((nao,nrow*nao), buffer=LpqI)
                pLqR[:] = LpqR.reshape(-1,nao,nao).transpose(1,0,2)
                pLqI[:] = LpqI.reshape(-1,nao,nao).transpose(1,0,2)

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[0] += tock - tick

                for i in range(nset):
                    zdotNN(dmsR[i,ki], dmsI[i,ki], pLqR.reshape(nao,-1),
                           pLqI.reshape(nao,-1), 1, tmpR, tmpI)
                    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[1] += tick - tock
                    zdotCN(pLqR.reshape(-1,nao).T, pLqI.reshape(-1,nao).T,
                           tmpR.reshape(-1,nao), tmpI.reshape(-1,nao),
                           sign, vkR[i,kj], vkI[i,kj], 1)
                    tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[2] += tock - tick

                if swap_2e:
                    tmpR = tmpR.reshape(nao*nrow,nao)
                    tmpI = tmpI.reshape(nao*nrow,nao)
                    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[3] += tick - tock
                    ki_tmp = ki
                    kj_tmp = kj
                    if inverse_idx:
                        ki_tmp = inverse_idx[0]
                        kj_tmp = inverse_idx[1]
                    for i in range(nset):
                        zdotNN(pLqR.reshape(-1,nao), pLqI.reshape(-1,nao),
                               dmsR[i,kj_tmp], dmsI[i,kj_tmp], 1, tmpR, tmpI)
                        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[4] += tock - tick
                        zdotNC(tmpR.reshape(nao,-1), tmpI.reshape(nao,-1),
                               pLqR.reshape(nao,-1).T, pLqI.reshape(nao,-1).T,
                               sign, vkR[i,ki_tmp], vkI[i,ki_tmp], 1)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[5] += tick - tock

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

                LpqR = LpqI = pLqR = pLqI = tmpR = tmpI = None
    elif skmo2R is None:
        log.debug2('get_k_kpts: build K from symm mo coeff')
        nmo = skmoR[0,0].shape[1]
        log.debug2('get_k_kpts: rank(dm) = %d / %d', nmo, nao)
        skmoI_mask = numpy.asarray([[abs(skmoI[i,k]).max() > cell.precision
                                     for k in range(nkpts)] for i in range(nset)])
        bufR = numpy.empty((mydf.blockdim*nao**2))
        bufI = numpy.empty((mydf.blockdim*nao**2))
        max_memory = max(2000, mydf.max_memory-lib.current_memory()[0])
        def make_kpt(ki, kj, swap_2e, inverse_idx=None):
            kpti = kpts[ki]
            kptj = kpts_band[kj]

            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

            for LpqR, LpqI, sign in mydf.sr_loop((kpti,kptj), max_memory, False):
                nrow = LpqR.shape[0]

                tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[6] += tick - tock

                pLqR = numpy.ndarray((nao,nrow,nao), buffer=bufR)
                pLqI = numpy.ndarray((nao,nrow,nao), buffer=bufI)
                tmpR = numpy.ndarray((nmo,nrow*nao), buffer=LpqR)
                tmpI = numpy.ndarray((nmo,nrow*nao), buffer=LpqI)
                pLqR[:] = LpqR.reshape(-1,nao,nao).transpose(1,0,2)
                pLqI[:] = LpqI.reshape(-1,nao,nao).transpose(1,0,2)

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[0] += tock - tick

                for i in range(nset):
                    moR = skmoR[i,ki]
                    if skmoI_mask[i,ki]:
                        moI = skmoI[i,ki]
                        zdotCN(moR.T, moI.T, pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                               1, tmpR, tmpI)
                    else:
                        lib.ddot(moR.T, pLqR.reshape(nao,-1), 1, tmpR)
                        lib.ddot(moR.T, pLqI.reshape(nao,-1), 1, tmpI)
                    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[1] += tick - tock
                    zdotCN(tmpR.reshape(-1,nao).T, tmpI.reshape(-1,nao).T,
                           tmpR.reshape(-1,nao), tmpI.reshape(-1,nao),
                           sign, vkR[i,kj], vkI[i,kj], 1)
                    tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[2] += tock - tick

                if swap_2e:
                    tmpR = tmpR.reshape(nrow*nao,nmo)
                    tmpI = tmpI.reshape(nrow*nao,nmo)
                    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[3] += tick - tock
                    ki_tmp = ki
                    kj_tmp = kj
                    if inverse_idx:
                        ki_tmp = inverse_idx[0]
                        kj_tmp = inverse_idx[1]
                    for i in range(nset):
                        moR = skmoR[i,kj_tmp]
                        if skmoI_mask[i,kj_tmp]:
                            moI = skmoI[i,kj_tmp]
                            zdotNN(pLqR.reshape(-1,nao), pLqI.reshape(-1,nao), moR, moI,
                                   1, tmpR, tmpI)
                        else:
                            lib.ddot(pLqR.reshape(-1,nao), moR, 1, tmpR)
                            lib.ddot(pLqI.reshape(-1,nao), moR, 1, tmpI)
                        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[4] += tock - tick
                        zdotNC(tmpR.reshape(nao,-1), tmpI.reshape(nao,-1),
                               tmpR.reshape(nao,-1).T, tmpI.reshape(nao,-1).T,
                               sign, vkR[i,ki_tmp], vkI[i,ki_tmp], 1)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[5] += tick - tock

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

                LpqR = LpqI = pLqR = pLqI = tmpR = tmpI = None
    else:
        log.debug2('get_k_kpts: build K from asymm mo coeff')
        skmo1R = skmoR
        skmo1I = skmoI
        nmo = skmoR[0,0].shape[1]
        log.debug2('get_k_kpts: rank(dm) = %d / %d', nmo, nao)
        skmoI_mask = numpy.asarray([[max(abs(skmo1I[i,k]).max(),
                                         abs(skmo2I[i,k]).max()) > cell.precision
                                     for k in range(nkpts)] for i in range(nset)])
        bufR = numpy.empty((mydf.blockdim*nao**2))
        bufI = numpy.empty((mydf.blockdim*nao**2))
        max_memory = max(2000, mydf.max_memory-lib.current_memory()[0])
        def make_kpt(ki, kj, swap_2e, inverse_idx=None):
            kpti = kpts[ki]
            kptj = kpts_band[kj]

            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

            for LpqR, LpqI, sign in mydf.sr_loop((kpti,kptj), max_memory, False):
                nrow = LpqR.shape[0]

                tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[6] += tick - tock

                pLqR = numpy.ndarray((nao,nrow,nao), buffer=bufR)
                pLqI = numpy.ndarray((nao,nrow,nao), buffer=bufI)
                tmp1R = numpy.ndarray((nmo,nrow*nao), buffer=LpqR)
                tmp1I = numpy.ndarray((nmo,nrow*nao), buffer=LpqI)
                tmp2R = numpy.ndarray((nmo,nrow*nao),
                                      buffer=LpqR.reshape(-1)[tmp1R.size:])
                tmp2I = numpy.ndarray((nmo,nrow*nao),
                                      buffer=LpqI.reshape(-1)[tmp1I.size:])
                pLqR[:] = LpqR.reshape(-1,nao,nao).transpose(1,0,2)
                pLqI[:] = LpqI.reshape(-1,nao,nao).transpose(1,0,2)

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[0] += tock - tick

                for i in range(nset):
                    mo1R = skmo1R[i,ki]
                    mo2R = skmo2R[i,ki]
                    if skmoI_mask[i,ki]:
                        mo1I = skmo1I[i,ki]
                        mo2I = skmo2I[i,ki]
                        zdotCN(mo1R.T, mo1I.T, pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                               1, tmp1R, tmp1I)
                        zdotCN(mo2R.T, mo2I.T, pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                               1, tmp2R, tmp2I)
                    else:
                        lib.ddot(mo1R.T, pLqR.reshape(nao,-1), 1, tmp1R)
                        lib.ddot(mo1R.T, pLqI.reshape(nao,-1), 1, tmp1I)
                        lib.ddot(mo2R.T, pLqR.reshape(nao,-1), 1, tmp2R)
                        lib.ddot(mo2R.T, pLqI.reshape(nao,-1), 1, tmp2I)
                    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[1] += tick - tock
                    zdotCN(tmp1R.reshape(-1,nao).T, tmp1I.reshape(-1,nao).T,
                           tmp2R.reshape(-1,nao), tmp2I.reshape(-1,nao),
                           sign, vkR[i,kj], vkI[i,kj], 1)
                    tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[2] += tock - tick

                if swap_2e:
                    tmp1R = tmp1R.reshape(nrow*nao,nmo)
                    tmp1I = tmp1I.reshape(nrow*nao,nmo)
                    tmp2R = tmp2R.reshape(nrow*nao,nmo)
                    tmp2I = tmp2I.reshape(nrow*nao,nmo)
                    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                    tspans[3] += tick - tock
                    ki_tmp = ki
                    kj_tmp = kj
                    if inverse_idx:
                        ki_tmp = inverse_idx[0]
                        kj_tmp = inverse_idx[1]
                    for i in range(nset):
                        mo1R = skmo1R[i,kj_tmp]
                        mo2R = skmo2R[i,kj_tmp]
                        if skmoI_mask[i,kj_tmp]:
                            mo1I = skmo1I[i,kj_tmp]
                            mo2I = skmo2I[i,kj_tmp]
                            zdotNN(pLqR.reshape(-1,nao), pLqI.reshape(-1,nao), mo1R, mo1I,
                                   1, tmp1R, tmp1I)
                            zdotNN(pLqR.reshape(-1,nao), pLqI.reshape(-1,nao), mo2R, mo2I,
                                   1, tmp2R, tmp2I)
                        else:
                            lib.ddot(pLqR.reshape(-1,nao), mo1R, 1, tmp1R)
                            lib.ddot(pLqI.reshape(-1,nao), mo1R, 1, tmp1I)
                            lib.ddot(pLqR.reshape(-1,nao), mo2R, 1, tmp2R)
                            lib.ddot(pLqI.reshape(-1,nao), mo2R, 1, tmp2I)
                        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[4] += tock - tick
                        zdotNC(tmp1R.reshape(nao,-1), tmp1I.reshape(nao,-1),
                               tmp2R.reshape(nao,-1).T, tmp2I.reshape(nao,-1).T,
                               sign, vkR[i,ki_tmp], vkI[i,ki_tmp], 1)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[5] += tick - tock

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

                LpqR = LpqI = pLqR = pLqI = tmp1R = tmp1I = tmp2R = tmp2I = None

    t1 = (logger.process_clock(), logger.perf_counter())
    if kpts_band is kpts:  # normal k-points HF/DFT
        for ki in range(nkpts):
            for kj in range(ki):
                make_kpt(ki, kj, True)
            make_kpt(ki, ki, False)
            t1 = log.timer_debug1('get_k_kpts: make_kpt ki>=kj (%d,*)'%ki, *t1)
    else:
        idx_in_kpts = []
        for kpt in kpts_band:
            idx = member(kpt, kpts)
            if len(idx) > 0:
                idx_in_kpts.append(idx[0])
            else:
                idx_in_kpts.append(-1)
        idx_in_kpts_band = []
        for kpt in kpts:
            idx = member(kpt, kpts_band)
            if len(idx) > 0:
                idx_in_kpts_band.append(idx[0])
            else:
                idx_in_kpts_band.append(-1)

        for ki in range(nkpts):
            for kj in range(nband):
                if idx_in_kpts[kj] == -1 or idx_in_kpts[kj] == ki:
                    make_kpt(ki, kj, False)
                elif idx_in_kpts[kj] < ki:
                    if idx_in_kpts_band[ki] == -1:
                        make_kpt(ki, kj, False)
                    else:
                        make_kpt(ki, kj, True, (idx_in_kpts_band[ki], idx_in_kpts[kj]))
                else:
                    if idx_in_kpts_band[ki] == -1:
                        make_kpt(ki, kj, False)
            t1 = log.timer_debug1('get_k_kpts: make_kpt (%d,*)'%ki, *t1)

    for tspan, tspanname in zip(tspans,tspannames):
        log.debug1('    CPU time for %s %10.2f sec, wall time %10.2f sec',
                   tspanname, *tspan)

    if (gamma_point(kpts) and gamma_point(kpts_band) and
        not numpy.iscomplexobj(dm_kpts)):
        vk_kpts = vkR
    else:
        vk_kpts = vkR + vkI * 1j
    vk_kpts *= 1./nkpts

    if exxdiv == 'ewald' and cell.dimension != 0:
        # Integrals are computed analytically in GDF and RSJK.
        # Finite size correction for exx is not needed.
        _ewald_exxdiv_for_G0(cell, kpts, dms, vk_kpts, kpts_band)

    log.timer('get_k_kpts', *t0)

    return _format_jks(vk_kpts, dm_kpts, input_band, kpts)



[docs]
def get_k_kpts_kshift(mydf, dm_kpts, kshift, hermi=0, kpts=numpy.zeros((1,3)), kpts_band=None,
                      exxdiv=None):
    r''' Math:
            K^{k1 k1'}_{pq}
                = (1/Nk) \sum_{k2} \sum_{rs} (p k1 s k2 | r k2' q k1') D_{sr}^{k2 k2'}
        where k1' and k2' satisfies
            (k1 - k1' - kpts[kshift]) \dot a = 2n \pi
            (k2 - k2' - kpts[kshift]) \dot a = 2n \pi
        For kshift = 0, :func:`get_k_kpts` is called.
    '''
    if kshift == 0:
        return get_k_kpts(mydf, dm_kpts, hermi=hermi, kpts=kpts, kpts_band=kpts_band,
                          exxdiv=exxdiv)

    if kpts_band is not None:
        raise NotImplementedError

    cell = mydf.cell
    log = logger.Logger(mydf.stdout, mydf.verbose)

    if exxdiv is not None and exxdiv != 'ewald':
        log.warn('GDF does not support exxdiv %s. '
                 'exxdiv needs to be "ewald" or None', exxdiv)
        raise RuntimeError('GDF does not support exxdiv %s' % exxdiv)

    t0 = (logger.process_clock(), logger.perf_counter())
    if mydf._cderi is None or not mydf.has_kpts(kpts_band):
        if mydf._cderi is not None:
            log.warn('DF integrals for band k-points were not found %s. '
                     'DF integrals will be rebuilt to include band k-points.',
                     mydf._cderi)
        mydf.build(kpts_band=kpts_band)
        t0 = log.timer_debug1('Init get_k_kpts', *t0)

    mo_coeff = getattr(dm_kpts, 'mo_coeff', None)
    if mo_coeff is not None:
        mo_occ = dm_kpts.mo_occ

    dm_kpts = lib.asarray(dm_kpts, order='C')
    dms = _format_dms(dm_kpts, kpts)
    nset, nkpts, nao = dms.shape[:3]

    skmoR = skmo2R = None
    if not mydf.force_dm_kbuild:
        if mo_coeff is not None:
            if isinstance(mo_coeff[0], (list, tuple)) or (isinstance(mo_coeff[0], numpy.ndarray)
                                                          and mo_coeff[0].ndim == 3):
                mo_coeff = [mo for mo1 in mo_coeff for mo in mo1]
            if len(mo_coeff) != nset*nkpts: # wrong shape
                log.warn('mo_coeff from dm tag has wrong shape. '
                         'Calculating mo from dm instead.')
                mo_coeff = None
            elif isinstance(mo_occ[0], (list, tuple)) or (isinstance(mo_occ[0], numpy.ndarray)
                                                          and mo_occ[0].ndim == 2):
                mo_occ = [mo for mo1 in mo_occ for mo in mo1]
        if mo_coeff is not None:
            skmoR, skmoI = _format_mo(mo_coeff, mo_occ, shape=(nset,nkpts), order='F',
                                      precision=cell.precision)
        elif hermi == 1:
            skmoR, skmoI = _mo_from_dm(dms.reshape(-1,nao,nao), method='eigh',
                                       shape=(nset,nkpts), order='F',
                                       precision=cell.precision)
            if skmoR is None:
                log.debug1('get_k_kpts: Eigh fails for input dm due to non-PSD. '
                           'Try SVD instead.')
            # No symmetry can be explored for shifted K build; manually make it asymmetric here.
            skmo2R = skmoR
            skmo2I = skmoI
        if skmoR is None:
            skmoR, skmoI, skmo2R, skmo2I = _mo_from_dm(dms.reshape(-1,nao,nao),
                                                   method='svd', shape=(nset,nkpts),
                                                   order='F', precision=cell.precision)
            if skmoR[0,0].shape[1] > nao//2:
                log.debug1('get_k_kpts: rank(dm) = %d exceeds half of nao = %d. '
                           'Fall back to DM-based build.', skmoR[0,0].shape[1], nao)
                skmoR = skmo2R = None

    kpts_band, input_band = _format_kpts_band(kpts_band, kpts), kpts_band
    nband = len(kpts_band)
    vkR = numpy.zeros((nset,nband,nao,nao))
    vkI = numpy.zeros((nset,nband,nao,nao))

    kconserv = get_kconserv_ria(cell, kpts)[kshift]

    tspans = numpy.zeros((7,2))
    tspannames = ['buf1', 'ct11', 'ct12', 'buf2', 'ct21', 'ct22', 'load']

    ''' math
    K(p,q; k2 from k1)
        = V(r k1', q k2', p k2, s k1) * D(s,r; k1 k1')
        = V(L, r k1', q k2') * V(L, s k1, p k2).conj() * D(s,r; k1 k1')   eqn (1)
    --> in terms D's low-rank form: D^{k k'} = dot( A^k, B^k'.T.conj() )
        = ( V(L, s k1, p k2) * A(s,i; k1).conj() ).conj()
          * V(L, r k1', q k2') * B(r,i; k1').conj()                       eqn (2)
        = X(L, i k1, p k2).conj() * Y(L, i k1, q k2')                     eqn (3)

    if swap_2e:
    K(p,q; k1 from k2)
        = V(p k1, s k2, r k2', q k1') * D(s,r; k2 k2')
        = V(L, p k1, s k2) * V(L, q k1', r k2').conj() * D(s,r; k2 k2')   eqn (1')
    --> in terms D's low-rank form: D^{k k'} = dot( A^k, B^k'.T.conj() )
        = V(L, p k1, s k2) * A(s,i; k2)
          * ( V(L, q k1', r k2') * B(r,i; k2') ).conj()                   eqn (2')
        = X(L, p k1, i k2) * Y(L, q k1, i k2).conj()                      eqn (3')

    Mode 1: DM-based K-build uses eqn (1) and eqn (1')
    Mode 3: Asymm MO-based K-build uses eqns (2,3) and eqns (2',3')
    '''
    # K_pq = ( p{k1} i{k2} | i{k2} q{k1} )
    if skmoR is None: # input dm is not Hermitian/PSD --> build K from dm
        log.debug2('get_k_kpts: build K from dm')
        dmsR = numpy.asarray(dms.real, order='C')
        dmsI = numpy.asarray(dms.imag, order='C')
        bufR = numpy.empty((mydf.blockdim*nao**2))
        bufI = numpy.empty((mydf.blockdim*nao**2))
        bufR1 = numpy.empty((mydf.blockdim*nao**2))
        bufI1 = numpy.empty((mydf.blockdim*nao**2))
        max_memory = max(2000, mydf.max_memory-lib.current_memory()[0])
        def make_kpt(ki, kj, swap_2e, inverse_idx=None):
            if inverse_idx:
                raise NotImplementedError

            kpti = kpts[ki]
            kptj = kpts_band[kj]
            kip = kconserv[ki]
            kjp = kconserv[kj]
            kptip = kpts[kip]
            kptjp = kpts[kjp]

            '''
                K(p,q; k2 from k1)
                    = V(r k1', q k2', p k2, s k1) * D(s,r; k1 k1')
                    = (r k1' | L | q k2') (s k1 | L | p k2).conj() D(s k1 | r k1')
                    = [ D[k1](s | r) A(r | L | q) ] B(s | L | p).conj()
                K(p,q; k1 from k2)
                    = V(p k1, s k2, r k2', q k1') * D(s,r; k2 k2')
                    = [ B(p | L | s) D[k2](s | r) ] A(q | L | r).conj()
            '''
            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

            p1 = 0
            for LpqR, LpqI, sign in mydf.sr_loop((kptip,kptjp), max_memory*0.5, compact=False):
                nrow = LpqR.shape[0]
                p0, p1 = p1, p1 + nrow

                tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[6] += tick - tock

                pLqR = numpy.ndarray((nao,nrow,nao), buffer=bufR)
                pLqI = numpy.ndarray((nao,nrow,nao), buffer=bufI)
                tmpR = numpy.ndarray((nao,nrow*nao), buffer=LpqR)
                tmpI = numpy.ndarray((nao,nrow*nao), buffer=LpqI)
                pLqR[:] = LpqR.reshape(-1,nao,nao).transpose(1,0,2)
                pLqI[:] = LpqI.reshape(-1,nao,nao).transpose(1,0,2)

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[0] += tock - tick

                for LpqR1, LpqI1, sign1 in mydf.sr_loop((kpti,kptj), blksize=nrow, compact=False,
                                                        aux_slice=(p0,p1)):
                    nrow1 = LpqR1.shape[0]
                    pLqR1 = numpy.ndarray((nao,nrow1,nao), buffer=bufR1)
                    pLqI1 = numpy.ndarray((nao,nrow1,nao), buffer=bufI1)
                    pLqR1[:] = LpqR1.reshape(-1,nao,nao).transpose(1,0,2)
                    pLqI1[:] = LpqI1.reshape(-1,nao,nao).transpose(1,0,2)
                    LpqR1 = LpqI1 = None

                    for i in range(nset):
                        zdotNN(dmsR[i,ki], dmsI[i,ki], pLqR.reshape(nao,-1),
                               pLqI.reshape(nao,-1), 1, tmpR, tmpI)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[1] += tick - tock
                        zdotCN(pLqR1.reshape(-1,nao).T, pLqI1.reshape(-1,nao).T,
                               tmpR.reshape(-1,nao), tmpI.reshape(-1,nao),
                               sign, vkR[i,kj], vkI[i,kj], 1)
                        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[2] += tock - tick

                    if swap_2e:
                        tmpR = tmpR.reshape(nao*nrow1,nao)
                        tmpI = tmpI.reshape(nao*nrow1,nao)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[3] += tick - tock
                        ki_tmp = ki
                        kj_tmp = kj
                        if inverse_idx:
                            ki_tmp = inverse_idx[0]
                            kj_tmp = inverse_idx[1]
                        for i in range(nset):
                            zdotNN(pLqR1.reshape(-1,nao), pLqI1.reshape(-1,nao),
                                   dmsR[i,kj_tmp], dmsI[i,kj_tmp], 1, tmpR, tmpI)
                            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                            tspans[4] += tock - tick
                            zdotNC(tmpR.reshape(nao,-1), tmpI.reshape(nao,-1),
                                   pLqR.reshape(nao,-1).T, pLqI.reshape(nao,-1).T,
                                   sign, vkR[i,ki_tmp], vkI[i,ki_tmp], 1)
                            tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                            tspans[5] += tick - tock

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

                LpqR = LpqI = LpqR1 = LpqI1 = pLqR = pLqI = pLqR1 = pLqI1 = tmpR = tmpI = None
    else:
        log.debug2('get_k_kpts: build K from mo coeff')
        skmo1R = skmoR
        skmo1I = skmoI
        nmo = skmoR[0,0].shape[1]
        log.debug2('get_k_kpts: rank(dm) = %d / %d', nmo, nao)
        skmoI_mask = numpy.asarray([[max(abs(skmo1I[i,k]).max(),
                                         abs(skmo2I[i,k]).max()) > cell.precision
                                     for k in range(nkpts)] for i in range(nset)])
        bufR = numpy.empty((mydf.blockdim*nao**2))
        bufI = numpy.empty((mydf.blockdim*nao**2))
        bufR1 = numpy.empty((mydf.blockdim*nao**2))
        bufI1 = numpy.empty((mydf.blockdim*nao**2))
        max_memory = max(2000, mydf.max_memory-lib.current_memory()[0])
        def make_kpt(ki, kj, swap_2e, inverse_idx=None):
            if inverse_idx:
                raise NotImplementedError

            kip = kconserv[ki]
            kjp = kconserv[kj]
            kpti = kpts[ki]
            kptj = kpts_band[kj]
            kptip = kpts[kip]
            kptjp = kpts_band[kjp]

            '''
                K(p,q; k2 from k1)
                    = V(r k1', q k2', p k2, s k1) * D(s,r; k1 k1')
                    = A(r | L | q) B(s | L | p).conj() x(s k1 | i) y(r k1' | i).conj()
                    = [ x(s | i) B(s | L | p).conj() ] *
                      [ y(r | i) A(r | L | q).conj() ].conj()
                K(p,q; k1 from k2)
                    = V(p k1, s k2, r k2', q k1') * D(s,r; k2 k2')
                    = B(p | L | s) A(q | L | r).conj() x(s k2 | i) y(r k2' | i).conj()
                    = [ B(p | L | s) x(s | i) ] *
                      [ A(q | L | r) y(s | i) ].conj()
            '''

            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

            p1 = 0
            for LpqR, LpqI, sign in mydf.sr_loop((kptip,kptjp), max_memory*0.5, compact=False):
                nrow = LpqR.shape[0]
                p0, p1 = p1, p1 + nrow

                tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[6] += tick - tock

                pLqR = numpy.ndarray((nao,nrow,nao), buffer=bufR)
                pLqI = numpy.ndarray((nao,nrow,nao), buffer=bufI)
                tmp1R = numpy.ndarray((nmo,nrow*nao), buffer=LpqR)
                tmp1I = numpy.ndarray((nmo,nrow*nao), buffer=LpqI)
                tmp2R = numpy.ndarray((nmo,nrow*nao), buffer=LpqR.reshape(-1)[tmp1R.size:])
                tmp2I = numpy.ndarray((nmo,nrow*nao), buffer=LpqI.reshape(-1)[tmp1I.size:])
                pLqR[:] = LpqR.reshape(-1,nao,nao).transpose(1,0,2)
                pLqI[:] = LpqI.reshape(-1,nao,nao).transpose(1,0,2)

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                tspans[0] += tock - tick

                for LpqR1, LpqI1, sign1 in mydf.sr_loop((kpti,kptj), blksize=nrow, compact=False,
                                                        aux_slice=(p0,p1)):
                    nrow1 = LpqR1.shape[0]
                    pLqR1 = numpy.ndarray((nao,nrow1,nao), buffer=bufR1)
                    pLqI1 = numpy.ndarray((nao,nrow1,nao), buffer=bufI1)
                    pLqR1[:] = LpqR1.reshape(-1,nao,nao).transpose(1,0,2)
                    pLqI1[:] = LpqI1.reshape(-1,nao,nao).transpose(1,0,2)
                    LpqR1 = LpqI1 = None

                    '''
                        = [ x(s | i) B(s | L | p).conj() ] *
                          [ y(r | i) A(r | L | q).conj() ].conj()
                    '''
                    for i in range(nset):
                        mo1R = skmo1R[i,ki]
                        mo2R = skmo2R[i,ki]
                        if skmoI_mask[i,ki]:
                            mo1I = skmo1I[i,ki]
                            mo2I = skmo2I[i,ki]
                            zdotNC(mo1R.T, mo1I.T, pLqR1.reshape(nao,-1), pLqI1.reshape(nao,-1),
                                   1, tmp1R, tmp1I)
                            zdotNC(mo2R.T, mo2I.T, pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                                   1, tmp2R, tmp2I)
                        else:
                            lib.ddot(mo1R.T, pLqR1.reshape(nao,-1), 1, tmp1R)
                            lib.ddot(mo1R.T, pLqI1.reshape(nao,-1), 1, tmp1I)
                            lib.ddot(mo2R.T, pLqR.reshape(nao,-1), 1, tmp2R)
                            lib.ddot(mo2R.T, pLqI.reshape(nao,-1), 1, tmp2I)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[1] += tick - tock
                        zdotNC(tmp1R.reshape(-1,nao).T, tmp1I.reshape(-1,nao).T,
                               tmp2R.reshape(-1,nao), tmp2I.reshape(-1,nao),
                               sign, vkR[i,kj], vkI[i,kj], 1)
                        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[2] += tock - tick

                    if swap_2e:
                        tmp1R = tmp1R.reshape(nrow*nao,nmo)
                        tmp1I = tmp1I.reshape(nrow*nao,nmo)
                        tmp2R = tmp2R.reshape(nrow*nao,nmo)
                        tmp2I = tmp2I.reshape(nrow*nao,nmo)
                        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                        tspans[3] += tick - tock
                        ki_tmp = ki
                        kj_tmp = kj
                        if inverse_idx:
                            ki_tmp = inverse_idx[0]
                            kj_tmp = inverse_idx[1]
                        '''
                            = [ B(p | L | s) x(s | i) ] *
                              [ A(q | L | r) y(s | i) ].conj()
                        '''
                        for i in range(nset):
                            mo1R = skmo1R[i,kj_tmp]
                            mo2R = skmo2R[i,kj_tmp]
                            if skmoI_mask[i,kj_tmp]:
                                mo1I = skmo1I[i,kj_tmp]
                                mo2I = skmo2I[i,kj_tmp]
                                zdotNN(pLqR1.reshape(-1,nao), pLqI1.reshape(-1,nao), mo1R, mo1I,
                                       1, tmp1R, tmp1I)
                                zdotNN(pLqR.reshape(-1,nao), pLqI.reshape(-1,nao), mo2R, mo2I,
                                       1, tmp2R, tmp2I)
                            else:
                                lib.ddot(pLqR1.reshape(-1,nao), mo1R, 1, tmp1R)
                                lib.ddot(pLqI1.reshape(-1,nao), mo1R, 1, tmp1I)
                                lib.ddot(pLqR.reshape(-1,nao), mo2R, 1, tmp2R)
                                lib.ddot(pLqI.reshape(-1,nao), mo2R, 1, tmp2I)
                            tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                            tspans[4] += tock - tick
                            zdotNC(tmp1R.reshape(nao,-1), tmp1I.reshape(nao,-1),
                                   tmp2R.reshape(nao,-1).T, tmp2I.reshape(nao,-1).T,
                                   sign, vkR[i,ki_tmp], vkI[i,ki_tmp], 1)
                            tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
                            tspans[5] += tick - tock

                tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))

                LpqR = LpqI = pLqR = pLqI = tmp1R = tmp1I = tmp2R = tmp2I = None

    t1 = (logger.process_clock(), logger.perf_counter())
    if kpts_band is kpts:  # normal k-points HF/DFT
        for ki in range(nkpts):
            for kj in range(ki):
                make_kpt(ki, kj, True)
            make_kpt(ki, ki, False)
            t1 = log.timer_debug1('get_k_kpts: make_kpt ki>=kj (%d,*)'%ki, *t1)
    else:
        idx_in_kpts = []
        for kpt in kpts_band:
            idx = member(kpt, kpts)
            if len(idx) > 0:
                idx_in_kpts.append(idx[0])
            else:
                idx_in_kpts.append(-1)
        idx_in_kpts_band = []
        for kpt in kpts:
            idx = member(kpt, kpts_band)
            if len(idx) > 0:
                idx_in_kpts_band.append(idx[0])
            else:
                idx_in_kpts_band.append(-1)

        for ki in range(nkpts):
            for kj in range(nband):
                if idx_in_kpts[kj] == -1 or idx_in_kpts[kj] == ki:
                    make_kpt(ki, kj, False)
                elif idx_in_kpts[kj] < ki:
                    if idx_in_kpts_band[ki] == -1:
                        make_kpt(ki, kj, False)
                    else:
                        make_kpt(ki, kj, True, (idx_in_kpts_band[ki], idx_in_kpts[kj]))
                else:
                    if idx_in_kpts_band[ki] == -1:
                        make_kpt(ki, kj, False)
            t1 = log.timer_debug1('get_k_kpts: make_kpt (%d,*)'%ki, *t1)

    for tspan, tspanname in zip(tspans,tspannames):
        log.debug1('    CPU time for %s %10.2f sec, wall time %10.2f sec',
                   tspanname, *tspan)

    if (gamma_point(kpts) and gamma_point(kpts_band) and
        not numpy.iscomplexobj(dm_kpts)):
        vk_kpts = vkR
    else:
        vk_kpts = vkR + vkI * 1j
    vk_kpts *= 1./nkpts

    if exxdiv == 'ewald' and cell.dimension != 0:
        # Integrals are computed analytically in GDF and RSJK.
        # Finite size correction for exx is not needed.
        _ewald_exxdiv_for_G0(cell, kpts, dms, vk_kpts, kpts_band)

    log.timer('get_k_kpts', *t0)

    return _format_jks(vk_kpts, dm_kpts, input_band, kpts)



##################################################
#
# Single k-point
#
##################################################


[docs]
def get_jk(mydf, dm, hermi=1, kpt=numpy.zeros(3),
           kpts_band=None, with_j=True, with_k=True, exxdiv=None):
    '''JK for given k-point'''
    log = logger.Logger(mydf.stdout, mydf.verbose)
    t0 = (logger.process_clock(), logger.perf_counter())
    if mydf._cderi is None or not mydf.has_kpts(kpts_band):
        if mydf._cderi is not None:
            log.warn('DF integrals for band k-points were not found %s. '
                     'DF integrals will be rebuilt to include band k-points.',
                     mydf._cderi)
        mydf.build(j_only=not with_k, kpts_band=kpts_band)
        t0 = log.timer_debug1('Init get_jk', *t0)

    vj = vk = None
    if kpts_band is not None and abs(kpt-kpts_band).sum() > 1e-9:
        kpt = numpy.reshape(kpt, (1,3))
        if with_k:
            vk = get_k_kpts(mydf, dm, hermi, kpt, kpts_band, exxdiv)
        if with_j:
            vj = get_j_kpts(mydf, dm, hermi, kpt, kpts_band)
        return vj, vk

    cell = mydf.cell
    dm = numpy.asarray(dm, order='C')
    dms = _format_dms(dm, kpt.reshape(1, 3))
    nset, _, nao = dms.shape[:3]
    dms = dms.reshape(nset,nao,nao)
    j_real = gamma_point(kpt)
    kptii = numpy.asarray((kpt,kpt))
    dmsR = dms.real.reshape(nset,nao,nao)
    dmsI = dms.imag.reshape(nset,nao,nao)
    mem_now = lib.current_memory()[0]
    max_memory = max(2000, (mydf.max_memory - mem_now))
    if with_j:
        vjR = numpy.zeros((nset,nao,nao))
        vjI = numpy.zeros((nset,nao,nao))
    if with_k:
        ''' math
        Mode 1: DM-based K-build:
            K(p,q)
                = V(r,q,p,s) * D(s,r)
                = V(L,r,q) * V(L,s,p).conj() * D(s,r)    eqn (1)

        Mode 2: Symm MO-based K-build:
        In case of Hermitian & PSD DM, eqn (1) can be rewritten as
            K(p,q)
                = W(L,i,p).conj() * W(L,i,q)
        where
            W(L,i,p) = V(L,s,p) * C(s,i).conj()
            D(s,r) = C(s,i) * C(r,i).conj()

        Mode 3: Asymm MO-based K-build:
        In case of non-Hermitian or Hermitian but non-PSD DM, eqn (1) can be rewritten as
            K(p,q)
                = X(L,i,p).conj() * Y(L,i,q)
            where
                X(L,i,p) = V(L,s,p) * A(s,i).conj()
                Y(L,i,q) = V(L,r,q) * B(r,i).conj()
                D(s,r) = A(s,i) * B(r,i).conj()
        '''
        smoR = smo2R = None
        if not mydf.force_dm_kbuild:
            if hermi == 1:
                smoR, smoI = _mo_from_dm(dms.reshape(-1,nao,nao), method='eigh',
                                           order='F', precision=cell.precision)
                if smoR is None:
                    log.debug1('get_jk: Eigh fails for input dm due to non-PSD. '
                               'Try SVD instead.')
            if smoR is None:
                smoR, smoI, smo2R, smo2I = _mo_from_dm(dms.reshape(-1,nao,nao),
                                                       method='svd', order='F',
                                                       precision=cell.precision)
                if smoR[0].shape[1] > nao//2:
                    log.debug1('get_jk: rank(dm) = %d exceeds half of nao = %d. '
                               'Fall back to DM-based build.', smoR[0].shape[1], nao)
                    smoR = smo2R = None

        vkR = numpy.zeros((nset,nao,nao))
        vkI = numpy.zeros((nset,nao,nao))
        buf1R = numpy.empty((mydf.blockdim*nao**2))
        buf1I = numpy.zeros((mydf.blockdim*nao**2))
        if smoR is None:
            # K ~ 'iLj,lLk*,li->kj' + 'lLk*,iLj,li->kj'
            #:pLq = (LpqR + LpqI.reshape(-1,nao,nao)*1j).transpose(1,0,2)
            #:tmp = numpy.dot(dm, pLq.reshape(nao,-1))
            #:vk += numpy.dot(pLq.reshape(-1,nao).conj().T, tmp.reshape(-1,nao))
            log.debug2('get_jk: build K from dm')
            k_real = gamma_point(kpt) and not numpy.iscomplexobj(dms)
            buf2R = numpy.empty((mydf.blockdim*nao**2))
            buf2I = numpy.empty((mydf.blockdim*nao**2))
            if k_real:
                def contract_k(pLqR, pLqI, sign):
                    nrow = pLqR.shape[1]
                    tmpR = numpy.ndarray((nao,nrow*nao), buffer=buf2R)
                    for i in range(nset):
                        lib.ddot(dmsR[i], pLqR.reshape(nao,-1), 1, tmpR)
                        lib.ddot(pLqR.reshape(-1,nao).T, tmpR.reshape(-1,nao),
                                 sign, vkR[i], 1)
            else:
                buf2I = numpy.empty((mydf.blockdim*nao**2))
                def contract_k(pLqR, pLqI, sign):
                    nrow = pLqR.shape[1]
                    tmpR = numpy.ndarray((nao,nrow*nao), buffer=buf2R)
                    tmpI = numpy.ndarray((nao,nrow*nao), buffer=buf2I)
                    for i in range(nset):
                        zdotNN(dmsR[i], dmsI[i], pLqR.reshape(nao,-1),
                               pLqI.reshape(nao,-1), 1, tmpR, tmpI, 0)
                        zdotCN(pLqR.reshape(-1,nao).T, pLqI.reshape(-1,nao).T,
                               tmpR.reshape(-1,nao), tmpI.reshape(-1,nao),
                               sign, vkR[i], vkI[i], 1)
        elif smo2R is None:
            log.debug2('get_jk: build K from symm mo coeff')
            nmo = smoR[0].shape[1]
            log.debug2('get_jk: rank(dm) = %d / %d', nmo, nao)
            smoI_mask = numpy.asarray([abs(moI).max() > cell.precision for moI in smoI])
            k_real = gamma_point(kpt) and not numpy.any(smoI_mask)
            buf2R = numpy.empty((mydf.blockdim*nao*nmo))
            if k_real:
                def contract_k(pLqR, pLqI, sign):
                    nrow = pLqR.shape[1]
                    tmpR = numpy.ndarray((nmo,nrow*nao), buffer=buf2R)
                    for i in range(nset):
                        lib.ddot(smoR[i].T, pLqR.reshape(nao,-1), 1, tmpR)
                        lib.ddot(tmpR.reshape(-1,nao).T, tmpR.reshape(-1,nao),
                                 sign, vkR[i], 1)
                    tmpR = None
            else:
                buf2I = numpy.empty((mydf.blockdim*nao*nmo))
                def contract_k(pLqR, pLqI, sign):
                    nrow = pLqR.shape[1]
                    tmpR = numpy.ndarray((nmo,nrow*nao), buffer=buf2R)
                    tmpI = numpy.ndarray((nmo,nrow*nao), buffer=buf2I)
                    for i in range(nset):
                        zdotCN(smoR[i].T, smoI[i].T,
                               pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                               1, tmpR, tmpI, 0)
                        zdotCN(tmpR.reshape(-1,nao).T, tmpI.reshape(-1,nao).T,
                               tmpR.reshape(-1,nao), tmpI.reshape(-1,nao),
                               sign, vkR[i], vkI[i], 1)
                    tmpR = tmpI = None
        else:
            log.debug2('get_jk: build K from asymm mo coeff')
            smo1R = smoR
            smo1I = smoI
            nmo = smo1R[0].shape[1]
            log.debug2('get_jk: rank(dm) = %d / %d', nmo, nao)
            smoI_mask = numpy.asarray([max(abs(mo1I).max(),
                                           abs(mo2I).max()) > cell.precision
                                       for mo1I,mo2I in zip(smo1I,smo2I)])
            k_real = gamma_point(kpt) and not numpy.any(smoI_mask)
            buf2R = numpy.empty((mydf.blockdim*nao*nmo*2))
            buf3R = buf2R[buf2R.size//2:]
            if k_real:
                def contract_k(pLqR, pLqI, sign):
                    nrow = pLqR.shape[1]
                    tmp1R = numpy.ndarray((nmo,nrow*nao), buffer=buf2R)
                    tmp2R = numpy.ndarray((nmo,nrow*nao), buffer=buf3R)
                    for i in range(nset):
                        lib.ddot(smo1R[i].T, pLqR.reshape(nao,-1), 1, tmp1R)
                        lib.ddot(smo2R[i].T, pLqR.reshape(nao,-1), 1, tmp2R)
                        lib.ddot(tmp1R.reshape(-1,nao).T, tmp2R.reshape(-1,nao),
                                 sign, vkR[i], 1)
                    tmp1R = tmp2R = None
            else:
                buf2I = numpy.empty((mydf.blockdim*nao*nmo*2))
                buf3I = buf2I[buf2I.size//2:]
                def contract_k(pLqR, pLqI, sign):
                    nrow = pLqR.shape[1]
                    tmp1R = numpy.ndarray((nmo,nrow*nao), buffer=buf2R)
                    tmp1I = numpy.ndarray((nmo,nrow*nao), buffer=buf2I)
                    tmp2R = numpy.ndarray((nmo,nrow*nao), buffer=buf3R)
                    tmp2I = numpy.ndarray((nmo,nrow*nao), buffer=buf3I)
                    for i in range(nset):
                        zdotCN(smo1R[i].T, smo1I[i].T,
                               pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                               1, tmp1R, tmp1I, 0)
                        zdotCN(smo2R[i].T, smo2I[i].T,
                               pLqR.reshape(nao,-1), pLqI.reshape(nao,-1),
                               1, tmp2R, tmp2I, 0)
                        zdotCN(tmp1R.reshape(-1,nao).T, tmp1I.reshape(-1,nao).T,
                               tmp2R.reshape(-1,nao), tmp2I.reshape(-1,nao),
                               sign, vkR[i], vkI[i], 1)
                    tmp1R = tmp1I = tmp2R = tmp2I = None
        max_memory *= .5
    log.debug1('get_jk: max_memory = %d MB (%d in use)', max_memory, mem_now)

    tspans = numpy.zeros((3,2))
    tspannames = ['  load', 'with_j', 'with_k']
    tspanmasks = [True, with_j, with_k]

    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
    pLqI = None
    thread_k = None
    for LpqR, LpqI, sign in mydf.sr_loop(kptii, max_memory, False):
        LpqR = LpqR.reshape(-1,nao,nao)
        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
        tspans[0] += tock - tick
        if with_j:
            #:rho_coeff = numpy.einsum('Lpq,xqp->xL', Lpq, dms)
            #:vj += numpy.dot(rho_coeff, Lpq.reshape(-1,nao**2))
            rhoR  = numpy.einsum('Lpq,xqp->xL', LpqR, dmsR)
            if not j_real:
                LpqI = LpqI.reshape(-1,nao,nao)
                rhoR -= numpy.einsum('Lpq,xqp->xL', LpqI, dmsI)
                rhoI  = numpy.einsum('Lpq,xqp->xL', LpqR, dmsI)
                rhoI += numpy.einsum('Lpq,xqp->xL', LpqI, dmsR)
            vjR += sign * numpy.einsum('xL,Lpq->xpq', rhoR, LpqR)
            if not j_real:
                vjR -= sign * numpy.einsum('xL,Lpq->xpq', rhoI, LpqI)
                vjI += sign * numpy.einsum('xL,Lpq->xpq', rhoR, LpqI)
                vjI += sign * numpy.einsum('xL,Lpq->xpq', rhoI, LpqR)

        tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
        tspans[1] += tick - tock

        if thread_k is not None:
            thread_k.join()
        if with_k:
            nrow = LpqR.shape[0]
            pLqR = numpy.ndarray((nao,nrow,nao), buffer=buf1R)
            pLqR[:] = LpqR.transpose(1,0,2)
            if not k_real:
                pLqI = numpy.ndarray((nao,nrow,nao), buffer=buf1I)
                if LpqI is not None:
                    pLqI[:] = LpqI.reshape(-1,nao,nao).transpose(1,0,2)

            thread_k = lib.background_thread(contract_k, pLqR, pLqI, sign)

        tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
        tspans[2] += tock - tick

        LpqR = LpqI = pLqR = pLqI = None

    tick = numpy.asarray((logger.process_clock(), logger.perf_counter()))
    if thread_k is not None:
        thread_k.join()
    thread_k = None

    tock = numpy.asarray((logger.process_clock(), logger.perf_counter()))
    tspans[2] += tock - tick

    for tspan,tspanname,tspanmask in zip(tspans,tspannames,tspanmasks):
        if tspanmask:
            log.debug1('    CPU time for %s %9.2f sec, wall time %9.2f sec',
                       tspanname, *tspan)

    if with_j:
        if j_real:
            vj = vjR
        else:
            vj = vjR + vjI * 1j
        vj = vj.reshape(dm.shape)
    if with_k:
        if k_real:
            vk = vkR
        else:
            vk = vkR + vkI * 1j
        if exxdiv == 'ewald' and cell.dimension != 0:
            _ewald_exxdiv_for_G0(cell, kpt, dms, vk)
        vk = vk.reshape(dm.shape)

    log.timer('sr jk', *t0)
    return vj, vk


def _sep_real_imag(a, ncolmax, order):
    nrow = a.shape[0]
    aR = numpy.zeros((nrow,ncolmax), dtype=numpy.float64)
    aI = numpy.zeros((nrow,ncolmax), dtype=numpy.float64)
    ncol = a.shape[1]
    aR[:,:ncol] = numpy.asarray(a.real, order=order)
    aI[:,:ncol] = numpy.asarray(a.imag, order=order)
    return aR, aI

def _format_mo(mo_coeff, mo_occ, shape=None, order='F', precision=DM2MO_PREC):
    mos = [mo[:,mocc>precision]*mocc[mocc>precision]**0.5
           for mo,mocc in zip(mo_coeff,mo_occ)]
    nkpts = len(mos)
    nmomax = numpy.max([mo.shape[1] for mo in mos])
    moRs = numpy.empty(nkpts, dtype=object)
    moIs = numpy.empty(nkpts, dtype=object)
    for k in range(nkpts):
        moRs[k], moIs[k] = _sep_real_imag(mos[k], nmomax, order)
    if shape is not None:
        moRs = moRs.reshape(*shape)
        moIs = moIs.reshape(*shape)
    return moRs, moIs

def _mo_from_dm(dms, method='eigh', shape=None, order='C', precision=DM2MO_PREC):
    import scipy.linalg
    nkpts = len(dms)
    precision *= 1e-2

    if method == 'eigh':
        def feigh(dm):
            e, u = scipy.linalg.eigh(dm)
            if numpy.any(e < -precision): # PSD matrix
                mo = None
            else:
                mask = e > precision
                mo = u[:,mask] * e[mask]**0.5
            return mo

        mos = numpy.empty(nkpts, dtype=object)
        for k,dm in enumerate(dms):
            mo = feigh(dm)
            if mo is None:
                return None, None
            mos[k] = mo

        nmos = [mo.shape[1] for mo in mos]
        nmomax = max(nmos)
        moRs = numpy.empty(nkpts, dtype=object)
        moIs = numpy.empty(nkpts, dtype=object)
        for k,mo in enumerate(mos):
            moRs[k], moIs[k] = _sep_real_imag(mo, nmomax, order)
        if shape is not None:
            moRs = moRs.reshape(*shape)
            moIs = moIs.reshape(*shape)
        return moRs, moIs
    elif method == 'svd':
        def fsvd(dm):
            u, e, vt = scipy.linalg.svd(dm)
            mask = e > precision
            mo1 = u[:,mask] * e[mask]
            mo2 = vt[mask].T.conj()
            return mo1, mo2

        mos = [fsvd(dm) for k,dm in enumerate(dms)]
        nmos = [x[0].shape[1] for x in mos]
        nmomax = max(nmos)
        mo1Rs = numpy.empty(nkpts, dtype=object)
        mo1Is = numpy.empty(nkpts, dtype=object)
        mo2Rs = numpy.empty(nkpts, dtype=object)
        mo2Is = numpy.empty(nkpts, dtype=object)
        for k,(mo1,mo2) in enumerate(mos):
            mo1Rs[k], mo1Is[k] = _sep_real_imag(mo1, nmomax, order)
            mo2Rs[k], mo2Is[k] = _sep_real_imag(mo2, nmomax, order)
        if shape is not None:
            mo1Rs = mo1Rs.reshape(*shape)
            mo1Is = mo1Is.reshape(*shape)
            mo2Rs = mo2Rs.reshape(*shape)
            mo2Is = mo2Is.reshape(*shape)
        return mo1Rs, mo1Is, mo2Rs, mo2Is
    else:
        raise RuntimeError('Unknown method %s' % method)

def _format_dms(dm_kpts, kpts):
    if kpts is None or kpts.ndim == 1:
        nkpts = 1
    else:
        nkpts = len(kpts)
    nao = dm_kpts.shape[-1]
    dms = dm_kpts.reshape(-1,nkpts,nao,nao)
    if dms.dtype not in (numpy.double, numpy.complex128):
        dms = numpy.asarray(dms, dtype=numpy.double)
    return dms

def _format_kpts_band(kpts_band, kpts):
    if kpts_band is None:
        kpts_band = kpts
    else:
        kpts_band = numpy.reshape(kpts_band, (-1,3))
    return kpts_band

def _format_jks(v_kpts, dm_kpts, kpts_band, kpts):
    if kpts_band is kpts or kpts_band is None:
        return v_kpts.reshape(dm_kpts.shape)
    else:
        if kpts is None or kpts.ndim == 1:
            nkpts = 1
        else:
            nkpts = len(kpts)
        if getattr(kpts_band, 'ndim', None) == 1:
            v_kpts = v_kpts[:,0]
# A temporary solution for issue 242. Looking for better ways to sort out the
# dimension of the output
# dm_kpts.shape     kpts.shape     nset
# (Nao,Nao)         (1 ,3)         None
# (Ndm,Nao,Nao)     (1 ,3)         Ndm
# (Nk,Nao,Nao)      (Nk,3)         None
# (Ndm,Nk,Nao,Nao)  (Nk,3)         Ndm
        if dm_kpts.ndim < 3:     # nset=None
            return v_kpts[0]
        elif dm_kpts.ndim == 3 and len(dm_kpts) == nkpts:
            return v_kpts[0]
        else:  # dm_kpts.ndim == 4 or kpts.shape[0] == 1:  # nset=Ndm
            return v_kpts

def _ewald_exxdiv_for_G0(cell, kpts, dms, vk, kpts_band=None):
    s = cell.pbc_intor('int1e_ovlp', hermi=1, kpts=kpts)
    madelung = tools.pbc.madelung(cell, kpts)
    if kpts is None:
        for i,dm in enumerate(dms):
            vk[i] += madelung * reduce(numpy.dot, (s, dm, s))
    elif numpy.shape(kpts) == (3,):
        if kpts_band is None or is_zero(kpts_band-kpts):
            for i,dm in enumerate(dms):
                vk[i] += madelung * reduce(numpy.dot, (s, dm, s))

    elif kpts_band is None or numpy.array_equal(kpts, kpts_band):
        for k in range(len(kpts)):
            for i,dm in enumerate(dms):
                vk[i,k] += madelung * reduce(numpy.dot, (s[k], dm[k], s[k]))
    else:
        for k, kpt in enumerate(kpts):
            for kp in member(kpt, kpts_band.reshape(-1,3)):
                for i,dm in enumerate(dms):
                    vk[i,kp] += madelung * reduce(numpy.dot, (s[k], dm[k], s[k]))


if __name__ == '__main__':
    import pyscf.pbc.gto as pgto
    import pyscf.pbc.scf as pscf

    L = 5.
    n = 11
    cell = pgto.Cell()
    cell.a = numpy.diag([L,L,L])
    cell.mesh = numpy.array([n,n,n])

    cell.atom = '''C    3.    2.       3.
                   C    1.    1.       1.'''
    #cell.basis = {'He': [[0, (1.0, 1.0)]]}
    #cell.basis = '631g'
    #cell.basis = {'He': [[0, (2.4, 1)], [1, (1.1, 1)]]}
    cell.basis = 'ccpvdz'
    cell.verbose = 0
    cell.build(0,0)
    cell.verbose = 5

    mf = pscf.RHF(cell)
    dm = mf.get_init_guess()
    auxbasis = 'weigend'
    #from pyscf import df
    #auxbasis = df.addons.aug_etb_for_dfbasis(cell, beta=1.5, start_at=0)
    #from pyscf.pbc.df import mdf
    #mf.with_df = mdf.MDF(cell)
    #mf.auxbasis = auxbasis
    mf = density_fit(mf, auxbasis)
    mf.with_df.mesh = (n,) * 3
    vj = mf.with_df.get_jk(dm, exxdiv=mf.exxdiv, with_k=False)[0]
    print(numpy.einsum('ij,ji->', vj, dm), 'ref=46.698942480902062')
    vj, vk = mf.with_df.get_jk(dm, exxdiv=mf.exxdiv)
    print(numpy.einsum('ij,ji->', vj, dm), 'ref=46.698942480902062')
    print(numpy.einsum('ij,ji->', vk, dm), 'ref=37.348163681114187')
    print(numpy.einsum('ij,ji->', mf.get_hcore(cell), dm), 'ref=-75.5758086593503')

    kpts = cell.make_kpts([2]*3)[:4]
    from pyscf.pbc.df import DF
    with_df = DF(cell, kpts)
    with_df.auxbasis = 'weigend'
    with_df.mesh = [n] * 3
    dms = numpy.array([dm]*len(kpts))
    vj, vk = with_df.get_jk(dms, exxdiv=mf.exxdiv, kpts=kpts)
    print(numpy.einsum('ij,ji->', vj[0], dms[0]) - 46.69784067248350)
    print(numpy.einsum('ij,ji->', vj[1], dms[1]) - 46.69814992718212)
    print(numpy.einsum('ij,ji->', vj[2], dms[2]) - 46.69526120279135)
    print(numpy.einsum('ij,ji->', vj[3], dms[3]) - 46.69570739526301)
    print(numpy.einsum('ij,ji->', vk[0], dms[0]) - 37.26974254415191)
    print(numpy.einsum('ij,ji->', vk[1], dms[1]) - 37.27001407288309)
    print(numpy.einsum('ij,ji->', vk[2], dms[2]) - 37.27000643285160)
    print(numpy.einsum('ij,ji->', vk[3], dms[3]) - 37.27010299675364)