run_lfads_multi.py

import argparse
import os
import pickle

import torch
import torchvision
import torchvision.transforms as trf
import torch.optim as opt

from trainer import RunManager
from scheduler import LFADS_Scheduler
from objective import LFADS_Loss, LogLikelihoodPoisson
from lfads import LFADS_MultiSession_Net
from utils import read_data, load_parameters
from plotter import Plotter
from dataset import LFADS_MultiSession_Dataset, SessionLoader

parser = argparse.ArgumentParser()
parser.add_argument('-d', '--data_path', type=str)
parser.add_argument('-p', '--hyperparameter_path', type=str)
parser.add_argument('-o', '--output_dir', default='/tmp', type=str)
parser.add_argument('--max_epochs', default=2000, type=int)
parser.add_argument('--batch_size', default=None, type=int)
parser.add_argument('-t', '--use_tensorboard', action='store_true', default=False)
parser.add_argument('-r', '--restart', action='store_true', default=False)
parser.add_argument('-c', '--do_health_check', action='store_true', default=False)

def main():
    args = parser.parse_args()
    
    device = 'cuda' if torch.cuda.is_available() else 'cpu'

    hyperparams = load_parameters(args.hyperparameter_path)
    
    data_name = os.path.splitext(args.data_path.split('/')[-1])[0]
    model_name = hyperparams['model_name']
    mhp_list = [key.replace('size', '').replace('_', '')[:4] + str(val) for key, val in hyperparams['model'].items() if 'size' in key]
    mhp_list.sort()
    hyperparams['run_name'] = '_'.join(mhp_list)
    save_loc = '%s/%s/%s/%s/'%(args.output_dir, data_name, model_name, hyperparams['run_name'])
    
    if not os.path.exists(save_loc):
        os.makedirs(save_loc)
    
    data_dict   = pickle.load(open(args.data_path, 'rb'))
    keys = [key for key in data_dict.keys() if type(data_dict[key]) is dict]
    keys.sort()
    train_data_list  = [data_dict[key]['train_data'] for key in keys]
    valid_data_list  = [data_dict[key]['valid_data'] for key in keys]

    
    train_ds    = LFADS_MultiSession_Dataset(train_data_list, device=device)
    valid_ds    = LFADS_MultiSession_Dataset(valid_data_list, device=device)
    train_dl    = SessionLoader(train_ds, sampler=torch.utils.data.RandomSampler(train_ds))
    valid_dl    = SessionLoader(valid_ds)
    
    transforms  = trf.Compose([])
    
    loglikelihood = LogLikelihoodPoisson(dt=float(data_dict['dt']))
    
    objective = LFADS_Loss(loglikelihood            = loglikelihood,
                           loss_weight_dict         = {'kl': hyperparams['objective']['kl'], 
                                                       'l2': hyperparams['objective']['l2']},
                           l2_con_scale             = hyperparams['objective']['l2_con_scale'],
                           l2_gen_scale             = hyperparams['objective']['l2_gen_scale']).to(device)
    
    W_in_list  = [torch.Tensor(data_dict[key]['W_in']).to(device) for key in keys]
    W_out_list = [torch.Tensor(data_dict[key]['W_out']).to(device) for key in keys]
    b_in_list  = [torch.Tensor(data_dict[key]['b_in']).to(device) for key in keys]
    b_out_list = [torch.Tensor(data_dict[key]['b_out']).to(device) for key in keys]
    
    model = LFADS_MultiSession_Net(W_in_list            = W_in_list,
                                   W_out_list           = W_out_list,
                                   b_in_list            = b_in_list,
                                   b_out_list           = b_out_list,
                                   factor_size          = hyperparams['model']['factor_size'],
                                   g_encoder_size       = hyperparams['model']['g_encoder_size'],
                                   c_encoder_size       = hyperparams['model']['c_encoder_size'],
                                   g_latent_size        = hyperparams['model']['g_latent_size'],
                                   u_latent_size        = hyperparams['model']['u_latent_size'],
                                   controller_size      = hyperparams['model']['c_controller_size'],
                                   generator_size       = hyperparams['model']['generator_size'],
                                   prior                = hyperparams['model']['prior'],
                                   clip_val             = hyperparams['model']['clip_val'],
                                   dropout              = hyperparams['model']['dropout'],
                                   do_normalize_factors = hyperparams['model']['normalize_factors'],
                                   max_norm             = hyperparams['model']['max_norm'],
                                   device               = device).to(device)
    
    total_params = 0
    for ix, (name, param) in enumerate(model.named_parameters()):
        print(ix, name, list(param.shape), param.numel(), param.requires_grad)
        total_params += param.numel()
    
    print('Total parameters: %i'%total_params)

    optimizer = opt.Adam(model.parameters(),
                         lr=hyperparams['optimizer']['lr_init'],
                         betas=hyperparams['optimizer']['betas'],
                         eps=hyperparams['optimizer']['eps'])

    scheduler = LFADS_Scheduler(optimizer      = optimizer,
                                mode           = 'min',
                                factor         = hyperparams['scheduler']['scheduler_factor'],
                                patience       = hyperparams['scheduler']['scheduler_patience'],
                                verbose        = True,
                                threshold      = 1e-4,
                                threshold_mode = 'abs',
                                cooldown       = hyperparams['scheduler']['scheduler_cooldown'],
                                min_lr         = hyperparams['scheduler']['lr_min'])
    
    num_steps = train_data_list[0].shape[1]
    TIME = torch._np.arange(0, num_steps*data_dict['dt'], data_dict['dt'])

    plotter = {'train' : Plotter(time=TIME),
               'valid' : Plotter(time=TIME)}
    
    if args.use_tensorboard:
        import importlib
        if importlib.util.find_spec('torch.utils.tensorboard'):
            tb_folder = save_loc + 'tensorboard/'
            if not os.path.exists(tb_folder):
                os.mkdir(tb_folder)
            elif os.path.exists(tb_folder) and args.restart:
                os.system('rm -rf %s'%tb_folder)
                os.mkdir(tb_folder)

            from torch.utils.tensorboard import SummaryWriter
            writer = SummaryWriter(tb_folder)
            rm_plotter = plotter
        else:
            writer = None
            rm_plotter = None
    else:
        writer = None
        rm_plotter = None

    run_manager = RunManager(model      = model,
                             objective  = objective,
                             optimizer  = optimizer,
                             scheduler  = scheduler,
                             train_dl   = train_dl,
                             valid_dl   = valid_dl,
                             transforms = transforms,
                             writer     = writer,
                             plotter    = rm_plotter,
                             max_epochs = args.max_epochs,
                             save_loc   = save_loc,
                             do_health_check = args.do_health_check)

    run_manager.run()

if __name__ == '__main__':
    main()