zhangbo2008
/

codeformer

Model card Files Files and versions Community

codeformer / options /CodeFormer_inpainting.yml

zhangbo2008's picture

Upload folder using huggingface_hub

6c60ccc about 1 year ago

history blame contribute delete

3.1 kB

	# general settings
	name: CodeFormer_inpainting
	model_type: CodeFormerModel
	num_gpu: 4
	manual_seed: 0

	# dataset and data loader settings
	datasets:
	train:
	name: FFHQ
	type: FFHQBlindDataset
	dataroot_gt: datasets/ffhq/ffhq_512
	filename_tmpl: '{}'
	io_backend:
	type: disk

	in_size: 512
	gt_size: 512
	mean: [0.5, 0.5, 0.5]
	std: [0.5, 0.5, 0.5]
	use_hflip: true
	use_corrupt: false
	gen_inpaint_mask: true

	latent_gt_path: ~ # without pre-calculated latent code
	# latent_gt_path: './experiments/pretrained_models/VQGAN/latent_gt_code1024.pth'

	# data loader
	num_worker_per_gpu: 2
	batch_size_per_gpu: 3
	dataset_enlarge_ratio: 100
	prefetch_mode: ~

	# val:
	# name: CelebA-HQ-512
	# type: PairedImageDataset
	# dataroot_lq: datasets/faces/validation/lq
	# dataroot_gt: datasets/faces/validation/gt
	# io_backend:
	# type: disk
	# mean: [0.5, 0.5, 0.5]
	# std: [0.5, 0.5, 0.5]
	# scale: 1

	# network structures
	network_g:
	type: CodeFormer
	dim_embd: 512
	n_head: 8
	n_layers: 9
	codebook_size: 1024
	connect_list: ['32', '64', '128']
	fix_modules: ['quantize','generator']
	vqgan_path: './experiments/pretrained_models/vqgan/vqgan_code1024.pth' # pretrained VQGAN

	network_vqgan: # this config is needed if no pre-calculated latent
	type: VQAutoEncoder
	img_size: 512
	nf: 64
	ch_mult: [1, 2, 2, 4, 4, 8]
	quantizer: 'nearest'
	codebook_size: 1024

	network_d:
	type: VQGANDiscriminator
	nc: 3
	ndf: 64
	n_layers: 4
	model_path: ~

	# path
	path:
	pretrain_network_g: ~
	param_key_g: params_ema
	strict_load_g: true
	pretrain_network_d: ~
	strict_load_d: true
	resume_state: ~

	# base_lr(4.5e-6)*bach_size(4)
	train:
	use_hq_feat_loss: true
	feat_loss_weight: 1.0
	cross_entropy_loss: true
	entropy_loss_weight: 0.5
	scale_adaptive_gan_weight: 0.1
	fidelity_weight: 1.0

	optim_g:
	type: Adam
	lr: !!float 7e-5
	weight_decay: 0
	betas: [0.9, 0.99]
	optim_d:
	type: Adam
	lr: !!float 7e-5
	weight_decay: 0
	betas: [0.9, 0.99]

	scheduler:
	type: MultiStepLR
	milestones: [250000, 300000]
	gamma: 0.5

	total_iter: 300000

	warmup_iter: -1 # no warm up
	ema_decay: 0.997

	pixel_opt:
	type: L1Loss
	loss_weight: 1.0
	reduction: mean

	perceptual_opt:
	type: LPIPSLoss
	loss_weight: 1.0
	use_input_norm: true
	range_norm: true

	gan_opt:
	type: GANLoss
	gan_type: hinge
	loss_weight: !!float 1.0 # adaptive_weighting


	use_adaptive_weight: true

	net_g_start_iter: 0
	net_d_iters: 1
	net_d_start_iter: 296001
	manual_seed: 0

	# validation settings
	val:
	val_freq: !!float 5e10 # no validation
	save_img: true

	metrics:
	psnr: # metric name, can be arbitrary
	type: calculate_psnr
	crop_border: 4
	test_y_channel: false

	# logging settings
	logger:
	print_freq: 100
	save_checkpoint_freq: !!float 1e4
	use_tb_logger: true
	wandb:
	project: ~
	resume_id: ~

	# dist training settings
	dist_params:
	backend: nccl
	port: 29420

	find_unused_parameters: true