GTE-SparseCL-arguana / custom_info
xiaoxiaolin's picture
Upload folder using huggingface_hub
ee17ccf verified
epoch=0 step=74 progress=0.111 eval info {'sparsity_loss': 1.949, 'l1l2_ratio_z12': 22.631, 'l1l2_ratio_z13': 24.155, 'l1l2_ratio_z13_all': 25.045} train info {'sparsity_loss': 3.651, 'l1l2_ratio_z12': 24.58, 'l1l2_ratio_z13': 25.062, 'l1l2_ratio_z13_all': 25.343}
epoch=0 step=148 progress=0.221 eval info {'sparsity_loss': 1.558, 'l1l2_ratio_z12': 22.342, 'l1l2_ratio_z13': 24.291, 'l1l2_ratio_z13_all': 25.219} train info {'sparsity_loss': 1.173, 'l1l2_ratio_z12': 22.703, 'l1l2_ratio_z13': 24.374, 'l1l2_ratio_z13_all': 25.265}
epoch=0 step=222 progress=0.332 eval info {'sparsity_loss': 1.27, 'l1l2_ratio_z12': 22.035, 'l1l2_ratio_z13': 24.157, 'l1l2_ratio_z13_all': 25.208} train info {'sparsity_loss': 0.651, 'l1l2_ratio_z12': 22.266, 'l1l2_ratio_z13': 24.341, 'l1l2_ratio_z13_all': 25.342}
epoch=1 step=74 progress=0.444 eval info {'sparsity_loss': 1.132, 'l1l2_ratio_z12': 22.216, 'l1l2_ratio_z13': 24.25, 'l1l2_ratio_z13_all': 25.28} train info {'sparsity_loss': 0.314, 'l1l2_ratio_z12': 21.793, 'l1l2_ratio_z13': 24.227, 'l1l2_ratio_z13_all': 25.301}
epoch=1 step=148 progress=0.555 eval info {'sparsity_loss': 1.286, 'l1l2_ratio_z12': 21.864, 'l1l2_ratio_z13': 24.165, 'l1l2_ratio_z13_all': 25.198} train info {'sparsity_loss': 0.217, 'l1l2_ratio_z12': 21.591, 'l1l2_ratio_z13': 24.223, 'l1l2_ratio_z13_all': 25.317}
epoch=1 step=222 progress=0.665 eval info {'sparsity_loss': 1.127, 'l1l2_ratio_z12': 21.936, 'l1l2_ratio_z13': 24.184, 'l1l2_ratio_z13_all': 25.2} train info {'sparsity_loss': 0.147, 'l1l2_ratio_z12': 21.386, 'l1l2_ratio_z13': 24.178, 'l1l2_ratio_z13_all': 25.285}
epoch=2 step=74 progress=0.777 eval info {'sparsity_loss': 1.143, 'l1l2_ratio_z12': 21.521, 'l1l2_ratio_z13': 24.022, 'l1l2_ratio_z13_all': 25.143} train info {'sparsity_loss': 0.073, 'l1l2_ratio_z12': 20.703, 'l1l2_ratio_z13': 24.008, 'l1l2_ratio_z13_all': 25.209}
epoch=2 step=148 progress=0.888 eval info {'sparsity_loss': 1.199, 'l1l2_ratio_z12': 21.347, 'l1l2_ratio_z13': 24.007, 'l1l2_ratio_z13_all': 25.138} train info {'sparsity_loss': 0.057, 'l1l2_ratio_z12': 20.624, 'l1l2_ratio_z13': 24.002, 'l1l2_ratio_z13_all': 25.216}
epoch=2 step=222 progress=0.999 eval info {'sparsity_loss': 1.186, 'l1l2_ratio_z12': 21.136, 'l1l2_ratio_z13': 23.883, 'l1l2_ratio_z13_all': 25.085} train info {'sparsity_loss': 0.049, 'l1l2_ratio_z12': 20.424, 'l1l2_ratio_z13': 23.957, 'l1l2_ratio_z13_all': 25.19}