INDEX
Negative Logits
总
0.40
孙
0.39
数学
0.39
任务
0.39
永远
0.38
始终
0.37
函数
0.37
医药
0.37
当我们
0.37
মানবিক
0.36
POSITIVE LOGITS
instead
0.75
instead
0.70
statt
0.65
Instead
0.59
invece
0.57
вместо
0.57
malah
0.56
Instead
0.55
rather
0.55
plutôt
0.50
Activations Density 0.001%