INDEX
Negative Logits
electrom
-0.08
najm
-0.08
第
-0.08
Wester
-0.08
Passing
-0.07
-0.07
электрон
-0.07
வி
-0.07
opping
-0.07
OH
-0.07
POSITIVE LOGITS
Prim
0.09
qualit
0.08
ített
0.08
serves
0.08
Prim
0.08
ított
0.08
regarded
0.08
servir
0.07
qualitative
0.07
caractéristiques
0.07
Activations Density 0.001%