INDEX
Negative Logits
odo
-0.08
ohner
-0.07
zeug
-0.07
Immer
-0.07
arb
-0.07
Arom
-0.07
Kar
-0.07
-0.07
KW
-0.07
Mang
-0.07
POSITIVE LOGITS
Towards
0.09
hacia
0.09
faint
0.09
уу
0.08
раҡ
0.08
toward
0.08
вверх
0.08
что
0.08
انے
0.08
towards
0.08
Activations Density 0.003%