INDEX
Negative Logits
Noble
-0.08
часу
-0.08
akoko
-0.08
Wolf
-0.08
زیادی
-0.07
času
-0.07
(credentials
-0.07
Wolf
-0.07
elling
-0.07
platz
-0.07
POSITIVE LOGITS
检
0.08
LAB
0.08
Tule
0.08
observers
0.08
原则
0.07
ನಿ
0.07
сь
0.07
trace
0.07
princip
0.07
och
0.07
Activations Density 0.010%