INDEX
Negative Logits
müssen
-0.08
trolls
-0.08
�
-0.08
tiens
-0.07
Assertions
-0.07
ી
-0.07
lactose
-0.07
stof
-0.07
helves
-0.07
.he
-0.07
POSITIVE LOGITS
ناه
0.08
หรือ
0.08
یا
0.08
atawa
0.08
किंवा
0.08
സൗ
0.08
Goa
0.08
atanapi
0.08
նվ
0.08
بزرگ
0.08
Activations Density 0.016%