INDEX
Negative Logits
lapse
-0.09
EMS
-0.08
semif
-0.08
Nek
-0.07
ಗರ
-0.07
dex
-0.07
рав
-0.07
segur
-0.07
ako
-0.07
иле
-0.07
POSITIVE LOGITS
️
0.12
beer
0.08
ydro
0.08
ة
0.08
انہ
0.07
大利
0.07
flake
0.07
wert
0.07
n't
0.07
werk
0.07
Activations Density 0.049%