INDEX
Negative Logits
соб
-0.09
ధ
-0.08
тор
-0.08
getir
-0.07
Brass
-0.07
😉
-0.07
нельзя
-0.07
workplace
-0.07
̆
-0.07
presentado
-0.07
POSITIVE LOGITS
אר
0.09
משתמש
0.08
乘
0.08
ின்
0.08
یې
0.08
ún
0.07
.invoke
0.07
hej
0.07
רש
0.07
משנה
0.07
Activations Density 0.108%