INDEX
Negative Logits
lac
-0.08
hole
-0.08
dif
-0.08
holes
-0.08
risk
-0.08
001
-0.08
hole
-0.08
god
-0.08
ataka
-0.07
get
-0.07
POSITIVE LOGITS
specifies
0.09
بالر
0.09
Uphol
0.08
tổng
0.08
معنا
0.08
ونډ
0.08
/results
0.08
refers
0.08
功
0.08
erschein
0.08
Activations Density 0.170%