INDEX
Negative Logits
hilar
-0.09
exam
-0.08
LIKE
-0.08
ۇر
-0.08
смен
-0.07
inspecting
-0.07
angaje
-0.07
Bana
-0.07
счастлив
-0.07
ად
-0.07
POSITIVE LOGITS
罪
0.08
beings
0.08
Sea
0.08
sea
0.08
台
0.08
空气
0.07
otive
0.07
ibh
0.07
sea
0.07
үл
0.07
Activations Density 0.004%