INDEX
Negative Logits
aired
-0.09
ighbors
-0.07
مسب
-0.07
capacitación
-0.07
honestly
-0.07
airing
-0.07
🏻
-0.07
Sand
-0.07
mans
-0.07
airs
-0.07
POSITIVE LOGITS
terme
0.08
тен
0.07
_D
0.07
guda
0.07
exc
0.07
glitch
0.07
sluč
0.07
тот
0.07
രേഖ
0.07
porto
0.07
Activations Density 0.019%