INDEX
Negative Logits
โรค
-0.07
activists
-0.07
ilmiştir
-0.07
diameter
-0.06
orientation
-0.06
hvordan
-0.06
Dice
-0.06
jack
-0.06
_alias
-0.06
drift
-0.06
POSITIVE LOGITS
.strptime
0.12
нима
0.07
우리
0.07
itionally
0.07
professionals
0.06
λεύ
0.06
onestly
0.06
idle
0.06
إي
0.06
п
0.06
Activations Density 0.001%