INDEX
Negative Logits
ifade
-0.07
_DIP
-0.07
Evalu
-0.07
μέν
-0.06
erg
-0.06
гля
-0.06
силы
-0.06
Sequ
-0.06
Arb
-0.06
Sadd
-0.06
POSITIVE LOGITS
(total
0.07
ogne
0.06
Expiration
0.06
_CLASSES
0.06
(Material
0.06
tấn
0.06
Fury
0.06
0.06
_turn
0.06
theological
0.06
Activations Density 0.005%