INDEX
Negative Logits
ografia
-0.08
ór
-0.07
iph
-0.07
Scan
-0.07
“Oh
-0.07
"Oh
-0.07
(up
-0.07
ічних
-0.07
battles
-0.07
ongan
-0.07
POSITIVE LOGITS
radi
0.26
Radi
0.19
Radi
0.14
radi
0.12
adi
0.09
ADI
0.08
_radi
0.08
intimidation
0.06
865
0.06
Zaman
0.06
Activations Density 0.004%