INDEX
Negative Logits
эксплуата
-0.07
iyoruz
-0.07
підприєм
-0.06
(pe
-0.06
コ
-0.06
-stop
-0.06
dữ
-0.06
crash
-0.06
iado
-0.06
Meta
-0.06
POSITIVE LOGITS
/T
0.07
inters
0.07
dara
0.06
KH
0.06
BH
0.06
atz
0.06
(&_
0.06
hh
0.06
tendencies
0.06
Sv
0.06
Activations Density 0.001%