INDEX
Negative Logits
14
-0.08
148
-0.07
169
-0.07
rd
-0.07
15
-0.06
54
-0.06
664
-0.06
ry
-0.06
Dillon
-0.06
749
-0.06
POSITIVE LOGITS
website
0.11
Website
0.09
Website
0.08
окон
0.08
özellikle
0.08
websites
0.08
bsite
0.07
ості
0.07
wasn
0.07
isa
0.07
Activations Density 0.019%