INDEX
Negative Logits
ίνα
-0.08
đoán
-0.07
goog
-0.06
_study
-0.06
licensed
-0.06
адміністра
-0.06
lying
-0.06
_iteration
-0.06
بار
-0.06
simulation
-0.06
POSITIVE LOGITS
Ads
0.07
).</
0.07
.adj
0.07
Advance
0.07
бесп
0.06
buds
0.06
Expert
0.06
.fig
0.06
Frag
0.06
.?
0.06
Activations Density 0.006%