INDEX
Negative Logits
лири
-0.08
ographed
-0.07
опол
-0.07
安县
-0.07
deviation
-0.07
平特
-0.07
_price
-0.07
matat
-0.07
молит
-0.07
lix
-0.07
POSITIVE LOGITS
journal
0.08
定
0.08
ktor
0.07
home
0.07
pono
0.07
主任
0.07
(home
0.07
trags
0.07
ję
0.07
contradiction
0.07
Activations Density 0.002%