INDEX
Negative Logits
thre
-0.07
thriving
-0.07
burgeoning
-0.07
elm
-0.07
Fut
-0.07
'avenir
-0.06
ોથી
-0.06
RK
-0.06
shame
-0.06
CLU
-0.06
POSITIVE LOGITS
miser
0.09
viol
0.09
Nope
0.08
nein
0.08
့
0.08
idelijk
0.08
vielmehr
0.08
않
0.08
않고
0.08
sɛ
0.08
Activations Density 0.026%