INDEX
Negative Logits
Part
-0.07
Check
-0.07
seudo
-0.07
焦
-0.07
redni
-0.07
ᠩ
-0.07
修
-0.07
躁
-0.06
茹
-0.06
freaking
-0.06
POSITIVE LOGITS
değer
0.07
imagining
0.07
боль
0.06
_tokens
0.06
fluor
0.06
poke
0.06
אם
0.06
location
0.06
קופה
0.06
Dolphins
0.06
Activations Density 0.002%