INDEX
Negative Logits
Obt
-0.08
Uncomment
-0.08
arst
-0.08
Fant
-0.07
ავთ
-0.07
12
-0.07
CSL
-0.07
terwijl
-0.07
hydr
-0.07
erzielt
-0.07
POSITIVE LOGITS
сравн
0.08
comparative
0.08
ни
0.07
Nathan
0.07
sake
0.07
vaikut
0.07
अपराध
0.07
то
0.07
verhe
0.07
oner
0.07
Activations Density 0.000%