INDEX
Negative Logits
darn
-0.09
ãs
-0.08
sweater
-0.08
iefer
-0.08
kee
-0.08
?):
-0.08
திட்ட
-0.08
hearth
-0.08
основной
-0.07
irons
-0.07
POSITIVE LOGITS
lyd
0.09
overthrow
0.08
lj
0.08
kutoka
0.08
vid
0.07
supernatural
0.07
impressive
0.07
grandeur
0.07
Manifest
0.07
visibly
0.07
Activations Density 0.006%