INDEX
Negative Logits
.agent
-0.08
Helen
-0.07
τών
-0.07
Christie
-0.07
ぎ
-0.07
görün
-0.07
गो
-0.07
Kitty
-0.07
leben
-0.07
Александр
-0.07
POSITIVE LOGITS
-(
0.08
−
0.08
conducive
0.08
nass
0.08
kow
0.08
సామ
0.07
-[
0.07
_OVER
0.07
-made
0.07
incontri
0.07
Activations Density 0.177%