INDEX
Negative Logits
empo
-0.18
ήν
-0.16
εί
-0.16
rana
-0.16
-scenes
-0.15
ëŁŃ
-0.15
>{!!-0.14
uses
-0.14
lacak
-0.14
ONGL
-0.14
POSITIVE LOGITS
de
0.15
wind
0.15
obo
0.14
Wind
0.14
uro
0.14
218
0.14
ìĭ¬
0.14
acer
0.14
indeed
0.13
admir
0.13
Activations Density 0.006%