INDEX
Negative Logits
alcon
-0.08
LOYEE
-0.07
Stanley
-0.07
odynam
-0.07
olmaz
-0.07
neighbour
-0.07
TEMP
-0.07
Caroline
-0.07
丁
-0.07
ático
-0.07
POSITIVE LOGITS
hue
0.15
Hue
0.14
ue
0.12
hues
0.11
hue
0.11
UE
0.10
ues
0.08
Hu
0.08
Hun
0.08
uen
0.07
Activations Density 0.003%