INDEX
Negative Logits
üzel
-0.07
amaç
-0.06
peating
-0.06
izens
-0.06
äge
-0.06
совет
-0.06
African
-0.06
звичай
-0.06
racist
-0.06
used
-0.06
POSITIVE LOGITS
throne
0.16
Throne
0.11
Thrones
0.09
><?
0.07
(inputStream
0.07
905
0.07
◆
0.07
thro
0.07
坛
0.07
HONE
0.06
Activations Density 0.002%