INDEX
Negative Logits
csvfile
-0.07
ähr
-0.07
этому
-0.06
otra
-0.06
hookers
-0.06
Spoiler
-0.06
itude
-0.06
Müller
-0.06
DRAW
-0.06
Hallo
-0.06
POSITIVE LOGITS
Japan
0.20
Japanese
0.17
Japan
0.17
Japanese
0.14
日本
0.10
japanese
0.10
japan
0.10
japon
0.10
Tokyo
0.09
apanese
0.09
Activations Density 0.014%