INDEX
Negative Logits
bri
-0.09
ుగ
-0.08
ిగి
-0.07
bahkan
-0.07
Porn
-0.07
zelfs
-0.07
481
-0.07
甚至
-0.07
284
-0.07
aza
-0.07
POSITIVE LOGITS
careful
0.09
/or
0.08
anschließend
0.08
ingenuity
0.08
тщ
0.08
carefully
0.08
sorgfält
0.07
egen
0.07
condition
0.07
eng
0.07
Activations Density 0.059%