INDEX
Negative Logits
taus
-0.09
wygląda
-0.08
lau
-0.08
923
-0.08
lernen
-0.08
Lernen
-0.08
tau
-0.08
taus
-0.07
为了
-0.07
jeder
-0.07
POSITIVE LOGITS
.ant
0.08
partnership
0.08
River
0.08
Institute
0.07
vic
0.07
ích
0.07
antip
0.07
gevoel
0.07
variety
0.07
观点
0.07
Activations Density 0.363%