INDEX
Explanations
words related to legal and formal contexts
New Auto-Interp
Negative Logits
geschichten
-0.17
techn
-0.16
kvin
-0.15
lesbische
-0.15
bü
-0.15
tie
-0.15
zent
-0.14
rech
-0.14
mechan
-0.14
üns
-0.14
POSITIVE LOGITS
och
0.24
till
0.23
på
0.21
av
0.19
eller
0.19
tv
0.19
Ã¥
0.19
efter
0.18
emy
0.18
ens
0.18
Activations Density 0.236%