INDEX
Explanations
phrases related to cultural or artistic themes
New Auto-Interp
Negative Logits
lero
-0.18
urum
-0.17
leich
-0.17
zdrav
-0.16
etti
-0.15
weiber
-0.15
abor
-0.14
erdale
-0.14
emey
-0.14
avaÅŁ
-0.14
POSITIVE LOGITS
dan
0.34
yang
0.32
dengan
0.29
dari
0.28
di
0.28
secara
0.27
untuk
0.27
atau
0.26
pada
0.25
nya
0.24
Activations Density 0.007%