INDEX
Explanations
German words or simple sentences
New Auto-Interp
Negative Logits
ორგანო
1.42
manually
1.33
qualities
1.31
someone
1.30
instructor
1.29
carpentry
1.28
單
1.28
costumes
1.25
staring
1.24
gradually
1.22
POSITIVE LOGITS
eine
2.19
insbesondere
1.96
viele
1.95
für
1.91
nicht
1.90
bereits
1.86
jetzt
1.86
einen
1.85
aufgrund
1.83
besonders
1.81
Activations Density 0.136%