INDEX
Explanations
phrases ending in approval or limitations
New Auto-Interp
Negative Logits
umball
0.52
ack
0.52
marqu
0.51
grinders
0.50
offices
0.48
ayers
0.46
ܐ
0.45
olev
0.45
alkenyl
0.45
andelion
0.45
POSITIVE LOGITS
Spaß
0.57
Mathis
0.53
нда
0.49
Hans
0.49
ออกจาก
0.48
擞
0.47
াত্মক
0.47
Herbst
0.47
Meister
0.46
Schwier
0.46
Activations Density 0.000%