INDEX
Explanations
Okay, initiating explanation
New Auto-Interp
Negative Logits
omegranate
0.32
restitution
0.30
ad
0.29
หัด
0.29
réflexion
0.28
वारदात
0.27
Matthe
0.27
antipsych
0.26
athed
0.26
Berlusconi
0.26
POSITIVE LOGITS
본격
0.30
iniziamo
0.29
全面的
0.29
extensively
0.28
ٹو
0.28
поговорим
0.28
.`
0.27
कंडी
0.27
全面
0.27
பல்வேறு
0.27
Activations Density 0.583%