INDEX
Explanations
people and their actions/relations
New Auto-Interp
Negative Logits
only
0.36
allele
0.34
hanya
0.32
sheer
0.32
exists
0.31
เป็น
0.31
forces
0.31
تبقى
0.31
zeuge
0.30
まさに
0.30
POSITIVE LOGITS
الذين
0.49
którzy
0.41
cuyas
0.37
cuja
0.37
који
0.36
যাঁরা
0.35
пыта
0.35
ktorí
0.34
прио
0.34
cuya
0.34
Activations Density 0.059%