INDEX
Explanations
nein, nehme, neun, neuter, Nen
New Auto-Interp
Negative Logits
1.36
s
1.27
'।
1.23
ุ
1.21
_
1.20
'
1.15
"।
1.14
।
1.08
።
1.08
。
1.05
POSITIVE LOGITS
م
1.67
é
1.41
н
1.38
ন
1.37
ल
1.35
一
1.34
ن
1.31
л
1.29
м
1.28
ল
1.25
Activations Density 0.000%