INDEX
Explanations
verbs followed by á, ía, é, or ían
New Auto-Interp
Negative Logits
করছিলাম
0.42
هستیم
0.41
ছিলাম
0.38
شدم
0.38
بودم
0.37
গিয়েছিলাম
0.37
করতাম
0.37
nisam
0.36
করিনি
0.36
করলাম
0.35
POSITIVE LOGITS
ía
0.27
ます
0.26
ουν
0.26
मजबूत
0.26
una
0.25
é
0.24
ent
0.23
શે
0.23
ै
0.23
ó
0.23
Activations Density 0.047%