INDEX
Explanations
indefinite pronouns followed by qualifiers
New Auto-Interp
Negative Logits
important
0.55
importantes
0.53
或者
0.52
அல்லது
0.52
অথবা
0.52
waż
0.50
önemli
0.50
importanti
0.50
或者
0.49
or
0.49
POSITIVE LOGITS
ที่จะ
0.54
עם
0.46
avec
0.44
iteratively
0.43
avec
0.42
with
0.41
yattha
0.41
ที่มี
0.40
oczes
0.40
với
0.39
Activations Density 0.025%