INDEX
Explanations
is followed by a definition
New Auto-Interp
Negative Logits
によっては
0.61
Didn
0.58
Didn
0.44
Neither
0.44
もない
0.43
beros
0.41
በፊት
0.40
してた
0.39
দেয়নি
0.39
Gibt
0.39
POSITIVE LOGITS
是最
1.66
является
1.47
才是
1.30
merupakan
1.29
είναι
1.28
являются
1.24
adalah
1.13
是我
1.13
is
1.13
是我们
1.10
Activations Density 0.100%