INDEX
Explanations
noun followed by descriptive phrase
New Auto-Interp
Negative Logits
जरिये
0.37
দান
0.36
тность
0.33
publicado
0.32
Wyman
0.32
itability
0.32
kautta
0.31
dni
0.31
issati
0.31
ಿವ
0.31
POSITIVE LOGITS
ที่มี
1.02
containing
0.93
whose
0.86
עם
0.82
lacking
0.80
with
0.77
ທີ່ມີ
0.74
possessing
0.73
Containing
0.69
avec
0.68
Activations Density 0.036%