INDEX
Negative Logits
inatt
-0.08
ник
-0.08
удостовер
-0.08
是不是
-0.08
그래
-0.08
什么
-0.08
mogelijk
-0.07
谁
-0.07
صد
-0.07
时间
-0.07
POSITIVE LOGITS
お願
0.11
してください
0.11
しております
0.10
ございました
0.10
ください
0.09
お願い
0.09
下さい
0.09
Jefferson
0.09
겠습니다
0.08
ござ
0.08
Activations Density 0.004%