INDEX
Negative Logits
vlastní
-0.08
refs
-0.08
키
-0.07
самостоятельно
-0.07
앱
-0.07
ссылки
-0.07
слаб
-0.07
дыр
-0.07
слов
-0.07
drain
-0.07
POSITIVE LOGITS
首次
0.10
第一次
0.09
primeira
0.09
establishing
0.08
Appear
0.08
建立
0.08
establecer
0.08
搭
0.08
第一
0.08
込み
0.08
Activations Density 0.028%