INDEX
Explanations
percentages and proportions
New Auto-Interp
Negative Logits
различные
0.42
acariy
0.39
促进
0.39
حدیث
0.39
różne
0.39
语音
0.38
ardı
0.38
关于
0.38
่วม
0.38
animación
0.38
POSITIVE LOGITS
total
0.59
全体の
0.58
total
0.56
மொத்த
0.55
%
0.54
процентов
0.53
overall
0.52
totale
0.52
占比
0.52
占
0.51
Activations Density 0.077%