INDEX
Negative Logits
тем
-0.07
coder
-0.07
апр
-0.07
эн
-0.07
достижения
-0.07
ാവ്
-0.07
связ
-0.07
ngày
-0.07
affront
-0.07
keď
-0.07
POSITIVE LOGITS
conds
0.09
bp
0.08
Titan
0.08
dart
0.07
诱
0.07
tali
0.07
Andy
0.07
pic
0.07
け
0.07
乾
0.07
Activations Density 0.658%