INDEX
Negative Logits
ont
-0.08
сеп
-0.07
assertion
-0.07
Edward
-0.07
筛
-0.07
കൊ
-0.07
hun
-0.07
undec
-0.07
arpa
-0.06
उप
-0.06
POSITIVE LOGITS
.tiles
0.10
_tiles
0.09
trampoline
0.09
sijait
0.09
bonuses
0.09
territorio
0.09
tiles
0.09
級
0.09
tiles
0.09
Tiles
0.09
Activations Density 0.010%