INDEX
Negative Logits
favoritos
-0.09
票
-0.08
favorite
-0.08
favoritas
-0.08
浅
-0.08
粉
-0.07
graf
-0.07
insulation
-0.07
ator
-0.07
wildfire
-0.07
POSITIVE LOGITS
بلد
0.08
tingen
0.08
January
0.08
ทง
0.08
))))↵↵
0.08
भो
0.08
apartheid
0.08
Pand
0.07
ENV
0.07
Observable
0.07
Activations Density 0.001%