INDEX
Negative Logits
vic
-0.08
pọ
-0.08
assist
-0.07
/course
-0.07
ock
-0.07
_plot
-0.07
'/
-0.07
ellite
-0.07
dok
-0.07
and
-0.07
POSITIVE LOGITS
inats
0.09
berbeda
0.09
ใช
0.08
متفاوت
0.08
албай
0.08
ختلف
0.08
отличается
0.08
совсем
0.08
有所
0.08
отличаются
0.08
Activations Density 0.082%