INDEX
Negative Logits
pons
-0.09
sọ
-0.09
żyt
-0.08
érations
-0.08
住宿
-0.08
乘
-0.08
提出
-0.08
ровод
-0.08
respons
-0.08
堂
-0.08
POSITIVE LOGITS
stup
0.08
ల
0.08
add
0.07
మ
0.07
తో
0.07
మ
0.07
Need
0.07
confirmed
0.07
followed
0.07
ౌ
0.07
Activations Density 0.001%