INDEX
Negative Logits
ﻘ
-0.07
عتبر
-0.07
כנע
-0.07
일부
-0.07
quizá
-0.07
çerçeve
-0.07
也要
-0.06
במסגרת
-0.06
.coll
-0.06
副主任
-0.06
POSITIVE LOGITS
ሻ
0.07
iciency
0.07
rises
0.07
states
0.07
统
0.07
把你
0.07
迪
0.07
ouples
0.07
separates
0.06
geben
0.06
Activations Density 0.016%