INDEX
Negative Logits
articulate
-0.08
.warning
-0.08
.move
-0.07
.house
-0.07
sudoku
-0.07
ducks
-0.07
.medium
-0.07
Muk
-0.07
싱
-0.07
egentlig
-0.07
POSITIVE LOGITS
الص
0.08
ARN
0.08
नभ
0.08
-Ass
0.08
દરમ
0.08
èmes
0.08
વિશ
0.07
નહિ
0.07
énorme
0.07
θε
0.07
Activations Density 0.001%