INDEX
Negative Logits
변수
-0.09
xét
-0.08
/right
-0.08
enzymes
-0.08
justify
-0.08
فائد
-0.08
믿
-0.08
/she
-0.08
namely
-0.07
/theme
-0.07
POSITIVE LOGITS
walls
0.08
LLLL
0.08
P
0.08
castles
0.07
towering
0.07
castle
0.07
spontaneously
0.07
出来
0.07
gay
0.07
Reino
0.07
Activations Density 0.004%