INDEX
Negative Logits
Gren
-0.09
工作
-0.08
ころ
-0.08
Tut
-0.07
メント
-0.07
,使
-0.07
chim
-0.07
sno
-0.07
giz
-0.07
.AL
-0.07
POSITIVE LOGITS
adanya
0.08
Diffuse
0.08
Train
0.08
Hunts
0.08
thriving
0.08
Train
0.07
Lent
0.07
anf
0.07
milk
0.07
Berry
0.07
Activations Density 0.040%