INDEX
Negative Logits
oars
0.54
pears
0.51
aturan
0.51
beragam
0.50
Lieblings
0.49
thok
0.48
berbahaya
0.48
vudd
0.47
bequem
0.47
italiano
0.47
POSITIVE LOGITS
ression
0.57
test
0.54
投資
0.48
諜
0.46
formation
0.46
CPU
0.46
え
0.46
test
0.45
予防
0.45
identité
0.45
Activations Density 0.000%