INDEX
Negative Logits
TestBed
-0.57
hésite
-0.50
şört
-0.49
lámpara
-0.49
wholesome
-0.48
redenen
-0.46
csolódó
-0.46
KIL
-0.45
Secrétaire
-0.45
riwal
-0.45
POSITIVE LOGITS
://
1.49
://"
0.93
:\/\/
0.73
:///
0.69
://$
0.50
/**
0.46
<tr>
0.45
argout
0.44
gebob
0.44
клопе
0.44
Activations Density 0.129%