INDEX
Negative Logits
^(@)
-1.08
étoit
-0.94
tartalomajánló
-0.94
fubject
-0.91
auroit
-0.91
myſelf
-0.87
drawal
-0.86
pouvoit
-0.86
feroit
-0.84
purpoſe
-0.84
POSITIVE LOGITS
â
0.62
ó
0.58
’
0.55
ka
0.54
Ã
0.53
&
0.52
og
0.51
lu
0.51
ca
0.51
bal
0.50
Activations Density 0.013%