INDEX
Explanations
high frequency of the word "the"
New Auto-Interp
Negative Logits
purpoſe
-0.57
szóci
-0.52
fubject
-0.50
RectangleBorder
-0.49
thereon
-0.49
dafs
-0.48
RSSSF
-0.48
raiſ
-0.48
tranſ
-0.48
ので
-0.47
POSITIVE LOGITS
'{@0.79
upakan
0.71
rethe
0.71
merupakan
0.70
rawDesc
0.68
THE
0.67
édrale
0.63
人是
0.62
才是
0.62
是最
0.62
Activations Density 0.210%