INDEX
Explanations
instances of the word "pri."
New Auto-Interp
Negative Logits
Theſe
-0.92
LXXX
-0.85
Efq
-0.82
itſelf
-0.80
myſelf
-0.77
ſtate
-0.77
iſt
-0.76
Majefty
-0.73
**/
-0.73
purpoſe
-0.71
POSITIVE LOGITS
при
3.68
При
2.93
При
2.79
при
2.59
przy
2.52
ПРИ
2.38
Przy
1.89
při
1.82
ПРИ
1.79
przy
1.79
Activations Density 0.047%