INDEX
Explanations
numerical data and dates
New Auto-Interp
Negative Logits
rir
-0.15
Garrett
-0.14
οκ
-0.14
upal
-0.14
rut
-0.14
awy
-0.14
atel
-0.13
æķħ
-0.13
alley
-0.13
ookie
-0.13
POSITIVE LOGITS
god
0.27
g
0.24
года
0.23
годÑĥ
0.23
God
0.21
-го
0.21
god
0.21
IFICATION
0.19
th
0.19
ioni
0.18
Activations Density 0.016%