INDEX
Explanations
temporal expressions related to duration or time intervals
New Auto-Interp
Negative Logits
المراجع
-0.80
GEBURTSDATUM
-0.80
TintMode
-0.77
awtextra
-0.76
متعلقه
-0.74
twimg
-0.72
المناصب
-0.71
للمعارف
-0.71
مراجع
-0.70
ligiloj
-0.70
POSITIVE LOGITS
snabbt
0.62
snel
0.56
rapida
0.53
slow
0.52
rapido
0.52
løpet
0.52
grà
0.51
rápida
0.51
rapid
0.50
rapides
0.50
Activations Density 0.182%