INDEX
Explanations
startup hubs, innovation hubs, new information
New Auto-Interp
Negative Logits
تعلم
0.48
Beginning
0.47
фаразы
0.46
原文
0.44
мә
0.43
гульнявыя
0.43
ҡ
0.42
आपल्याला
0.42
середине
0.42
фараз
0.40
POSITIVE LOGITS
enthous
1.26
Mijn
1.09
voor
1.04
onder
1.03
Nederlandse
1.02
transpar
1.01
informatie
1.00
zijn
0.97
bij
0.96
nieuwe
0.96
Activations Density 0.023%