INDEX
Negative Logits
al
0.59
alim
0.47
ndị
0.45
듑
0.44
ర్థిక
0.44
watu
0.43
ahli
0.42
მდეგ
0.42
,
0.42
ambarkan
0.41
POSITIVE LOGITS
NE
0.57
ك
0.54
沱
0.52
Año
0.50
वल
0.50
terrestre
0.49
اسة
0.48
み
0.47
that
0.47
ès
0.47
Activations Density 0.005%
al
alim
ndị
듑
ర్థిక
watu
ahli
მდეგ
,
ambarkan
NE
ك
沱
Año
वल
terrestre
اسة
み
that
ès