INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    א
    0.59
    מ
    0.54
    ד
    0.52
    சர
    0.50
    ש
    0.50
    יש
    0.49
    我们将
    0.47
    0.47
    ה
    0.47
    también
    0.47
    POSITIVE LOGITS
     کھیلوں
    0.46
     Localization
    0.46
     Hammer
    0.45
     lekk
    0.45
     hammer
    0.43
     Hammers
    0.43
     Guinea
    0.43
     hammers
    0.43
     Deportes
    0.43
     Mediator
    0.43
    Act Density 0.001%

    No Known Activations