INDEX
    Explanations

    slang and informal greetings

    New Auto-Interp
    Negative Logits
     গ্রন্থের
    0.31
     பெரும்பாலும்
    0.29
     ausschließlich
    0.29
     परिणामस्वरूप
    0.29
     일반적으로
    0.28
    に基づく
    0.28
     relied
    0.27
     Approximate
    0.27
     iteratively
    0.27
     সম্ভাব্য
    0.27
    POSITIVE LOGITS
     outta
    0.43
     yeah
    0.40
     cuz
    0.38
    0.38
    🤙
    0.38
     😘
    0.37
    yeah
    0.35
    😘
    0.34
     jangan
    0.34
     gonna
    0.34
    Act Density 0.265%

    No Known Activations