Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?-tutorial js-php.cn

Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?

Susan Sarandon

Lepaskan： 2024-12-18 01:59:09

asal

971 orang telah melayarinya

Masalah Tiada Siapa Bicarakan

Mari menjadi nyata: pengesahan e-mel kedengaran mudah, tetapi ia adalah perangkap teknikal yang menangkap walaupun pembangun berpengalaman.

Apa yang Sebenarnya Berlaku?

Bayangkan anda sedang membina borang pendaftaran. Naluri pertama anda? Lemparkan regex pada medan e-mel. Tindakan buruk.

E-mel Pelik Sah Sebenar

# These are ALL technically valid emails!
valid_emails = [
    '"J. R. \"Bob\" Dobbs"@example.com',
    'admin@mailserver1',
    'user+tag@gmail.com',
    'postmaster@[123.123.123.123]'
]

Salin selepas log masuk

Kebanyakan enjin regex akan tercekik ini.

Kenapa?

Standard e-mel adalah liar.

Kebanyakan pembangun akan terkejut apabila mengetahui bahawa ia sebenarnya adalah alamat e-mel yang sah secara teknikal mengikut RFC 5322. Spesifikasinya membenarkan:

Bahagian tempatan yang dipetik
Ulasan dalam kurungan
Komen bersarang
Watak istimewa di bahagian tempatan
Berbilang label domain

Kos Tersembunyi Pengesahan Buruk

1. Kehilangan Pengguna Sebenar

Reex yang ketat mungkin menolak alamat e-mel yang sangat bagus. Bayangkan menolak bakal pelanggan kerana e-mel mereka kelihatan "pelik", seperti mempunyai:

Tambahan pengalamatan (tag pengguna@gmail.com)
Struktur domain bukan konvensional
Set watak antarabangsa
Konvensyen penamaan yang sah tetapi kompleks

Pasukan produk anda pasti tidak berpuas hati, lebih-lebih lagi; jualan akan benar-benar marah.

2. Serangan ReDoS

Enjin Regex yang menggunakan pengesanan belakang terdedah kepada serangan Penafian Perkhidmatan Regex (ReDoS).

def dangerous_regex_check(user_input):
    # This regex can destroy your server's performance
    evil_pattern = r'^(a+)+b$'
    return re.match(evil_pattern, user_input)

# Just 30 characters can crash your system
malicious_input = 'a' * 30 + 'b'

Salin selepas log masuk

Penyerang boleh membuat input yang membuat fungsi pengesahan anda terhenti.

Pendekatan Lebih Bijak

Pengesahan Asas Yang Sebenarnya Berfungsi

def smart_email_check(email):
    """Quick and dirty email sanity check"""
    return (
        email and 
        '@' in email and 
        '.' in email.split('@')[1] and
        len(email) <= 254  # Email length limit
    )

Salin selepas log masuk

Penyelesaian Sebenar: Pengesahan

Semakan sintaks asas
Hantar pautan pengesahan
Biarkan pengguna membuktikan e-mel berfungsi

def validate_email(email):
    if not basic_email_check(email):
        return False

    # Send verification token
    token = generate_unique_token()
    send_verification_email(email, token)

    return True

Salin selepas log masuk

Alat Pro untuk Pembangun Sebenar

Daripada menulis regex anda sendiri, gunakan perpustakaan yang diuji:

Python: pengesah e-mel
JavaScript: validator.js
Java: Pengesah Apache Commons

Kelas Pengesahan yang Lebih Baik

class EmailValidator:
    @staticmethod
    def validate(email):
        """
        Smart email validation
        - Quick syntax check
        - Verify deliverability
        """
        try:
            # Use a smart library
            validate_email(
                email, 
                check_deliverability=True
            )
            return True
        except EmailInvalidError:
            return False

Salin selepas log masuk

Garis Bawah

Pengesahan e-mel bukan tentang mencipta kubu yang tidak boleh dipecahkan. Ia mengenai:

Membenarkan pengguna sebenar masuk
Memastikan sistem anda selamat
Tidak membuat perkara menjadi rumit

Pengambilan Utama

Lupakan regex kompleks
Gunakan perpustakaan yang terbukti
Hantar e-mel pengesahan
Jadilah mesra pengguna

Pembangun yang mendapat hak ini menyelamatkan diri mereka daripada sakit kepala yang tidak terkira banyaknya.

Mahu saya pecahkan lagi bahagian ini?

Btw, saya sedang mengusahakan alat konteks tanpa had, di mana anda boleh menggunakan LLM pilihan anda tanpa perlu memberikan konteks lagi dan lagi.

Sila lihat ini, ia percuma sepenuhnya untuk pembangun.

Why experienced developers never use regex for email validation?

Atas ialah kandungan terperinci Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!