Rumah > hujung hadapan web > tutorial js > Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?

Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?

Susan Sarandon
Lepaskan: 2024-12-18 01:59:09
asal
971 orang telah melayarinya

Masalah Tiada Siapa Bicarakan

Mari menjadi nyata: pengesahan e-mel kedengaran mudah, tetapi ia adalah perangkap teknikal yang menangkap walaupun pembangun berpengalaman.

Apa yang Sebenarnya Berlaku?

Bayangkan anda sedang membina borang pendaftaran. Naluri pertama anda? Lemparkan regex pada medan e-mel. Tindakan buruk.

E-mel Pelik Sah Sebenar

# These are ALL technically valid emails!
valid_emails = [
    '"J. R. \"Bob\" Dobbs"@example.com',
    'admin@mailserver1',
    'user+tag@gmail.com',
    'postmaster@[123.123.123.123]'
]
Salin selepas log masuk

Kebanyakan enjin regex akan tercekik ini.

Kenapa?

Standard e-mel adalah liar.

Kebanyakan pembangun akan terkejut apabila mengetahui bahawa ia sebenarnya adalah alamat e-mel yang sah secara teknikal mengikut RFC 5322. Spesifikasinya membenarkan:

  • Bahagian tempatan yang dipetik
  • Ulasan dalam kurungan
  • Komen bersarang
  • Watak istimewa di bahagian tempatan
  • Berbilang label domain

Kos Tersembunyi Pengesahan Buruk

1. Kehilangan Pengguna Sebenar

Reex yang ketat mungkin menolak alamat e-mel yang sangat bagus. Bayangkan menolak bakal pelanggan kerana e-mel mereka kelihatan "pelik", seperti mempunyai:

  • Tambahan pengalamatan (tag pengguna@gmail.com)
  • Struktur domain bukan konvensional
  • Set watak antarabangsa
  • Konvensyen penamaan yang sah tetapi kompleks

Pasukan produk anda pasti tidak berpuas hati, lebih-lebih lagi; jualan akan benar-benar marah.

2. Serangan ReDoS

Enjin Regex yang menggunakan pengesanan belakang terdedah kepada serangan Penafian Perkhidmatan Regex (ReDoS).

def dangerous_regex_check(user_input):
    # This regex can destroy your server's performance
    evil_pattern = r'^(a+)+b$'
    return re.match(evil_pattern, user_input)

# Just 30 characters can crash your system
malicious_input = 'a' * 30 + 'b'
Salin selepas log masuk

Penyerang boleh membuat input yang membuat fungsi pengesahan anda terhenti.

Pendekatan Lebih Bijak

Pengesahan Asas Yang Sebenarnya Berfungsi

def smart_email_check(email):
    """Quick and dirty email sanity check"""
    return (
        email and 
        '@' in email and 
        '.' in email.split('@')[1] and
        len(email) <= 254  # Email length limit
    )
Salin selepas log masuk

Penyelesaian Sebenar: Pengesahan

  1. Semakan sintaks asas
  2. Hantar pautan pengesahan
  3. Biarkan pengguna membuktikan e-mel berfungsi
def validate_email(email):
    if not basic_email_check(email):
        return False

    # Send verification token
    token = generate_unique_token()
    send_verification_email(email, token)

    return True
Salin selepas log masuk

Alat Pro untuk Pembangun Sebenar

Daripada menulis regex anda sendiri, gunakan perpustakaan yang diuji:

  • Python: pengesah e-mel
  • JavaScript: validator.js
  • Java: Pengesah Apache Commons

Kelas Pengesahan yang Lebih Baik

class EmailValidator:
    @staticmethod
    def validate(email):
        """
        Smart email validation
        - Quick syntax check
        - Verify deliverability
        """
        try:
            # Use a smart library
            validate_email(
                email, 
                check_deliverability=True
            )
            return True
        except EmailInvalidError:
            return False
Salin selepas log masuk

Garis Bawah

Pengesahan e-mel bukan tentang mencipta kubu yang tidak boleh dipecahkan. Ia mengenai:

  • Membenarkan pengguna sebenar masuk
  • Memastikan sistem anda selamat
  • Tidak membuat perkara menjadi rumit

Pengambilan Utama

  1. Lupakan regex kompleks
  2. Gunakan perpustakaan yang terbukti
  3. Hantar e-mel pengesahan
  4. Jadilah mesra pengguna

Pembangun yang mendapat hak ini menyelamatkan diri mereka daripada sakit kepala yang tidak terkira banyaknya.

Mahu saya pecahkan lagi bahagian ini?

Btw, saya sedang mengusahakan alat konteks tanpa had, di mana anda boleh menggunakan LLM pilihan anda tanpa perlu memberikan konteks lagi dan lagi.

Sila lihat ini, ia percuma sepenuhnya untuk pembangun.


Why experienced developers never use regex for email validation?

Atas ialah kandungan terperinci Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan