Mari menjadi nyata: pengesahan e-mel kedengaran mudah, tetapi ia adalah perangkap teknikal yang menangkap walaupun pembangun berpengalaman.
Bayangkan anda sedang membina borang pendaftaran. Naluri pertama anda? Lemparkan regex pada medan e-mel. Tindakan buruk.
# These are ALL technically valid emails! valid_emails = [ '"J. R. \"Bob\" Dobbs"@example.com', 'admin@mailserver1', 'user+tag@gmail.com', 'postmaster@[123.123.123.123]' ]
Kebanyakan enjin regex akan tercekik ini.
Kenapa?
Standard e-mel adalah liar.
Kebanyakan pembangun akan terkejut apabila mengetahui bahawa ia sebenarnya adalah alamat e-mel yang sah secara teknikal mengikut RFC 5322. Spesifikasinya membenarkan:
Reex yang ketat mungkin menolak alamat e-mel yang sangat bagus. Bayangkan menolak bakal pelanggan kerana e-mel mereka kelihatan "pelik", seperti mempunyai:
Pasukan produk anda pasti tidak berpuas hati, lebih-lebih lagi; jualan akan benar-benar marah.
Enjin Regex yang menggunakan pengesanan belakang terdedah kepada serangan Penafian Perkhidmatan Regex (ReDoS).
def dangerous_regex_check(user_input): # This regex can destroy your server's performance evil_pattern = r'^(a+)+b$' return re.match(evil_pattern, user_input) # Just 30 characters can crash your system malicious_input = 'a' * 30 + 'b'
Penyerang boleh membuat input yang membuat fungsi pengesahan anda terhenti.
def smart_email_check(email): """Quick and dirty email sanity check""" return ( email and '@' in email and '.' in email.split('@')[1] and len(email) <= 254 # Email length limit )
def validate_email(email): if not basic_email_check(email): return False # Send verification token token = generate_unique_token() send_verification_email(email, token) return True
Daripada menulis regex anda sendiri, gunakan perpustakaan yang diuji:
class EmailValidator: @staticmethod def validate(email): """ Smart email validation - Quick syntax check - Verify deliverability """ try: # Use a smart library validate_email( email, check_deliverability=True ) return True except EmailInvalidError: return False
Pengesahan e-mel bukan tentang mencipta kubu yang tidak boleh dipecahkan. Ia mengenai:
Pembangun yang mendapat hak ini menyelamatkan diri mereka daripada sakit kepala yang tidak terkira banyaknya.
Mahu saya pecahkan lagi bahagian ini?
Btw, saya sedang mengusahakan alat konteks tanpa had, di mana anda boleh menggunakan LLM pilihan anda tanpa perlu memberikan konteks lagi dan lagi.
Sila lihat ini, ia percuma sepenuhnya untuk pembangun.
Atas ialah kandungan terperinci Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!