Regular Expression - Python3

Bạn có lẽ đã quen với việc tìm kiếm văn bản bằng cách nhấn Ctrl + F gõ vào đó những từ mà bạn muốn tìm. Regular Expressions nâng thêm một tầm mới: Nó cho phép bạn chỉ định một mẫu của văn bản muốn tìm. Bạn có thể không biết chính xác số điện thoại của công ty, nhưng nếu bạn sống ở Mỹ hoặc Canada, bạn biết nó có ba chữ số theo sau là dấu gạch nối, ba chữ số tiếp theo, gạch nối và cuối cùng là bốn chữ số. Đó là cách bạn, giống như con người nhận biết số điện thoại khi bạn nhìn thấy: 445-555-1234 là số điện thoại, 4,551,155,1234 thì không.
Regular Expressions (RE) là hữu ích, nhưng không nhiều người không phải lập trình viên biết về mặc dù là những người soạn thảo hiện đại và người xử lý văn bản, như là Microsoft Office và Open Office có chức năng "find và find-and-replace" mà có thể tìm kiếm dựa trên RE. RE tiết kiệm nhiều thời gian không chỉ cho những người dùng phần mềm mà ngay cả cho lập trình viên. Trong thực tế, chuyên gia công nghệ Cory Doctorow lập luận rằng thậm chí trước khi giảng dạy chương trình, chúng ta nên dạy RE:
"Biết về RE có thể là sự khác nhau giữa việc giải quyết vấn đề trong 3 bước và việc giải quyết nó trong 3000 bước. Khi bạn là một con mọt sách, bạn quên rằng vấn đề mà bạn giải quyết với một vài cái nhấn phím có thể lấy đi của người khác cả ngày tẻ nhạt, tháo gỡ vật lộn để vượt qua."
 Trong chương này, bạn sẽ bắt đầu bằng việc viết chương trình tìm các kiếm mẫu văn bản mà không sử dụng RE và sau đó xem làm thế nào đề sử dụng để viết lệnh ít cồng kềnh hơn rất nhiều. Tôi sẽ cho bạn thấy việc đối khớp cơ bạn với RE sau đó chuyển sang một vài chức năng mạnh hơn, như là thay thế và tạo ra ký tự của riêng bạn. Cuối cùng, tại phần cuối của chương này, bạn sẽ viết chương trình mà có thể trích xuất một cách tự động số điện thoại và địa chỉ email từ một khối văn bản.

Comments

Popular Posts