Một số regex cơ bản thường dùng trong việc lên chiến dịch

Trong tạo chiến dịch leech auto một website nào đó thì việc sử dụng regex rất thường xuyên để có một bài viết sau khi hoàn thiện đảm bảo thẩm mỹ, tính nội dung .

Sau đây mình xin chia sẻ một số regex thường dùng trong tab Giao diện bài viết , các bạn có thể bổ sung thêm :

1/Căn giữa hình ảnh :

/<img(.+?)>/i

thay thế: 

<p align=”center”><img$1></p>

2/Xóa bỏ giữ lại nội dung của div class bài viết gốc:

<div(.+?)>|</div>

Cách này có thể áp dụng cho nhiều trường hợp khác nhau ví dụ span, noscript , p class

Ví dụ :

<span(.+?)>|</span>

Nếu muốn loại bỏ nội dung chứa trong class đó thì bạn chỉ cần bỏ dấu | trong đoạn regex.

Ví dụ : Trong nội dung bài viết leech về có đoạn:

<noscript> Nội dung A </noscript>

Loại bỏ Nội dung A ra khỏi giao diện bài viết thì chỉ cần viết:

<noscript(.+?)>|</noscript> hoặc <noscript>|</noscript>

3. Lấy nội dung đứng trước hoặc sau một ký tự nào đó :

Ví dụ ta có đoạn nội dung sau :

Chương 1 – Tiêu đề chương 1

Bạn chỉ muốn lấy ” Chương 1 ” thì viết như sau :

^(.+?)-(.+?)$

Thay thế :

$1

$1 là đoạn nội dung trước dấu – và $2 là nội dung sau dấu -, nếu chỉ lấy Tiêu đề chương 1 thì :

^(.+?)-(.+?)$

Thay thế :

$2

4.Chuyển đổi chữ hoa thành chữ thường và in hoa chữ cái đầu tiên:

Tìm kiếm:

^(.+?)$

Thay thế :

function($data) {
	$text 		= mb_strtolower($data[1]);
	$strlen 	= mb_strlen($text, 'UTF-8');
	$firstChar 	= mb_substr($text, 0, 1, 'UTF-8');
	$then 		= mb_substr($text, 1, $strlen - 1, 'UTF-8');
	$text 		= mb_strtoupper($firstChar, 'UTF-8') . $then;
	return $text;
} Tích vào thêm ô callback.

Còn thêm rất nhiều regex hay mình sẽ bổ sung dần trong các lần cập nhật bài viết sắp đến, nếu bạn có thắc mắc hoặc cần chia sẻ thêm vui lòng để lại bình luận, xin cảm ơn.

Nguồn: Cacmeohay