Mọi trang web đều dựa vào Google ở một mức độ nào đó. Thật đơn giản: các trang của bạn được Google lập chỉ mục, điều này giúp mọi người có thể tìm thấy bạn. Đó là cách mọi thứ nên đi.
Tuy nhiên, không phải lúc nào cũng vậy. Nhiều trang không bao giờ được Google lập chỉ mục .
Nếu bạn làm việc với một trang web, đặc biệt là một trang web lớn, bạn có thể nhận thấy rằng không phải mọi trang trên trang web của bạn đều được lập chỉ mục và nhiều trang phải đợi hàng tuần trước khi Google chọn chúng.
Nhiều yếu tố khác nhau góp phần vào vấn đề này, và nhiều yếu tố trong số đó là những yếu tố tương tự được đề cập đến liên quan đến xếp hạng - chất lượng nội dung và liên kết là hai ví dụ. Đôi khi, những yếu tố này cũng rất phức tạp và kỹ thuật. Các trang web hiện đại phụ thuộc nhiều vào công nghệ web mới đã nổi tiếng gặp phải các vấn đề về lập chỉ mục trong quá khứ và một số trang web vẫn còn.
Nhiều người làm SEO vẫn tin rằng chính những thứ kỹ thuật đã ngăn Google lập chỉ mục nội dung, nhưng đây là một điều hoang đường. Mặc dù đúng là Google có thể không lập chỉ mục các trang của bạn nếu bạn không gửi các tín hiệu kỹ thuật nhất quán về những trang bạn muốn lập chỉ mục hoặc nếu bạn không có đủ ngân sách thu thập thông tin, điều quan trọng là bạn phải nhất quán với chất lượng nội dung của mình.
Hầu hết các trang web, dù lớn hay nhỏ, đều có rất nhiều nội dung cần được lập chỉ mục - nhưng không phải vậy. Và trong khi những thứ như JavaScript làm cho việc lập chỉ mục trở nên phức tạp hơn, trang web của bạn có thể gặp phải các vấn đề nghiêm trọng về lập chỉ mục ngay cả khi nó được viết bằng HTML thuần túy. Trong bài đăng này, Yo Ohw sẽ hướng dẫn bạn giải quyết một số vấn đề phổ biến nhất và cách giảm thiểu chúng.
Lý do tại sao Google không lập chỉ mục các trang của bạn
Sử dụng công cụ kiểm tra lập chỉ mục tùy chỉnh , tôi đã kiểm tra một lượng lớn các cửa hàng thương mại điện tử phổ biến nhất ở Hoa Kỳ để tìm các vấn đề về lập chỉ mục. Tôi phát hiện ra rằng trung bình không thể tìm thấy 15% trang sản phẩm có thể lập chỉ mục của họ trên Google.
Kết quả đó vô cùng bất ngờ. Điều tôi cần biết tiếp theo là “tại sao”: đâu là lý do phổ biến nhất khiến Google quyết định không lập chỉ mục một thứ cần được lập chỉ mục về mặt kỹ thuật?
Google Search Console báo cáo một số trạng thái cho các trang chưa được lập chỉ mục, chẳng hạn như “Đã thu thập thông tin - hiện chưa được lập chỉ mục” hoặc “Đã phát hiện - hiện chưa được lập chỉ mục”. Mặc dù thông tin này không giúp giải quyết vấn đề một cách rõ ràng nhưng đây là một nơi tốt để bắt đầu chẩn đoán.
Các vấn đề về lập chỉ mục hàng đầu
Dựa trên một lượng lớn các trang web mà chúng tôi đã thu thập , các vấn đề lập chỉ mục phổ biến nhất được Google Search Console báo cáo là:
“Đã thu thập thông tin - hiện chưa được lập chỉ mục”
Trong trường hợp này, Google đã truy cập một trang nhưng không lập chỉ mục trang đó.
Theo kinh nghiệm của tôi, đây thường là vấn đề chất lượng nội dung. Với sự bùng nổ thương mại điện tử hiện đang diễn ra , chúng ta có thể mong đợi Google sẽ trở nên kén chọn hơn khi nói đến chất lượng. Vì vậy, nếu bạn nhận thấy các trang của mình “Đã được thu thập thông tin - hiện chưa được lập chỉ mục”, hãy đảm bảo nội dung trên các trang đó có giá trị duy nhất:
- Sử dụng tiêu đề, mô tả độc đáo và sao chép trên tất cả các trang có thể lập chỉ mục.
- Tránh sao chép mô tả sản phẩm từ các nguồn bên ngoài.
- Sử dụng thẻ chuẩn để hợp nhất nội dung trùng lặp.
- Chặn Google thu thập dữ liệu hoặc lập chỉ mục các phần chất lượng thấp trên trang web của bạn bằng cách sử dụng tệp robots.txt hoặc thẻ noindex.
Nếu bạn quan tâm đến chủ đề này, tôi khuyên bạn nên đọc Đã thu thập thông tin của Chris Long - Hiện chưa được lập chỉ mục: Hướng dẫn về trạng thái phù hợp
“Đã khám phá - hiện chưa được lập chỉ mục”
Đây là vấn đề yêu thích của tôi khi làm việc, vì nó có thể bao gồm mọi thứ, từ vấn đề thu thập dữ liệu đến chất lượng nội dung không đủ. Đó là một vấn đề lớn, đặc biệt là trong trường hợp của các cửa hàng thương mại điện tử lớn và tôi đã thấy điều này áp dụng cho hàng chục triệu URL trên một trang web.
Google có thể báo cáo rằng các trang sản phẩm thương mại điện tử là "Đã khám phá - hiện chưa được lập chỉ mục" vì:
- Vấn đề về ngân sách thu thập thông tin : có thể có quá nhiều URL trong hàng đợi thu thập thông tin và những URL này có thể được thu thập thông tin và lập chỉ mục sau đó.
- Vấn đề về chất lượng : Google có thể nghĩ rằng một số trang trên tên miền đó không đáng để thu thập thông tin và quyết định không truy cập chúng bằng cách tìm kiếm một mẫu trong URL của chúng.
Đối phó với vấn đề này cần một số chuyên môn. Nếu bạn phát hiện ra rằng các trang của mình là "Đã khám phá - hiện chưa được lập chỉ mục", hãy làm như sau:
- Xác định xem có những mẫu trang nào thuộc danh mục này không. Có thể vấn đề liên quan đến một danh mục sản phẩm cụ thể và toàn bộ danh mục không được liên kết nội bộ? Hoặc có thể một phần lớn các trang sản phẩm đang đợi trong hàng đợi để được lập chỉ mục?
- Tối ưu hóa ngân sách thu thập thông tin của bạn. Tập trung vào việc phát hiện các trang chất lượng thấp mà Google dành nhiều thời gian để thu thập thông tin. Các nghi ngờ thông thường bao gồm các trang danh mục được lọc và các trang tìm kiếm nội bộ - những trang này có thể dễ dàng có hàng chục triệu trên một trang thương mại điện tử điển hình. Nếu Googlebot có thể tự do thu thập dữ liệu chúng, nó có thể không có tài nguyên để truy cập những nội dung có giá trị trên trang web của bạn được lập chỉ mục trong Google.
Trong hội thảo trên web "Hiển thị SEO" , Martin Splitt của Google đã đưa ra cho chúng tôi một số gợi ý về cách khắc phục sự cố không được lập chỉ mục của Discover. Kiểm tra nó nếu bạn muốn tìm hiểu thêm.
Luôn phù hợp với ngành của bạn
Tại thời điểm này, bạn phải hiểu rằng nghiên cứu là quan trọng trước khi khởi động bất kỳ chiến dịch nào. Bạn cần phải tìm hiểu kỹ về ngành của mình, đối thủ cạnh tranh và các phương pháp tiếp thị mới nhất trong phân khúc.
Cơ quan thực hiện các hoạt động tiếp thị phù hợp với ngành của bạn là các đối tác tiếp thị kỹ thuật số. Họ có nhiệm vụ nghiên cứu thị trường và xác định sự cạnh tranh của bạn. Thêm vào đó, họ theo dõi những phát triển mới nhất trong tiếp thị kỹ thuật số để đảm bảo kết quả có thể định lượng được.
Họ cũng xác định và nghiên cứu đối tượng mục tiêu của bạn để tìm hiểu và hiểu hành vi, sở thích và mối quan tâm của họ. Điều này là để đảm bảo các chiến lược tiếp thị được áp dụng mang lại kết quả tối đa có thể và để giữ cho doanh nghiệp của bạn luôn theo sát các bước phát triển.
“Nội dung trùng lặp”
Vấn đề này được đề cập rộng rãi bởi Trung tâm học SEO Moz. Tôi chỉ muốn chỉ ra ở đây rằng nội dung trùng lặp có thể do nhiều lý do khác nhau, chẳng hạn như:
- Các biến thể ngôn ngữ (ví dụ: ngôn ngữ tiếng Anh ở Vương quốc Anh, Hoa Kỳ hoặc Canada). Nếu bạn có một số phiên bản của cùng một trang được nhắm mục tiêu đến các quốc gia khác nhau, một số trang này có thể không được lập chỉ mục.
- Nội dung trùng lặp được sử dụng bởi đối thủ cạnh tranh của bạn. Điều này thường xảy ra trong ngành thương mại điện tử khi một số trang web sử dụng cùng một mô tả sản phẩm do nhà sản xuất cung cấp.
Bên cạnh việc sử dụng rel = canonical, chuyển hướng 301 hoặc tạo nội dung độc đáo, tôi sẽ tập trung vào việc cung cấp giá trị duy nhất cho người dùng. Fast-growing-trees.com sẽ là một ví dụ. Thay vì mô tả nhàm chán và các mẹo về trồng và tưới nước, trang web cho phép bạn xem Câu hỏi thường gặp chi tiết về nhiều sản phẩm.
Ngoài ra, bạn có thể dễ dàng so sánh giữa các sản phẩm tương tự.
Đối với nhiều sản phẩm, nó cung cấp Câu hỏi thường gặp. Ngoài ra, mọi khách hàng có thể đặt câu hỏi chi tiết về một loại cây và nhận được câu trả lời từ cộng đồng.
Cách kiểm tra mức độ phù hợp chỉ mục của trang web của bạn
Bạn có thể dễ dàng kiểm tra xem có bao nhiêu trang trong trang web của mình không được lập chỉ mục bằng cách mở báo cáo Trạng thái lập chỉ mục trong Google Search Console.
Điều đầu tiên bạn nên xem ở đây là số lượng trang bị loại trừ. Sau đó, cố gắng tìm một mẫu - những loại trang nào không được lập chỉ mục?
Nếu bạn sở hữu một cửa hàng thương mại điện tử, hầu hết bạn sẽ thấy các trang sản phẩm chưa được lập chỉ mục. Mặc dù đây luôn phải là một dấu hiệu cảnh báo, nhưng bạn không thể mong đợi tất cả các trang sản phẩm của mình được lập chỉ mục, đặc biệt là với một trang web lớn. Ví dụ: một cửa hàng thương mại điện tử lớn nhất định có các trang trùng lặp và các sản phẩm hết hạn hoặc hết hàng. Các trang này có thể thiếu chất lượng để đặt chúng ở đầu hàng đợi lập chỉ mục của Google (và đó là nếu Google quyết định thu thập dữ liệu các trang này ngay từ đầu).
Ngoài ra, các trang web thương mại điện tử lớn có xu hướng gặp vấn đề với ngân sách thu thập thông tin . Tôi đã thấy các trường hợp cửa hàng thương mại điện tử có hơn một triệu sản phẩm trong khi 90% trong số đó được phân loại là “Đã khám phá - hiện chưa được lập chỉ mục”. Nhưng nếu bạn thấy rằng các trang quan trọng đang bị loại khỏi chỉ mục của Google, bạn nên quan tâm sâu sắc.
Cách tăng xác suất Google sẽ lập chỉ mục các trang của bạn
Mỗi trang web đều khác nhau và có thể bị các vấn đề lập chỉ mục khác nhau. Tuy nhiên, đây là một số phương pháp hay nhất sẽ giúp các trang của bạn được lập chỉ mục:
Tránh các tín hiệu "Soft 404"
Đảm bảo rằng các trang của bạn không chứa bất kỳ thứ gì có thể biểu thị sai trạng thái soft 404. Điều này bao gồm bất kỳ điều gì từ việc sử dụng "Không tìm thấy" hoặc "Không có sẵn" trong bản sao cho đến việc có số "404" trong URL
Sử dụng liên kết nội bộ
Liên kết nội bộ là một trong những tín hiệu chính cho Google rằng một trang nhất định là một phần quan trọng của trang web và xứng đáng được lập chỉ mục. Không để lại các trang mồ côi trong cấu trúc trang web của bạn và nhớ đưa tất cả các trang có thể lập chỉ mục vào sơ đồ trang web của bạn
Thực hiện chiến lược thu thập thông tin hợp lý
Đừng để Google thu thập thông tin trên trang web của bạn. Nếu quá nhiều tài nguyên được sử dụng để thu thập thông tin các phần ít có giá trị hơn trong miền của bạn, thì có thể mất quá nhiều thời gian để Google có được nội dung tốt. Phân tích nhật ký máy chủ có thể cung cấp cho bạn bức tranh đầy đủ về những gì Googlebot thu thập dữ liệu và cách tối ưu hóa nó
Loại bỏ nội dung chất lượng thấp và trùng lặp
Mọi trang web lớn cuối cùng đều có một số trang không nên được lập chỉ mục. Đảm bảo rằng các trang này không tìm thấy đường vào sơ đồ trang web của bạn và sử dụng thẻ noindex và tệp robots.txt khi thích hợp. Nếu bạn để Google dành quá nhiều thời gian cho những phần tồi tệ nhất trên trang web của mình, nó có thể đánh giá thấp chất lượng tổng thể của miền của bạn.
Gửi tín hiệu SEO nhất quán.
Một ví dụ phổ biến của việc gửi các tín hiệu SEO không nhất quán đến Google là thay đổi các thẻ chuẩn bằng JavaScript. Như Martin Splitt của Google đã đề cập trong Giờ văn phòng SEO JavaScript, bạn không bao giờ có thể chắc chắn Google sẽ làm gì nếu bạn có một thẻ chuẩn trong HTML nguồn và một thẻ khác sau khi hiển thị JavaScript.
Và nếu bạn vẫn đang gặp các vấn đề về lập chỉ mục website, đừng ngần ngại liên hệ ngay cho chúng tôi để nhận được sự tư vấn.
Đọc thêm các bài viết hữu ích về truyền thông, xây dựng thương hiệu
Cập nhật tin tức, ưu đãi từ chúng tôi
Nhận tin sớm nhất qua email