سؤال: لا يمكنني الحصول على الكثير من ملفات PDF الخاصة بي مفهرسة على صفحات المنتج الخاص بي. هل يجب علي إضافة المحتوى في علامة تبويب المنتج الخاص بي أيضًا ، بحيث يكون في كلا المكانين؟ هل سيؤدي ذلك إلى حدوث مشكلات في التكرار وأي فكرة عن سبب عدم فهرستها؟
جون مولر : بشكل عام نقوم بفهرسة ملفات PDF مثلما نود الصفحات العادية الأخرى على موقع الويب. ما سيحدث على الأرجح مع ملفات PDF هو أننا لا نقوم بتحديثها كثيرًا بنفس سرعة صفحات HTML العادية لأننا نفترض أن ملفات PDF تظل مستقرة. لكن هذا لا يبدو أنه مشكلتك. فيما يتعلق بفهرسة ملفات PDF ، إذا رأينا روابط لهذه الصفحات ، فسنحاول فهرسة تلك الصفحات لإدراجها في نتائج البحث.
جون مولر : إذا لم نتمكن من فهرسة هذه الصفحات ، فإما أننا نواجه مشكلة في العثور على الروابط لملفات PDF هذه ، والتي قد تكون بسبب صعوبة العثور عليها على موقع الويب أو ربما لم تكن بتنسيق HTML ثابت أو لديهم رابط nofollow أو شيء من هذا القبيل. أو ربما نقول أننا لدينا محتوى كافٍ مفهرس من موقع الويب الخاص بك بالفعل.
لسنا مستعدين بعد لإضافة مجموعة كبيرة من المزيد من المحتوى. لذلك لا يمكننا ضمان قيامنا بفهرسة كل المحتوى الموجود على موقع الويب مما يعني أنه بالنسبة لبعض مواقع الويب ، في بعض الحالات ، قد يكون لدينا قطع ونقول أننا قمنا بالفعل بفهرسة الكثير من المحتوى من هذا الموقع.
سنستمر في الزحف إلى المزيد من المحتوى من موقع الويب هذا ، وإذا وجدنا شيئًا مقنعًا حقًا ، فسنقوم بتضمينه في الفهرس أيضًا. ربما تكون ملفات PDF هذه عبارة عن محتوى اطلعنا عليه أو محتوى لم يتح لنا الوقت لإلقاء نظرة عليه من موقع الويب.
جون مولر : إذا كان هناك محتوى مهم في ملفات PDF تلك تحتاج إلى فهرسته ، فقد يكون من المفيد تضمينه في صفحة المنتج مباشرة. بهذه الطريقة لا يتعين على الأشخاص تنزيل ملف PDF بالفعل لمشاهدة هذا المحتوى. لذلك إذا كان الأمر مهمًا ، فربما يمكنك وضعه مباشرة على الصفحة. إذا كان محتوى إضافيًا ، مثل المواد المرجعية التي قد يرغب الأشخاص في الاطلاع عليها ولكن لا يحتاجون إلى التصنيف بشكل منفصل ، فربما يكون من الجيد مجرد الارتباط من صفحات المنتج.
الأسئلة الشائعة حول فهرسة ملفات PDF
هذه ليست المرة الأولى التي تظهر فيها مشكلة فهرسة ملفات PDF. في مدونة Webmaster Central Blog Post في سبتمبر 2011 ، أجاب Gary Illyes من Google على بعض الأسئلة حول فهرسة PDF ، والتي سنلخصها أدناه:
بشكل عام ، نعم ، تقوم Google بالزحف إلى ملفات PDF ما لم تكن محمية بكلمة مرور أو مشفرة. إذا تم تضمين النص كصور ، فقد تقوم Google بمعالجة هذه الصور لاستخراج النص. القاعدة العامة هي أنه إذا كان بإمكانك نسخ / لصق نص من مستند PDF ، فيجب أن يكون Google قادرًا على البحث في محتوى pdf وفهرسة المحتوى.
الصور الموجودة في ملفات PDF غير مفهرسة (كما في 2011).
يمكن أن يتم تصنيف ملفات PDF بشكل مشابه لصفحات الويب.
نعم. إذا كنت بحاجة إلى تقديم كلا النسختين ، فعليك تحديد نسخة مطابقة من نسخة إلى أخرى .
كيفية البحث عن ملفات PDF في جوجل
استخدم عامل تشغيل نوع الملف للبحث عن ملفات PDF
إذا كنت ترغب في البحث عن ملفات PDF في Google ، فيمكنك استخدام عامل التشغيل “filetype:”.
للبحث في ملفات PDF عن مصطلح البحث “SEO PDF” اكتب ما يلي:
filetype:pdf SEO PDF
- ثم اضغط على “بحث Google”.
تعرض صفحة نتائج SERP ملف PDF بخط مرتفع إلى يسار كل نتيجة
يمكن أن تظهر ملفات PDF في القصاصات المميزة
في 17 كانون الثاني (يناير) 2019 ، أفاد Kevin Indig على Twitter أن Google تسحب الآن مقتطفات مميزة من ملفات PDF.
لقد جربت المثال المذكور ، وما زال يعمل حتى 26 يناير. يمكنك مشاهدة لقطة الشاشة أدناه:
يمكنك أن تراهن بحياتك على أن العديد من المتخصصين في تحسين محركات البحث سيعملون الآن على تحسين ملفات PDF الخاصة بهم لمحركات البحث.
أنواع الملفات الأخرى القابلة للفهرسة بواسطة Google
تعد ملفات PDF واحدة فقط من عدد كبير من أنواع الملفات التي يمكن فهرستها بواسطة Google.
يمكن لـ Google فهرسة محتوى معظم أنواع الصفحات والملفات ، بما في ذلك Adobe Flash ومستندات Microsoft مثل Excel و Docs و Rich Text Format ومستندات OpenOffice و PowerPoint ولغات البرمجة المختلفة.