Wat doen jullie met vervallen producten?

xipe

Nieuw lid
31 mrt 2008
650
0
16
#1
Hoi,

Hoe pakken jullie het aan met vervallen producten in een productfeed omgeving?
Ik begin elke dag met een schone lei en delete de bestaande items, maar dit geeft veel 404-issues, met name op de reissites.

Hartelijke groet,
xipe
 
25 jan 2008
3.028
0
0
wfsidee.nl
#2
Xipe: Ik begin elke dag met een schone lei en delete de bestaande items, maar dit geeft veel 404-issues, met name op de reissites.
Heel vaak een mission impossible.
Ik weet niet hoe jij in de basis er mee werkt, heb je virtuele pagina's zoals met het systeem PriceTapestry, of statische pagina's met het systeem Soflyy / All Import en vergelijkbaar ?
Punt is namelijk dat Google verwacht dat een niet bestaande pagina duidelijkheid geeft en dat is een 404 al niet.

Gekke is nl dat Google bij een 404 nog aanneemt dat de pagina kán terugkomen binnen afzienbare tijd alleen weet niemand hoever je moet afzien. Want ze kunnen er in het WMT op aandringen dat je iets moet gaan doen, terwijl de pagina al lang en breed te boek staat als 404. En denk je : boek 'm dan af !
»» Ingeval van een never nooit niet meer terugkerende pagina past een 410 = 'gone'.

Maar wil je een klant een béétje sympathieke behandeling geven, dan zorg je voor een 404 vervangende pagina die er een beetje op lijkt , toch ? Geeft ook nog eens kansen op toch nog een verkoop.
Tja, in veel gevallen wordt het dan nog erger, want een niet bestaande pagina krijgt door die vervanger een 200 OK en wordt de euthanasie van die niet bestaande pagina bij Google verlengd van hier tot gunder.

Kernpunt is dus vooral, welke maatregelen of welke plugins heb je ingezet en wat doen ze exact. Geven ze alternatieven , moeten ze eerst op de gevraagde pagina een 410 afleveren, eer ze de klant doorsturen naar iets anders. Heb je een eigen systeem, is het makkelijker na te gaan. Bij Wordpress - achtigen zijn er zoveel varianten in plugins dat je er eigenlijk voor dóórgeleerd moet hebben.

Feit is dat ik al ruim 20 jaar leef met een paradijs aan 404 pagina's maar de 'ijzeren voorraad' is de laatste 5 jaar na enig peuteren errug geminimaliseerd. Helemaal op 0 is een fata morgana, inherent aan minder kwalitatieve datafeeds of erger.
 

jeroentja

Nieuw lid
26 jan 2008
255
0
0
#3
In mijn admin zie ik alle 404's voor mij komen en ik heb daarin een aantal opties:
- negeren
- negeren en in de toekomst ook negeren
- blokken (404 was een hack poging en ip gaat op de blacklist en toekomstige bezoekers die op die 404 komen gaan ook op de blacklist)
- 301 instellen (nieuwe pagina opgeven)

Mijn lijstje met 404's die op de site voorkomen staan gesorteerd op het aantal x dat een pagina is opgevraagd en een 404 gaf. Als een pagina meer dan 100x een 404 geeft is het moeite waard om een 301 in te stellen.

Sowieso zijn al mijn 404's anders. Er staan links naar het onderwerp in kwestie, zodat gebruikers relatief makkelijk door kunnen surfen op de site.
 

PJ

Nieuw lid
28 feb 2008
1.417
0
0
#4
jeroentja zei:
ik heb daarin een aantal opties
In principe een heel goede gedifferentieerde benadering, maar let je ook een beetje op de belasting van de server?

Als je server eindeloze rijen (en die ontstaan automatisch) af moet werken van ip's die worden geblokt en andere regels (die ook steeds specifieker en talrijker worden) moet toepassen voordat er een pagina wordt vertoond, dan gaat langzaam maar zeker de snelheid achteruit.

Het is verstandig om naast al die vangnetten ook een exit-strategie te hebben, anders blijf je maar ip's checken die al lang aan een ander zijn toegekend, 404's afvangen die al uit iedere index zijn verdwenen (zo ze daar ooit in stonden) en ga zo maar door.

Je moet dus zoeken naar een balans tussen wat je afvangt en wat je niet meer hoeft af te vangen, zodat je server niet een steeds langere lijst van regeltjes hoeft af te werken.
 

jeroentja

Nieuw lid
26 jan 2008
255
0
0
#5
In principe een heel goede gedifferentieerde benadering, maar let je ook een beetje op de belasting van de server?
Om eerlijk te zijn niet. Maar zie ook geen problemen op mijn (dedicated) server. Toch maar eens gekeken.

De 404_log tabel heeft 124236 rijen. Met een goede index is dit geen enkel probleem. De 404_ip_block wordt alleen geraadpleegd als er een 404 komt, anders niet. Deze website trekt 20K+ bezoekers per dag, en dit gaat prima. En er staan nog een 100tal ander kleinere sites op de server. Dus volgens mij zit er nog wel wat rek :)

Ik vind het zelf een handige oplossing!